Hermes 4: Model d’Intel·ligència Artificial de Codi Obert amb Raonament Híbrid que Supera ChatGPT en Matemàtiques i Flexibilitat d’Ús


Hermes 4 és una nova família de models d’intel·ligència artificial de codi obert creada per Nous Research, destacada per superar ChatGPT en proves matemàtiques i oferir respostes sense censura i amb raonament híbrid.

Aquest model utilitza una arquitectura avançada Llama 3.1 i està disponible en diverses dimensions (14B, 70B, 405B paràmetres), cosa que en facilita l’accés i la modificació per part de la comunitat. El raonament híbrid permet que Hermes 4 resolgui problemes complexos pas a pas quan cal, però respongui ràpidament a preguntes senzilles, millorant la qualitat en matemàtiques, programació, ciència, lògica i creativitat.

Hermes 4 s'entrena amb tècniques innovadores: generació sintètica de dades en grafs, mostreig massiu de rebuig amb més de 1.000 verificadors especialitzats i un control precís de la longitud de les respostes per evitar explicacions excessivament llargues. A més, destaca per la seva alineació neutral i la facilitat amb què es pot adaptar a les necessitats de l’usuari, sense les restriccions habituals dels assistents comercials.

El model és completament transparent, amb els seus paràmetres oberts al públic, i demostra que és possible assolir un rendiment de primer nivell en IA mitjançant metodologies obertes i reproductibles, sense dependre de dades privades ni processos tancats.

Font original: Veure article original