OpenAI presenta gpt-oss: models d’IA de codi obert amb alta eficiència i rendiment per a dispositius locals


OpenAI ha presentat dos nous models d’intel·ligència artificial de codi obert, gpt-oss-120b (117.000 milions de paràmetres) i gpt-oss-20b (21.000 milions de paràmetres), que destaquen pel seu rendiment en raonament i tasques agentives, com la programació i l'ús d'eines digitals. Aquests models utilitzen l’arquitectura mixture-of-experts (MoE), activant només una part dels seus paràmetres per cada token, fet que optimitza el rendiment i redueix el consum de recursos. El model gran pot funcionar en una sola GPU H100, mentre que el petit s’adapta a dispositius amb només 16 GB de memòria, facilitant-ne l’ús local o en portàtils potents.

Amb la llicència Apache 2.0, qualsevol persona pot descarregar, modificar i utilitzar els models de manera lliure, sempre respectant la legislació i les polítiques d’ús responsable. Els models han estat avaluats en diverses proves de raonament i seguretat, i mostren resultats propers als millors models propietaris d’OpenAI en moltes tasques, tot i que el gpt-oss-20b queda una mica enrere en proves de coneixement especialitzat.

Pel que fa a seguretat, aquests models, un cop alliberats, poden ser modificats per tercers, cosa que implica que els usuaris i organitzacions hauran d’implementar proteccions addicionals per evitar usos maliciosos. Són especialment útils per desenvolupadors i empreses que requereixen desplegaments privats o locals d’IA, amb flexibilitat per adaptar la potència de raonament segons les necessitats i el cost.

Font original: Veure article original