OpenAI llança GPT-OSS: models de llenguatge oberts, descarregables i personalitzables sota llicència Apache 2.0 amb arquitectura avançada Mixture-of-Experts


OpenAI ha publicat els models GPT-OSS, la seva primera família de grans models de llenguatge amb pesos oberts i sota una llicència Apache 2.0, cosa que permet descarregar-los, utilitzar-los lliurement, modificar-los i redistribuir-los sense restriccions comercials ni tècniques . Aquest avenç suposa un canvi respecte als models anteriors (com GPT-3 i GPT-4), que només eren accessibles a través d’API i amb codi tancat.

Els GPT-OSS (disponibles en versions de 20.000 i 120.000 milions de paràmetres) destaquen per la seva arquitectura moderna Mixture-of-Experts, que millora la capacitat de raonament i l’ús en agents autònoms, com ara fluxos de treball que requereixen seguiment d’instruccions, cerca web o execució de codi Python . Aquests models són només de text i es poden desplegar localment o en la infraestructura pròpia, fet que dona més control sobre la privacitat, els costos i la latència . Els usuaris poden adaptar els models a necessitats específiques, incloent el fine-tuning, tot i que OpenAI no ofereix aquesta funcionalitat directament a la seva API .

Encara que els pesos són oberts, algunes eines addicionals o infraestructures poden ser propietàries segons el proveïdor triat . Els models no estan integrats a l’API d’OpenAI ni a ChatGPT, sinó que s’han de desplegar i gestionar de manera independent . Plataformes com Databricks ja permeten fer-los servir de manera nativa, facilitant-ne la integració per a empreses i equips de desenvolupament .

En resum, GPT-OSS representa un pas important cap a la democratització dels models d’IA avançada, oferint potència, flexibilitat i control a la comunitat i a les organitzacions que volen implementar IA de manera personalitzada i segura.

Font original: Veure article original