Realitat Virtual 25/07/2025 46 visualitzacions

Qwen3-235B-A22B-Thinking-2507: Model d’Intel·ligència Artificial Avançada d’Alibaba per a Raonament Complex i Processament de Textos Llargs

Qwen3-235B-A22B-Thinking-2507 és un model d’intel·ligència artificial de nova generació creat per Alibaba, especialment dissenyat per a tasques de raonament i pensament complex. Aquest model destaca per assolir rendiment líder entre els models oberts en proves de lògica, matemàtiques, ciència, programació i altres tasques acadèmiques exigents.

Té una arquitectura Mixture-of-Experts (barreja d’experts) amb **235 mil milions de paràmetres totals** i **22 mil milions d’activats**, cosa que permet un equilibri entre potència i eficiència computacional. També ofereix **suport natiu per a contextos molt llargs** (fins a 256.000 tokens), de manera que pot gestionar textos extensos i informació complexa sense perdre el fil.

Una característica clau és el seu “mode pensant”: el model genera sortides amb etiquetes `<think>`, que fan explícit el seu procés de raonament, facilitant la transparència i la comprensió de com arriba a les seves conclusions. Això el fa especialment útil per a aplicacions que requereixen justificació detallada de les respostes, com ara investigació científica, educació avançada o presa de decisions crítiques.

A més, incorpora millores generals en seguiment d’instruccions, ús d’eines i suport multilingüe, i ofereix guies de bones pràctiques i eines per al seu desplegament en entorns reals. Qwen3-235B-A22B-Thinking-2507 representa una aposta per models IA especialitzats, orientats a resoldre problemes d’anàlisi i raonament que requereixen nivell expert.

Font original: Veure article original