DeepSeek V3.1: Model d’Intel·ligència Artificial de Codi Obert amb 685.000 Milions de Paràmetres, Raonament Avançat i Suport Multimodal Multilingüe
DeepSeek V3.1, desenvolupat per l’empresa xinesa DeepSeek, és un model d’intel·ligència artificial de codi obert amb 685.000 milions de paràmetres que marca un avenç significatiu en el camp de la IA i competeix directament amb líders com OpenAI i Anthropic.
Ofereix capacitats de raonament excepcionals, amb millores del 43% en tasques complexes respecte a la seva versió anterior, i pot resoldre problemes de matemàtiques, ciència i programació amb més precisió. La finestra de context de fins a 1 milió de tokens (128.000 paraules), molt superior a la majoria de models anteriors, li permet analitzar textos extensos, codis i documents legals sense perdre el fil del context.
El model és multilingüe i funciona amb més de 100 idiomes amb una competència gairebé nativa, especialment en llengües asiàtiques i minoritàries, afavorint així la comunicació global. A més, ha reduït la generació d’informació falsa (“hallucinations”) en un 38%, augmentant la fiabilitat de les respostes.
DeepSeek V3.1 integra tècniques avançades d’eficiència, com atenció i memòria optimitzades, i una arquitectura híbrida (MoE, Mixture of Experts) que equilibra el rendiment amb l’ús eficient dels recursos computacionals. També suporta funcions multimodals, podent entendre i generar text, codi i imatges, i està disponible gratuïtament a la plataforma Hugging Face.
Font original: Veure article original