DeepSeek: Revolució en Intel·ligència Artificial de Codi Obert, Eficiència i Model Lingüístic Disruptiu contra els Líders Tecnològics Occidentals
A Bengaluru, Àdithya Kolavi va sentir una barreja d’entusiasme i validació quan va veure com DeepSeek llançava el seu model lingüístic disruptiu a principis d’aquest any. Aquesta empresa xinesa de tecnologia va demostrar un rendiment que podia rivalitzar amb els millors models occidentals en proves estàndard, tot i que el seu model havia estat desenvolupat amb molt menys capital i en molt menys temps.
DeepSeek-R1, el model d’intel·ligència artificial de DeepSeek, va destacar per igualar o superar models com el de l’OpenAI o1 en tasques de matemàtiques i programació, tot i haver estat entrenat utilitzant molts menys recursos informàtics i amb un cost aproximat un 96% inferior, segons l’empresa. Aquesta eficiència s’ha aconseguit gràcies a tècniques avançades d’aprenentatge per reforç, on el model aprèn per assaig i error, millorant gradualment les seves respostes fins a assolir un nivell molt alt de raonament i comprensió.
L’aparició de DeepSeek ha sacsejat el mercat tecnològic, posant pressió sobre grans empreses occidentals i provocant una reevaluació dels costos i inversions necessàries per desenvolupar intel·ligència artificial de primer nivell. A més, el model és de codi obert, cosa que facilita la seva difusió i contribueix a una evolució més col·laborativa i descentralitzada de la tecnologia d’IA.
En resum, DeepSeek representa una revolució en la manera de construir models d’intel·ligència artificial, amb eficiència, rapidesa i accés obert, desafiant el domini tradicional de les grans corporacions occidentals.
Font original: Veure article original