Agents IA 05/08/2025 73 visualitzacions

Claude Opus 4.1: La intel·ligència artificial líder en programació amb un 74,5% d’eficiència i capacitat agentiva avançada

Claude Opus 4.1, la nova versió de la intel·ligència artificial d’Anthropic, ha assolit un 74,5% d’eficiència en proves de programació (SWE-bench Verified), posicionant-se com el model més avançat del mercat en codificació. Aquesta actualització millora la capacitat de raonament, la precisió en la recerca en profunditat i l’anàlisi de dades, destacant especialment en la gestió de detalls i en la cerca agentiva (capacitat de l’AI per actuar de manera autònoma per aconseguir objectius).

En comparació amb versions anteriors, Opus 4.1 mostra avenços rellevants en tasques complexes com la refactorització de múltiples arxius de codi, identificant i corregint errors específics sense introduir-ne de nous—això el converteix en una eina molt valorada per equips de desenvolupament que busquen precisió i eficiència. A més, el model supera competidors com Sonnet 4 i Gemini en velocitat, exactitud i rendiment en escenaris de programació reals.

Tot i aquest lideratge tecnològic, gairebé la meitat dels ingressos per API d’Anthropic (3.100 milions de dòlars) depenen només de dos clients principals, fet que representa un risc significatiu per a la sostenibilitat empresarial si algun d’aquests clients decideix abandonar el servei.

Font original: Veure article original