GPT-4o d’OpenAI: Intel·ligència Artificial Multimodal amb Respostes Ràpides, Suport en 50 Idiomes i Capacitat Visual i Emocional avançada
GPT-4o és el nou model d’intel·ligència artificial d’OpenAI, dissenyat per millorar la interacció amb usuaris gràcies a la seva capacitat d’entendre i generar respostes en temps real tant per veu com per imatge. Pot interpretar informació visual i emocional, com ara resoldre problemes matemàtics escrits a mà o reconèixer l’estat d’ànim d’una persona a partir d’una fotografia. També destaca per l’ampli suport idiomàtic, ja que ha estat entrenat amb dades de fins a 50 llengües, cobrint pràcticament tota la població mundial, i la interfície de ChatGPT ja es pot trobar traduïda al català.
A més de gestionar converses més complexes, GPT-4o redueix la latència en respostes amb veu i millora la comprensió del context, cosa que el fa més eficient i natural en la comunicació. Aquest model representa un pas endavant respecte als seus predecessors, tant pel que fa a la fiabilitat i creativitat com per la capacitat d’afrontar instruccions matisades o tasques multimodals (combinació de text, veu i imatge).
Font original: Veure article original