Tecnologia d’Intel·ligència Artificial de Synthesia: Clons Digitals Multilingües amb Veus Personalitzades per a Vídeos Expressius i Escalables
L'empresa **Synthesia** ha desenvolupat una tecnologia d'intel·ligència artificial capaç de crear *clons digitals* de persones, combinant un avatar personalitzat amb una veu clonada que pot parlar en fins a 32 idiomes. El procés de clonació de veu és ràpid (menys de 15 minuts) i es pot fer tant gravant la pròpia veu com pujant un arxiu d'àudio; en tots els casos, cal donar consentiment explícit amb una frase generada pel sistema.
Aquests avatars digitals són cada cop més *expressius* i naturals, imitant la manera de parlar, entonació i accent de la persona original. La tecnologia permet que els avatars pronunciïn textos en idiomes que l’usuari no domina i fins i tot puguin adaptar el to i l’expressivitat per fer que els vídeos resultin més convincents. Encara que la qualitat de la veu generada és notable, alguns usuaris han trobat que el to pot ser robòtic i que no sempre es poden ajustar manualment detalls com el volum o la intensitat emocional.
Synthesia ja ha creat clons de figures públiques com David Beckham i Lionel Messi, i milers d’empreses han utilitzat la plataforma per produir milions de vídeos, especialment útils per presentacions, formació, publicitat i continguts educatius. Amb aquestes eines, les empreses poden localitzar i personalitzar vídeos fàcilment per a públics de diferents llengües i regions, mantenint una experiència visual i auditiva coherent.
Font original: Veure article original