Andrew Ng i la revolució de la IA centrada en les dades: optimitzant la qualitat per transformar la indústria i la visió artificial


Andrew Ng, expert reconegut en intel·ligència artificial (IA), ha estat clau en el desenvolupament del deep learning i models massius com Google Brain. Actualment, centra els seus esforços en la seva empresa Landing AI, que ajuda indústries manufactureres a millorar la inspecció visual amb eines d’IA, i promou el que anomena el moviment de la “IA centrada en les dades”.

**Què és la IA centrada en les dades?**
Ng defensa que, després d’anys enfocant-se en crear models cada vegada més grans amb més dades (“big data”), el futur passa per optimitzar la qualitat de les dades (“good data”). En molts sectors, les grans quantitats de dades simplement no existeixen. Aquí, l’objectiu és perfeccionar i seleccionar acuradament un petit conjunt de dades rellevants i ben etiquetades per entrenar models d’IA eficients, precisos i menys esbiaixats. Per exemple, amb només 50 exemples molt ben triats es pot entrenar un sistema útil de detecció de defectes en una fàbrica.

**Models fonamentals i el repte del vídeo**
Els grans models com GPT-3 (processament de llenguatge natural) són exemples de “models fonamentals”: xarxes neuronals gegants entrenades amb grans quantitats de dades i després adaptades a aplicacions concretes. Ng creu que encara hi ha marge per expandir aquest paradigma a l’anàlisi de vídeo, però reconeix que el cost computacional és un límit important.

**Eines i processos per a la IA industrial**
A diferència del programari de consum (com cercadors o xarxes socials), on uns quants models poden servir milers de milions d’usuaris, a la indústria cada fàbrica necessita el seu propi model personalitzat. Landing AI crea eines perquè les empreses puguin gestionar i millorar les seves dades, etiquetar-les de manera coherent i adaptar els models als canvis, sense dependre contínuament d’experts externs.

**Altres aspectes clau**
- El moviment de la IA centrada en les dades inclou l’ús de dades sintètiques (dades generades artificialment) per solucionar mancances específiques.
- Millorar la qualitat de les dades pot ajudar a reduir els biaixos dels models.
- La capacitat d’analitzar, corregir i actualitzar ràpidament les dades i els models és essencial, especialment quan les condicions de producció canvien.

**Conclusió**
Ng preveu que el gran canvi en IA aquesta dècada serà passar del focus en la mida dels models i les dades, a posar el centre en la qualitat i enginyeria de les dades. Això obre la porta perquè més indústries puguin aprofitar la IA, fins i tot amb conjunts de dades petits, però ben gestionats.

Font original: Veure article original