Realitat Virtual 04/08/2025 57 visualitzacions

Limitacions en la reproducció de text a imatges generades per IA: comparativa entre Midjourney i nous models intel·ligents

Les proves inicials mostren que la capacitat de seguir el text i les instruccions a les imatges generades per la IA no és significativament millor que Midjourney, que és una de les eines comercials més populars per crear imatges amb intel·ligència artificial. Tant Midjourney com altres models similars excel·leixen en creativitat i qualitat visual, però sovint tenen dificultats per reproduir el text amb precisió dins les imatges, cosa que pot afectar la utilitat per a dissenyadors que necessiten tipografia clara i llegible. Això significa que, tot i els avenços constants en el camp, hi ha marge de millora pel que fa a la fidelitat a les instruccions textuals i la integració de text en les creacions d'IA.

Font original: Veure article original