ChatGPT Agent d’OpenAI: Intel·ligència Artificial Autònoma amb Seguretat Avançada i Control Total per a Tasques Complexes


OpenAI ha desenvolupat **ChatGPT Agent**, un assistent d’intel·ligència artificial capaç de dur a terme tasques complexes de manera autònoma, com gestionar calendaris o crear presentacions, tot mantenint un alt nivell de **seguretat i privacitat**. El sistema ha estat sotmès a **110 atacs coordinats** i ha aplicat **7 correccions d’explotació** per aconseguir un **95% d’eficàcia en defensa** contra vulnerabilitats.

Entre les seves mesures de seguretat més destacades hi ha:

- **Resistència als atacs per injecció de prompts**, refusant més del 99% d’inputs maliciosos en escenaris de navegació i bloquejant continguts perjudicials com discursos d’odi o consells il·lícits.
- **Mode observació (Watch Mode)**, que pausa tasques delicades (com operacions bancàries) si detecta inactivitat de l’usuari, evitant que l’agent actuï sense supervisió.
- **Confirmació explícita de l’usuari** abans de realitzar accions importants, com enviament de formularis o compres; l’usuari pot interrompre, prendre el control o aturar tasques en qualsevol moment.
- **Privacitat reforçada**: l’agent mai aprèn contrasenyes ni accedeix a comptes sense permís explícit, i la memòria a llarg termini està deshabilitada per defecte.
- **Transparència**: l’agent narra en temps real tots els passos que fa (“Cercant articles... Llegint... Extraient...”) i demana aclariments si troba problemes, mantenint el control sempre en mans de l’usuari.

OpenAI recomana donar a l’agent només l’**accés mínim necessari** per a cada tasca i utilitzar-lo amb precaució, ja que el sistema és nou i pot cometre errors, especialment en funcions encara en fase beta com la creació de presentacions. Els desenvolupadors poden integrar aquestes salvaguardes mitjançant l’SDK i l’API, assegurant la seguretat i la transparència també en aplicacions personalitzades.

Font original: Veure article original