ChatGPT Agent combina Operator y la investigación profunda para ejecutar acciones autónomas en su ordenador virtual

|

El nuevo ChatGPT Agent de OpenAI.

OpenAI ha presentado ChatGPT Agent, una nueva herramienta capaz de navegar por la web, razonar y ejecutar tareas usando su propio navegador virtual, de cara a gestionar todo tipo de solicitudes, desde consultar el calendario del usuario, hasta planificar y comprar ingredientes para una comida o crear presentaciones para entornos laborales.



Este nuevo agente se basa en las capacidades de herramientas anteriores de la compañía. Concretamente, combina el agente Operator para interactuar con sitios web, la investigación profunda del razonamiento web en múltiples pasos para sintetizar información y las habilidades del modelo conversacional de ChatGPT. Todo ello, en un mismo sistema unificado y autónomo.



De esta manera, ChatGPT Agent es la "evolución natural" de estas herramientas ya que, hasta ahora, Operator podía desplazarse, hacer clic y escribir en la web, mientras que la investigación en profundidad destacaba en el análisis y la síntesis de información. Sin embargo, actuaban por separado y no podían combinar sus capacidades.



Como resultado de esta unión, el nuevo agente dispone de lo mejor de ambas habilidades para encargarse de forma autónoma de tareas del día a día, como rellenar formularios 'online', realizar compras o cargar documentos, así como realizar investigaciones exhaustivas en varias páginas web.



Así lo ha trasladado la tecnológica dirigida por Sam Altman en un comunicado en su web, donde ha detallado que, este agente "es solo el comienzo" de la integración de capacidades autónomas directamente en el asistente ChatGPT. Por tanto, siguiendo las instrucciones de los usuarios, el nuevo agente de ChatGPT se encarga del trabajo por sí mismo para impulsar la productividad.



Por ejemplo, el nuevo agente podrá ejecutar acciones como consultar el calendario del usuario y preparar un resumen para sus próximas reuniones con clientes, analizar empresas competidoras y crear una presentación con la información recogida o, incluso, planificar y comprar los ingredientes para preparar un desayuno.



EJECUTAR ACCIONES DESDE SU PROPIO NAVEGADOR


OpenAI ha señalado que, para ello, ChatGPT integra un navegador visual que interactúa con la web mediante una interfaz gráfica de usuario, un navegador basado en texto para consultas web basadas en el razonamiento y acceso directo a la API.



Además, cualquier acción se realiza "desde el propio ordenador de ChatGPT", donde "el contexto relevante se comparte a lo largo de la tarea, independientemente de la combinación de herramientas utilizada", según ha explicado.



Para todo ello, utiliza un nuevo modelo, desarrollado específicamente para esta función, que aprende mientras realiza las tareas y optimiza el enfoque aprovechando las herramientas más eficaces para cada paso de la tarea, logrando "mayor velocidad, precisión y eficiencia".



A la hora de realizar cualquier tarea, OpenAI ha subrayado que ChatGPT Agent navegará por los sitios web de forma inteligente, filtrando resultados y consultando al usuario para iniciar sesión de forma segura. También ejecutará código y generará documentos "pulidos y editables", como presentaciones y hojas de cálculo que resuman las conclusiones.



MEDIDAS DE SEGURIDAD


Asimismo, aunque ChatGPT Agent actúa de forma autónoma, la tecnológica ha asegurado que solicita permiso antes de realizar cualquier acción importante y, además, los usuarios pueden interrumpir la tarea y tomar el control del navegador "en cualquier momento".



También contará con un modo observación para ciertas tareas fundamentales, en las que el usuario supervisará de forma activa y deberá aprobar cada paso. Igualmente, ChatGPT rechazará tareas de alto riesgo, como transacciones financieras o interacciones legales delicadas.



Siguiendo esta línea, OpenAI ha detallado que ha implementado medidas frente a "los riesgos que afectan especialmente a los sistemas autónomos", como la prevención de usos indebidos, con lo que el agente rechazará sistemáticamente solicitudes dañinas o ilegales. También podrá identificar intentos de terceros de manipular el comportamiento del agente mediante instrucciones maliciosas.



Para acceder a esta nueva herramienta, bastará con seleccionar el "modo agente" en el selector de herramientas de ChatGPT y, por el momento, ha comenzado a desplegarse en el Reino Unido para los usuarios de los planes Pro, Plus y Team. No obstante, la compañía está trabajando para extender su lanzamiento para España.



Con todo, OpenAI ha adelantado que continuarán incorporando mejoras importantes de forma periódica, para que este agente sea "cada vez más útil para más personas".




europapress