
Fotomontaje de Operator de OpenAI El Androide Libre
Adiós a rellenar formularios web con ChatGPT: OpenAI lanza Operator, un agente IA que realiza tareas web por ti
Se le puede decir adiós a algunas de las tareas más pesadas con lo nuevo de OpenAI que abraza la automatización a un nivel simplemente increíble.
Más información: Google deja a OpenAI en ridículo: su nueva IA para crear vídeos es impresionante y ya se puede empezar a usar
OpenAI aprovechó el lanzamiento del nuevo avance de sus modelos de lenguaje mayor con o3-mini para anunciar otra enorme novedad a la que ha denominado como Operator. Gracias al uso de Computer-Using Agent (CUA), Operator puede realizar tareas web por el usuario.
Con este anuncio OpenAI se adelanta de nuevo a Google con una nueva experiencia que va dirigida a los Agentes IA, una de las tendencias que será omnipresente en diversas compañías inteligentes a lo largo de este año y que es el siguiente paso en la carrera de la inteligencia artificial generativa.
Operator utiliza un nuevo modelo llamado Computer-Using Agente (CUA) que tiene la capacidad de manejar tareas con un denominador común: el uso de un formulario web. Es decir, que en una página web donde aparezcan distintos campos que han de ser rellenados por el usuario, Operator será capaz de lidiar con ellos de una forma bien sencilla.
Y aquí entran tareas web como la reserva de un billete de tren o la habitación de un hotel a realizar pedidos online como podrían ser las compras que se hacen en algunas de las tiendas online más conocidas; va en la línea de otras experiencias en las que ya están trabajando, por ejemplo, HONOR que, con el anuncio de Magic OS 9.0 citó que se podrían realizar pedidos online con una sola orden.
Operator se basa en la combinación de las capacidades de visión de GPT-4o, el razonamiento avanzado y herramientas para la navegación por la web. Es capaz de interactuar con las páginas web al hacer clic, teclear e incluso realizar scrolling; esas tareas a las que los usuarios ya están muy acostumbrados y que no dejan de ser bastante pesadas.
Demostración de Operator, el agente IA de OpenAI, los creadores de ChatGPT
Un importante punto es que para interactuar con Operator se hace con instrucciones simples para que vuelva al usuario para solicitarle la introducción de la contraseña o los detalles del pago; similar a la experiencia mencionada de la compañía china para que el usuario solamente tenga que introducir los detalles de su tarjeta después de que el Agente IA haga el resto.
Operator de OpenAI permite personalizar flujos de acciones para sitios web específicos al igual que permite guardar prompts para tareas frecuentes como sería hacer un pedido online a la cadena de restauración favorita o pedidos que se realicen de forma recurrente cada poco tiempo.

El Androide Libre
OpenAI también ha implementado una serie de medidas de seguridad para garantizar su uso seguro, ya que abre la ventana a un uso fraudulento de un agente que podría realizar todo tipo de acciones en las web. Se pueden leer todas las medidas desde la tarjeta de sistema publicada en su web y que es de vital importancia para que esta nueva experiencia tenga éxito.
Operator está disponible como un previo de investigación para los usuarios de Pro en Estados Unidos y el plan, tal como lo ha anunciado OpenAI desde su web, es expandir su acceso al igual que optimizarlo gracias al feedback de los usuarios e integrarlo próximamente en ChatGPT.