Marta S.
Publicada

Google da un paso más en su oferta de inteligencia artificial. De su IA para revolucionar las búsquedas en internet, el gigante también está apostando en un futuro más a largo plazo con el entrenamiento de robots. Después de lanzar en marzo Gemini Robotics,su nuevo modelo de inteligencia artificial basado en Gemini 2.0. presenta ahora uno nuevo que se ejecuta directamente en el robot.

Google DeepMind, la división de investigación y desarrollo de inteligencia artificial ha anunciado un nuevo modelo VLA (visión, lenguaje y acción) bajo el nombre Gemini Robotics On-Device. Este modelo se basa en la comprensión multimodal del mundo que realiza Gemini para realizar tareas nuevas y dirigir a una máquina como puede ser un robot humanoide, siendo gestionado desde el propio robot.

En la versión anterior de Gemini Robotics las plataformas ejecutaban un sistema híbrido con un modelo pequeño en el robot y uno más grande en la nube. En este nuevo caso, no se requiere conexión a la nube, ofreciendo más libertad a la máquina para trabajar en entornos con mala conectividad.

Esta autonomía también supone mayor privacidad al no involucrar más sistemas a distancia donde se procesan los datos y pueden ser interceptados por terceros agentes. Eso sí, la propia compañía afirma que el nuevo modelo Gemini Robotics On-Device es solo un poco menos preciso que la versión híbrida.

La IA generativa de Google demuestra cada día sus capacidades para generar texto e imágenes según las peticiones de los usuarios. Esta tecnología resume correos o ayuda a analizar extensos documentos. Ahora se encargará de generar acciones que los robots pondrán en práctica.

Gemini Robotics On-Device Google DeepMind Omicrono

La robótica supone un reto para la inteligencia artificial. No solo implica entrenarse para realizar acciones como mover bloques, también debe responder a estímulos del entorno real y adaptar sus acciones a diferentes eventualidades.

El gigante de internet propone el uso de la IA generativa para acelerar el proceso de aprendizaje y evolución de las máquinas. Supondría una avance frente al enfoque tradicional que implica entrenar a los robots con aprendizaje de refuerzo más lento, además de independizar a la máquina de la nube.

El Reinforcement Learning o aprendizaje por refuerzo es una técnica en la que la máquina aprende a partir de su propia experiencia, interaccionando con el entorno. En esta metodología, por lo general, las máquinas cuentan con el apoyo del control remoto, donde un operario controla la máquina de forma manual para completar la tarea.

El uso de datos sintéticos por parte de Google para entrenar el cerebro de los robots permite abordar tareas consideradas como sencillas, que puede ser desde atar un zapato a doblar una camisa. Lo que para un humano es fácil, para un robot es un enorme reto todavía, como el manejo de ropa.

La idea es llevar a Gemini a un plano físico. Google DeepMind Omicrono

En cambio, ante tareas más complejas, "aún observamos que, en los comportamientos más complejos y diestros, necesitamos datos reales", afirma Carolina Parada directora de robótica en Google DeepMind en una entrevista con la revista ArsTechnica.

Cualquier persona interesada en probar Gemini Robotics en el dispositivo debe solicitar acceso al programa de probadores de confianza de Google. El modelo se ha lanzado con un SDK completo, esto supone que los desarrolladores podrán asignar nuevas tareas a los robots con Gemini y mostrarles nuevos entornos. Por parte de los desarrolladores de robots será necesario aplicar la seguridad. El equipo de Gemini sugiere conectar el sistema a la API estándar de Gemini Live, que incluye una capa de seguridad.