Google y OpenAI como dos boxeadores en un ring Adobe Firefly El Androide Libre

Noticias y novedades

Google entra en ‘guerra’ con OpenAI: así es la nueva alternativa al impresionante ChatGPT de audio y vídeo

En el marco del Google I/O 2024 la compañía ha mostrado su nueva versión del asistente de voz, uno que está diseñado para vencer a ChatGPT.

15 mayo, 2024 02:26

Alvarez del Vayo @alvarezdelvayo

Los últimos días están siendo extremadamente movidos en el sector tecnológico. Si creíamos que 2023 había sido el año de la inteligencia artificial era porque no sabíamos lo que nos deparaba este 2024. Podíamos intuir algo, pero incluso dando por sentado que los avances serían grandes, pocos se imaginaban que antes de acabar la primera mitad de este año habríamos visto tantas novedades y tan importantes.

A la espera de lo que tenga que presentar Apple en la WWDC, todos los ojos estaban puestos en el Google I/O que se está celebrando en San Francisco esta semana. Pero OpenAI no acostumbra a dejar que sus rivales tengan el foco de la actualidad si ellos pueden evitarlo, y pocas horas antes anunciaron uno de los avances más impresionantes en inteligencia artificial desde la presentación oficial de ChatGPT.

[Qué es Google Gemini: las 8 claves que debes conocer sobre la inteligencia artificial que tendrás en tu móvil]

En una presentación de menos de 30 minutos la empresa no sólo anunció la nueva versión de su chatbot, ChatGPT 4o, sino una nueva forma de interacción multimodal que va mucho más allá de lo visto hasta ahora. Es imposible que no recuerde a la película de Spike Jonze ‘Her’. El impacto en el sector se ha dejado ver de forma clara, con multitud de analistas y profesionales alabando el nuevo producto de la empresa dirigida por Sam Altman. Se esperaba un buscador y la compañía ha lanzado un órdago a toda su competencia. Tanto es así que Google ha hecho un avance de lo que iba a presentar en su conferencia inaugural del Google I/O. Ha sido un breve vídeo grabado en la propia sede de Google en el que se ve cómo estaban listos para presentar un sistema muy parecido a lo que OpenAI acababa de anunciar.

Gemini es el futuro de Google

A finales del año pasado Google anunció Gemini, su nueva marca para todo lo relacionado con inteligencia artificial generativa. Incluso ha sustituido a Bard, el chatbot que Google lanzó para ser el rival de ChatGPT. Este producto ha ido cogiendo cada vez más importancia en la compañía de Sundar Pichai, llegando a sustituir al asistente de Google en sus móviles en algunos mercados. Ha sido el eje central de la conferencia inaugural del Google I/O.

Actualmente está integrado de una forma u otra no sólo en los nuevos Pixel, incluyendo el Pixel 8a, sino también en móviles de otras empresas, como los Galaxy S24 de Samsung. Esto demuestra lo relevante que es este producto para Google, una compañía que lleva ya ocho años diciendo que es una empresa enfocada hacia la inteligencia artificial pero que ha visto cómo un novato, OpenAI, le ha adelantado de forma inesperada.

Gemini Google I:O 2024 Google El Androide Libre

Sobre esta base, Google ha presentado sus novedades en el Google I/O para no perder el ritmo de presentaciones de sus competidores. Y lo ha hecho de una forma con la que sus rivales no pueden soñar: usando los datos de sus usuarios. Y eso lo puede cambiar todo. Por ejemplo, la app de Gemini es capaz de crear contenido, o entender lo que hay en el móvil, para responder en función de eso.

La nueva era de los datos

Los datos llevan siendo un elemento clave en las empresas desde hace ya muchos años, pero en la era de la inteligencia artificial eso alcanza un nuevo nivel. Google tiene aquí una ventaja gracias a los miles de millones de usuarios que ya utilizan sus servicios, desde el buscador a Gmail, pasando por Google Maps o Google Fotos.

This is Search in the Gemini era. #GoogleIO pic.twitter.com/JxldNjbqyn
— Google (@Google) May 14, 2024

Google ha anunciado algunas de las mejoras de esos servicios, integrando Gemini en ellos. Y lo está haciendo de manera multimodal y con un gran contexto, las dos claves de esta nueva generación de IA. Por ejemplo, en verano tendremos una nueva función en Google Fotos que permitirá realizar peticiones a la aplicación tan complejas como "enséñame cómo mi sobrino ha ido aprendiendo a nadar", y mostrará las fotografías cronológicas de mi sobrino relacionadas con mi petición. Otra de las demostraciones es sobre Gmail, en concreto sobre WorkSpace. Podremos pedirle un resumen de todos los correos de una persona, o que realice una búsqueda entre los miles de correos que tengamos almacenados. Otros ejemplos están relacionados con las compras realizadas y la gestión de una devolución, todo desde Gemini, algo posible al tener acceso a nuestros datos. Esta función empezará a desplegarse el mes que viene en algunos países.

Project Astra

Pero lo más impactante del evento ha sido Project Astra, un sistema de reconocimiento a través de vídeo en tiempo real que recuerda mucho a lo que ha presentado OpenAI hace unas horas. Para ello Google ha tenido que bajar la latencia al máximo, para lo cual ha creado Gemini Flash, una versión de su inteligencia artificial diseñada para ello.

Project Astra is a prototype from @GoogleDeepMind exploring how a universal AI agent can be truly helpful in everyday life. Watch our prototype in action in two parts, each captured in a single take, in real time ↓ #GoogleIO pic.twitter.com/uMEjIJpsjO
— Google (@Google) May 14, 2024

Por el momento Google no ha anunciado una fecha de lanzamiento, pero pretende integrarlo en la aplicación de Gemini a final de año. Esto podría cambiar la forma en la que usamos asistentes de voz, incluyendo el de Google, que se queda cada vez más obsoleto, pese a que Gemini aún hay cosas que no puede hacer, como ejecutar las rutinas relacionadas con los dispositivos domóticos.

Imagine 3 y Veo

Pero Google no pierde de vista el impacto que tuvo Dall-E y, sobre todo, Sora, el sistema de generación de vídeo de OpenAI que, aunque no está disponible para los usuarios, demostró lo que estaba por venir. En el Google I/O hemos asistido a la presentación de Veo, el sistema de generación de vídeo de Google, que va un paso más allá de Sora, priorizando no sólo la calidad, sino la coherencia entre fotogramas.

Introducing Veo: our most capable generative video model. 🎥

>It can create high-quality, 1080p clips that can go beyond 60 seconds.

From photorealism to surrealism and animation, it can tackle a range of cinematic styles. 🧵 #GoogleIO pic.twitter.com/6zEuYRAHpH
— Google DeepMind (@GoogleDeepMind) May 14, 2024

En los ejemplos que se han mostrado destaca por su aspecto cinematográfico, capaz de crear vídeos de resolución FHD con cierta longitud, de cerca de un minuto por toma. Además, se pueden usar efectos visuales, como filtros, partículas de humo... Pero lo mejor es que estos vídeo se pueden editar usando comandos de texto.

Junto a Veo han presentado Imagine 3, el nuevo motor de generación de imágenes, con una calidad que recuerda a Adobe Firefly por lo fotorrealista de los resultados. Además, le han dado importancia al texto, algo que a muchos motores de IA les cuesta crear. Ambos productos estarán disponibles en la sección de Labs de Google, anque no hay fecha para un despliegue masivo comercial.

Camino a la AGI

Todos los avances mostrados por Google son impresionantes, como la inteligencia artificial que logra predecir la estructura e interacción de todas las moléculas de la vida, y logran que la empresa se mantenga en la carrera por alcanzar la última meta, la AGI. La Artificial General Intelligence o Inteligencia Artificial General es lo que buscan desarrollar tanto Google como OpenAI, un sistema capaz de realizar múltiples acciones sin necesidad de ser entrenado para ello, capaz de aprender por sí mismo.

Esto aún está por crear, pero a la velocidad que vemos los desarrollos actuales no es una locura pensar que más pronto que tarde, una de estas dos empresas, probablemente, llegará a crear un producto así. Mientras tanto, Google y Open Ai seguirán liderando el desarrollo de productos con inteligencia artificial, y nosotros seremos los que le sacaremos partido.