La guerra entre Gemini y ChatGPT acaba de ganar otro frente, la generación de vídeo con IA, y Google ha golpeado primero; a partir de ahora, su IA es capaz de generar vídeos a partir de cualquier imagen que le pase el usuario.
Todo, gracias a la integración de Veo 3 en Gemini. Recordemos que Veo 3 fue lanzado al público el pasado mes de mayo como una de las mejores alternativas para generar vídeo usando IA, y un competidor directo contra Sora de OpenAI.
Google dio un paso más, integrando Veo 3 directamente en el 'chatbot' de Gemini; en otras palabras, podemos crear vídeos simplemente interactuando con Gemini, y lo mejor de todo es que ahora es multimodal, y por lo tanto, también acepta fotos como 'prompts'.
En efecto, eso significa que podemos convertir nuestras fotos en vídeos, de manera rápida y sencilla y sin necesidad de hacer nada más que pasarle la imagen a Gemini para que haga su trabajo; esto tiene el potencial de ser revolucionario, aunque tiene sus limitaciones.
Para empezar, Veo 3 está limitado a clips de vídeo de 8 segundos de duración; por lo tanto, no podemos crear películas simplemente a partir de una imagen, aunque es de esperar que, con el paso del tiempo, esa sea una de las posibilidades de la IA.
Además, Veo 3 automáticamente recortará la imagen para crear el vídeo en un formato 16:9, el típico de un monitor o un televisor, pero que no encajará perfectamente con la pantalla de la mayoría de los smartphones modernos.
Esas son limitaciones que ya tenía el acceso público a Veo 3, así que tiene sentido que también las tenga en su integración con Gemini; de nuevo, es de esperar que en el futuro Google permita una mayor personalización, como por ejemplo, para crear vídeos verticales.
Además, Veo 3 tiene muchas ventajas respecto a otros modelos de generación de vídeo; por ejemplo, es uno de los pocos capaz de generar sonido, que es sincronizado de manera automática con el vídeo que genera para una experiencia más realista.
De la misma manera, Veo 3 ha sido elogiado por la calidad de sus creaciones, y eso es algo que debería notarse especialmente con esta función que permite usar nuestras fotografías; aunque como es habitual, los resultados pueden ser ridículos y con fallos.
Cómo crear vídeos a partir de una foto en Gemini
Para crear vídeos a partir de una foto en Gemini, lo único que tenemos que hacer es seleccionar "Vídeos" de la barra de herramientas y subir una foto que ya hayamos tomado; a continuación, debemos describir qué es lo que queremos que ocurra en el vídeo.
Tenemos la opción de indicar cómo será la escena y cómo queremos que sea el sonido. Cuando estemos conformes, Gemini generará el vídeo y lo podremos descargar y compartir como queramos.
La función de foto a vídeo de Gemini está empezando a llegar a los usuarios a partir del día de hoy, pero únicamente para los usuarios con las suscripciones Google AI Pro o Ultra, y sólo en "países seleccionados"; Google no ha aclarado si España se encuentra en la lista.
Los vídeos generados con Gemini tendrán una marca de agua con la palabra "Veo", además de una marca digital invisible SynthID, que debería evitar problemas de vídeos falsos generados por IA a partir de fotos, por ejemplo, de políticos o personalidades famosas.