Captura de un vídeo generado por Runway Gen 4.5 El Androide Libre
Ni ChatGPT ni Gemini: la mejor inteligencia artificial para crear vídeos ha dejado a las grandes en ridículo en las pruebas
El nuevo modelo de texto a vídeo de Runway ha conseguido superar a Veo 3 de Google y Sora de OpenAI en una importante prueba.
Más información: Cómo usar Sora, el modelo de generación de vídeos con IA de OpenAI, desde la web o la app
La llegada de la inteligencia artificial generativa ha revolucionado el sector tecnológico, y eso es algo notable con la llegada de nuevos rivales contra las compañías ya establecidas como Google.
Es algo que acaba de demostrar Runway, una startup que se hizo viral el año pasado, pero que acaba de dar todo un golpe sobre la mesa demostrando que su nuevo modelo es el mejor para generar vídeos con inteligencia artificial.
El nuevo modelo, llamado Gen 4.5, ha sido capaz de superar tanto a Veo 3 de Google como a Sora 2 Pro de OpenAI en una prueba independiente, Video Arena, que usa las respuestas de los usuarios que deben votar a ciegas los resultados generados por los diferentes modelos.
Es algo de lo que presumir, y eso es justo lo que está haciendo el CEO de Runway, el chileno Cristóbal Valenzuela, en una entrevista a CNBC; resalta que, con un equipo de apenas 100 personas, han conseguido superar a compañías de billones de dólares.
Runway fue fundada en el 2018 como una startup especializada en la investigación en IA y la creación de modelos de vídeo así como de "modelos de mundo", que son entrenados con vídeo y datos observacionales para reflejar cómo funcionan las físicas del mundo real.
Esa es la clave del éxito de Gen 4.5 de Runway, ya que los vídeos generados por el nuevo modelo destacan por una mejor comprensión de las físicas, los movimientos de las personas y de la cámara, y el concepto de "causa y efecto".
Como resultado, los vídeos de Gen 4.5 muestran sujetos con colisiones realistas entre ellos, así como personas con gestos y expresiones naturales; los objetos generados se mueven con un peso, impulso y fuerza realistas, mientras que los líquidos fluyen con la dinámica adecuada.
Además del realismo de las físicas, el nuevo modelo de Runway también mejora al captar el estilo fotorrealista, pero también es capaz de trabajar con distintos estilos, como animación tipo stop-motion o estética cinematográfica y estilizada.
Ejemplos de vídeos creados con Runway Gen 4.5 El Androide Libre
Runway afirma que los resultados de Gen 4.5 son tan fotorrealistas que pueden ser "indistinguibles del mundo real" por su detalle vivo y la precisión de las físicas.
Respecto a las versiones anteriores de Runway, el nuevo modelo sigue las instrucciones del usuario de manera más fiel, permitiendo crear escenas detalladas sin comprometer la calidad del vídeo, según el anuncio de la compañía.
Pese a todo, la compañía reconoce que el nuevo modelo aún tiene muchas limitaciones y, por ejemplo, sufre problemas con la permanencia de los objetos y el razonamiento casual; en otras palabras, algunas cosas pueden pasar antes que lo que las ha provocado, como una puerta abriéndose antes de que se use la manilla.
Gen 4.5 está siendo ofrecido a todos los usuarios de Runway de manera progresiva, y será la mejor opción porque mantiene la misma velocidad y eficiencia que los modelos anteriores de la compañía.