Gemini 1.5

Gemini 1.5 Google

Noticias y novedades

Google pega un golpe en la mesa: anuncia Gemini 1.5 para dejar atrás a ChatGPT

Apenas unos días después de presentar su IA más avanzada, Google ha anunciado una nueva versión con rendimiento mejorado.

15 febrero, 2024 17:08

El lanzamiento de ChatGPT fue un jarro de agua fría para Google, que llevaba años invirtiendo en Inteligencia Artificial sólo para que OpenAI se le adelantase con un producto para el público general muy popular. Desde entonces, la gran G ha intentado ponerse a la altura, y un año después ya podemos decir que ha alcanzado a su rival con Google Gemini, al menos en algunos aspectos.

El desarrollo de la IA dentro de Google se ha acelerado a niveles nunca vistos, y como prueba, la presentación hoy de Gemini 1.5, una nueva versión sólo unos días después de poner Gemini 1.0 al alcance de todo el mundo. En estos días, incluso ha dado tiempo de que Gemini llegue a Android y en español, un ritmo de lanzamientos brutal que no habíamos visto ni en los mejores tiempos de Google.

Como el “.5” indica, esta nueva versión de Gemini no es una renovación completa de la IA generativa, pero sí que es una mejora sustancial en un aspecto fundamental: el rendimiento y la eficiencia. En otras palabras, hacer más en menos tiempo y por menor coste, lo que abre la puerta a otras mejoras como la cantidad de información que la IA es capaz de procesar a la vez y lo rápido que es posible entrenarla para diferentes tareas.

Gemini 1.5 ya está aquí

Google llega afirmar que Gemini 1.5 cuenta con una ventana de 1 millón de ‘tokens’ de manera consistente; por comparar, Gemini 1.0 Pro ‘sólo’ era capaz de procesar 32.000 tokens, y GPT4 Turbo, la última versión del modelo en el que está basado ChatGPT, puede procesar 128.000 tokens. Los tokens son bloques usados para procesar información, y pueden ser partes o subsecciones de palabras, imágenes, vídeos, sonido y código; cuanto mayor sea la ‘ventana’ de contexto, más información podrá obtener y procesar tras una petición del usuario.

Todo eso significa que la IA de Google es capaz de tomar más información de golpe, gracias a una nueva arquitectura basada en la técnica de ‘Mixture-of-experts’ (MoE), que permite seleccionar las partes más relevantes de su red neuronal dependiendo del tipo de dato introducido; y es que esta sigue siendo una IA multimodal, así que admite no sólo texto, sino también vídeo.

Rendimiento de Gemini 1.5 Pro comparado con su predecesor y sus rivales

Rendimiento de Gemini 1.5 Pro comparado con su predecesor y sus rivales Google

Todo esto supone que Gemini 1.5 Pro es capaz de procesar una hora de vídeo, 11 horas de audio, más de 30.000 líneas de código fuente, o más de 700.000 palabras sin problemas. Sin embargo, Google también confiesa que de manera estándar se usarán 128.000 tokens, y que sólo un grupo limitado de desarrolladores podrá probarlo con 1 millón de tokens en AI Studio y Vertex AI.

Procesar una mayor cantidad de información tiene una ventaja obvia en una IA generativa, ya que permite obtener un mayor contexto y presentar un resultado más consistente, relevante y útil para el usuario final. Esto puede ser lo que necesitaba Gemini para ponerse a la altura de ChatGPT y superarla, algo que notaremos en la app oficial de Android además de en apps y servicios que usen Gemini.

Te puede interesar