Publicada

Después de que Google definiera los límites de uso de Gemini desde su página de soporte, ahora el gigante tecnológico ha dotado a su IA del soporte a los archivos de audio.

Hoy mismo ya está disponible en Gemini la posibilidad de subir cualquier tipo de archivo entre los que se encuentran los de audio a través de la app para Android, iOS y en la web

Una importante mejora que cambia cómo podemos usar Gemini, ya que ahora los audios que grabemos de reuniones o eventos a los que asistamos podrán ser transcritos de una forma muy sencilla por el mejor modelo de IA.

A diferencia de la app de grabadora de Samsung, o la propia de HONOR en sus móviles, aquí podremos elegir el modelo de inteligencia artificial generativa que más nos interese.

Es una diferencia importante, ya que algunos de los modelos de IA que se usan para traducciones en los móviles utilizan los recursos locales y dejan de lado la posibilidad de usar una IA desde un servidor. Todo por salvaguardar la privacidad del usuario, pero reduciendo la calidad de la transcripción.

Un audio en Gemini

Lógicamente Gemini 2.5 Pro es el recomendado para que haga unas transcripciones perfectas del audio incluso si se escucha ruido de fondo. Incluso siendo audios de 15 minutos, en cuestión de unos segundos pasará la transcripción a texto.

Aunque Google ya ofrezca la posibilidad de subir cualquier tipo de archivo, el de audio ha sido uno de los más solicitados por los usuarios por la importancia que tienen.

Los límites a vídeo y código

Ahora será tan fácil como abrir Gemini en un navegador como Firefox y arrastrar archivos de audio como MP3, WAV y muchos más directamente a la ventana de prompts.

Pero hay algunas limitaciones, según recoge Google desde Android Authority en el nuevo documento de soporte que ha subido. Según podemos leer, los archivos que pueden subirse en un único prompt son de 10 minutos y hasta 10 a la vez.

Hay un detalle a tener muy en cuenta, sobre todo si se paga mensualmente por las suscripciones Google AI Pro y AI Ultra, ya que la longitud del audio pasa a las tres horas (2 GB como máximo).

Hay otro límite y tiene que ver con el resto de archivos admitidos y que no pueden pasar de los 100 MB. Google también incluye la posibilidad de añadir una carpeta de código o un repositorio de GitHub con un límite de 5.000 archivos y tamaño máximo de 100 MB.

Sobre los vídeos, se puede leer que se pueden subir de hasta 5 minutos de forma gratuita y al pasar por Pro o Ultra ya sí alcanzan la hora completa para ser una experiencia perfecta con Gemini.