Publicada

Una de las grandes promesas de la inteligencia artificial en España es que esta cambiará la forma en que muchos usuarios interactúan con el smartphone para ciertas tareas.

Es algo que ya se está dando gracias a algunas plataformas y servicios, como ChatGPT y, en mayor medida, Gemini, la IA de Google que ha sustituido por completo a Google Assistant.

Sin embargo, existen muchos tipos de inteligencia artificial, y cada una con objetivos muy distintos. Grok es otra de las competidoras presentes en el mercado, y forma parte de X, la red social de Elon Musk, antes conocida como Twitter.

Esta llegó a España el pasado 2024 con una aparente falta de censura que atrajo a algunos usuarios a su uso y con un rendimiento que ha ido mejorando con el paso del tiempo.

La versión actual es Grok 3, que fue lanzada el pasado mes de febrero, e introdujo un enorme aumento de potencia computacional y otras novedades, como dos nuevos modos para resolver problemas complejos y hacer búsquedas en profundidad.

Ahora, Grok se ha actualizado para ofrecer una nueva función llamada Grok Vision, que ya está disponible para los usuarios, aunque aún no han llegado a los países miembros de la Unión Europea debido a las restricciones regulatorias de la privacidad.

Este modo, básicamente cuenta con la capacidad de utilizar el micrófono y la cámara del móvil desde la propia interfaz de Grok para ver y escuchar lo que rodea al usuario y contestar sus dudas o comandos.

Es capaz de identificar objetos y lugares, así como leer y traducir texto o analizar lo que está sucediendo. Por ejemplo, sería posible utilizar Grok para apuntar con la cámara a un problema de matemáticas y pedirle que lo resuelva, o bien para mostrarle un coche y preguntarle el modelo en concreto que es.

El propio Elon Musk ha reposteado un vídeo en el que un usuario muestra cómo utiliza esta inteligencia artificial para preguntarle sobre unas plantas que tiene frente a él y que le diga de qué especie son.

Este es solo un ejemplo de uso de esta funcionalidad, pero lo cierto es que se puede emplear para una gran cantidad de tareas cotidianas, sustituyendo muchas veces a una búsqueda en Internet.

Es una función calcada a otras que ya hemos visto, como Gemini Live, que está presente en los móviles Android y que permite hacer exactamente lo mismo.

La diferencia aquí es que la alternativa de X cuenta con flujo de vídeo continuo, por lo que se puede hablar con la inteligencia artificial, mientras que la cámara del móvil está encendida e incluso obtener la respuesta también.