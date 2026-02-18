Tal es el "combate" en el que se encuentran compañías como Anthropic u OpenAI, que son capaces de responderse en minutos con nuevos modelos de IA. Ahora le toca el turno a Anthropic con el lanzamiento de Sonnet 4.6.

Este lanzamiento es muy importante para el usuario común que no pasa por el pago de una suscripción mensual, ya que se convierte en el modelo por defecto para usuarios gratuitos y los que pagan por el Pro.

Anthropic ha lanzado una nueva versión de su modelo intermedio, Sonnet, para seguir el ciclo de actualización de cuatro meses de la compañía.

Sonnet 4.6 destaca por mejoras en programación, seguimiento de instrucciones y uso del ordenador (controlar un PC tal y como lo haría una persona).

Hay varios importantes detalles para los usuarios que prefieren Claude frente a ChatGPT, ya que se amplía la ventana de contexto a 1 millón de tokens, dos veces el tamaño de la mayor lanzada anteriormente para Sonnet.

Sonnet 4.6 comparado al resto de modelos de IA más conocidos Anthropic

Cabe recordar que tras el anuncio de OpenAI del ChatGPT con publicidad, Anthropic amplió los límites de uso y la incorporación de los conectores para los usuarios gratuitos, así que no hay mejor momento que el de hoy para probar Claude.

De hecho, Anthropic describe la nueva ventana de contexto como "suficiente para contener bases de código completas, contratos extensos o docenas de artículos de investigación en una sola solicitud".

El lanzamiento de Sonnet 4.6 llega a las dos semanas del estreno de Opus 4.6, el modelo de IA más potente de Anthropic, y al poco es probable que se lance una versión actualizada del modelo Haiku.

Haiku es el modelo "rápido" de Anthropic como sería las versiones Flash de Gemini de Google.

Uso del ordenador con Sonnet 4.6 Anthropic

Sonnet 4.6 llega con un conjunto de puntuaciones récord en pruebas de rendimiento, incluyendo OS World para el uso del ordenador, y SWE-Bench para ingeniería de software.

Lo más impresionante de los resultados dados en distintas pruebas es para ARC-AGI-2 con un 60,4 %. Es un test dedicado a medir habilidades específicas de la inteligencia humana.

Aquí supera a la mayoría de los modelos comparables, aunque se queda por detrás de Opus 4.6, Gemini 3 Deep Think y una versión refinada de GPT 5.2.

Hay que poner de relieve un aspecto importante: Sonnet 4.6 es un modelo de respuesta directa y rápida, mientras que los tres mencionados se basan en una arquitectura de "razonamiento" y se toman su tiempo para responder.

En definitiva, un modelo con una relación rendimiento-coste extraordinaria y que iguala a Opus 4.6 en OfficeQA, una prueba que mide la capacidad para leer documentos como gráficos, PDFs o tablas.

Esta capacidad, sumada a la posibilidad de añadir conectores como Excel o Google Sheets, permite que en estas tareas rinda al máximo.