Claude 4
La IA que superó a ChatGPT deja en ridículo ahora a Gemini de Google: así es Claude 4 con sus dos nuevos modelos
Anthropic ha presentado Claude Opus 4 y Claude Sonnet 4 para impulsar un nuevo estándar en codificación, razonamiento y agentes IA.
Más información: ChatGPT se actualiza para ser más potente y Google responde: el mejor modelo de IA actual pasa de "experimental" a "previo"
Google volvió al camino de la victoria en los modelos de IA con Gemini 2.5 Pro, pero ha sido sobrepasado desde hace un par de días con Claude Opus 4 y Claude Sonnet 4, los dos nuevos modelos de Anthropic que elevan el listón con nuevas metas alcanzadas.
Claude Opus 4 se convierte en el mejor modelo para codificación gracias a su enorme capacidad para gestionar tareas complejas y los flujos de trabajo de agentes IA. Mientras que Claude Sonnet 4 es una actualización significativa a Claude Sonnet 3.7, el último modelo que fue lanzado en febrero.
En Anthropic tienen motivos para la alegría, no solo por estos dos modelos, sino porque ahora incluye la posibilidad de usar el "pensamiento extendido" e incluso buscar en la web a la vez. Claude ahora puede usar una u otra para dar mejores respuestas.
Claude Opus 4 y Sonnet 4 son modelos híbridos que ofrecen tanto respuestas instantáneas como el pensamiento extendido para un razonamiento más complejo. Y el que se queda fuera de ser gratuito es el primero, así que Sonnet 4 ya está disponible en España, aunque de forma limitada como ha sido Sonnet según los tokens que se usen.
Claude Sonnet 4 mejora a Sonnet 3.7 en codificación con un 72,7 % en SWE-Bench. La clave del nuevo modelo está en su capacidad para balancear el rendimiento y la eficiencia para casos de uso externos e internos. No llega a la capacidad de Opus 4 en muchos de sus dominios, pero ofrece una gran experiencia en términos generales.
El rendimiento de ambos modelos de Anthropic
Claude Opus 4 se convierte en el modelo de mayor rendimiento hasta la fecha de Anthropic y el mejor modelo para programación al sobrepasar a Gemini 2.5 Pro, que sorprendió a propios y extraños con el gran paso dado por Google desde que lo desplegó. Las cifras de Opus 4 son del 72,5 % en SWE-Bench y Terminal-Bench del 43,2 %.
Una de sus mejores habilidades es en el rendimiento de tareas que lleven mucho tiempo y que requieren esfuerzo continuado y miles de pasos, y con el extra que significa que trabaje de forma continua durante muchas horas. En codificación se convierte en el modelo número uno actual, sobre todo en el entendimiento de bases de código complejas.
Hay más, y Anthropic también ha anunciado las nuevas capacidades de ambos modelos para usar herramientas en paralelo, seguir instrucciones de forma más precisa y dar acceso a los archivos locales para desarrolladores. De hecho, Claude Opus 4 solo estará disponible a través de la suscripción de Pro, Max, Team y Enterprise en España.
Hay dos detalles interesantes en las mejoras de los dos modelos: se ha reducido el comportamiento del uso de accesos directos o loopholes. Opus 4 ha mejorado drásticamente la capacidad de memoria al ser capaz de mantener los archivos de memoria a los que accede de forma local en el PC.
Resultados de ambos modelos en ingeniería de software
En resumen, y según mantiene Anthropic desde su anuncio en su web, Sonnet 4 trae un mejor rendimiento para las tareas diarias como una importante actualización desde Sonnet 3.7, y Opus 4 supera los límites en codificación, investigación, escritura y descubrimiento científico.
De esta forma, se sigue con la rueda en la que OpenAI, Google y Anthropic se van superando las unas a las otras cada vez que lanzan una actualización mayor a sus modelos de IA. Ahora queda la jugada de los creadores de ChatGPT que estarían cerca del anuncio de GPT-5.