La inteligencia artificial está cada vez más presente en todos los campos de la medicina.

La inteligencia artificial está cada vez más presente en todos los campos de la medicina.

Salud

Crean una IA que supera a los médicos más experimentados: tiene cuatro veces más aciertos en diagnósticos complejos

MAI-DxO, de Microsoft, acertó el 85% de los más de 300 casos clínicos publicados en The New England Journal of Medicine. Los médicos solo llegaron al 20%.

Más información: La IA revoluciona la medicina reproductiva: un software predice la probabilidad de éxito tras la vitrificación de óvulos

Publicada

A mediados de los 2000, los telespectadores de medio mundo se engancharon a las andanzas del Dr. House, un médico misántropo con una inteligencia superior que indagaba en los más raros síntomas de sus pacientes hasta encontrar el culpable de su enfermedad.

Trasunto médico del detective más famoso de todos los tiempos, Sherlock Holmes, su legendaria capacidad de deducción lograba solucionar los enigmas médicos más complicados, aquellos frente a los que el resto de colegas se habían dado por vencidos.

Microsoft acaba de anunciar una 'súper inteligencia artificial' que reduciría a House a la irrelevancia: haría su trabajo cuatro veces mejor y de forma más económica.

Hasta ahora, la IA había demostrado su valía identificando patrones. Por eso es sumamente útil —llegando a superar a muchos profesionales experimentados— a la hora de interpretar imágenes médicas.

Estas herramientas, que almacenan millones y millones de datos, también habían logrado puntuaciones casi perfectas en exámenes de evaluación reales, como el de acceso a la licencia médica en EEUU y el MIR español.

Pero estas pruebas, donde el aspirante tiene que seleccionar una de entre varias respuestas, se basan principalmente en la memorización.

El ejercicio médico real no tiene nada que ver con responder a una pregunta. Partiendo de unos síntomas, el galeno explora al paciente, pide diversas pruebas, consulta a otros especialistas y —días, semanas o meses después— llega a una conclusión.

La herramienta de Microsoft, MAI-DxO (de Microsoft AI Diagnostic Orchestrator), hace precisamente esto.

A finales del año pasado, la compañía fundada por Bill Gates lanzó un proyecto para crear una inteligencia artificial que aplicara un razonamiento diagnóstico secuencial.

Para testarla, acudieron a la decana de las revistas médicas, The New England Journal of Medicine, que tiene más de 200 años de historia.

Fundada por la Sociedad Médica de Massachusetts, la revista ofrece cada semana un "caso desafiante" procedente del registro de casos del Hospital General de Massachusetts.

Estos casos parten de una breve descripción del problema. Por ejemplo: "Un hombre de 61 años con insuficiencia respiratoria hipoxémica y shock 10 semanas después de un trasplante renal. Presentó un exantema purpúrico en el abdomen".

A partir de ahí, el autor de cada caso describe cada uno de los pasos que dio hasta llegar al diagnóstico.

Cinco médicos en una IA

Los investigadores de Microsoft AI tomaron 304 de estos casos, publicados entre 2017 y 2025, y pusieron a la IA a trabajar. Esta tenía tres opciones: hacer preguntas al paciente para profundizar en los detalles, pedirle una prueba u ofrecer un diagnóstico.

MAI-DxO funciona como un grupo de cinco médicos, cada uno encargado de una tarea: elaborar hipótesis, confrontarlas, pedir tests, calcular los costes y realizar un control de calidad.

Así, como si fuera el Dr. House, la IA va indagando en el problema del paciente, probando y eliminando hipótesis, hasta llegar a una conclusión lógica.

El resultado es que MAI-DxO, funcionando a plena capacidad, acertó el diagnóstico del 85,5% de los casos.

Compararon su rendimiento con el de un equipo de médicos experimentados. Estos acertaron solo en el 20% de los reportes. Es decir, la IA multiplicó por cuatro el rendimiento de los médicos.

Además, redujo un 20% el coste total de las pruebas solicitadas. No solo acertaba más sino que lo hacía por un precio menor.

He aquí lo interesante. Otros modelos de inteligencia artificial ya presentes en el mercado obtienen buenos resultados pero multiplicando los costes.

Por ejemplo, o3, desarrollado por OpenAI (los de ChatGPT), logra un 78,6% de eficacia a un coste medio de 7.850 dólares. MAI-DxO conseguía el 79,9% gastando solo 2.397 dólares.

Los autores hacen notar que, al contrario que otros modelos de IA, el suyo alcanza una alta precisión ajustando mucho el gasto. Es decir, pidiendo un mínimo de pruebas médicas.

"A medida que la demanda de atención sanitaria sigue creciendo, los costes aumentan a un ritmo insostenible y miles de millones de personas se enfrentan a múltiples barreras para tener una mejor salud, incluyendo diagnósticos poco precisos y que llegan con retraso", afirman Dominic King y Harsha Nori, dos de sus responsables, en el blog de Microsoft AI.

"Nuestros hallazgos sugieren que la IA reduce costes en salud innecesarios. El gasto en salud en EEUU se acerca al 20% del PIB, del que un 25% del total se estima que es superfluo, pues tiene poca influencia en los resultados en salud".

Médicos y expertos en IA se han manifestado maravillados por los logros conseguidos —que, de momento, no han sido revisados por expertos independientes— pero también apuntan las limitaciones de lo conseguido.

"Estoy una semana off-line para descansar y resulta que Microsoft intenta revolucionar la atención sanitaria con IA", comentaba con sorna en X Bertalan Meskó, médico, conferenciante y fundador del instituto de investigación en salud digital The Medical Futurist.

A pesar de alabar el modelo, Meskó apunta varios problemas en la prueba de fuego de MAI-DxO, algunos de ellos ya apuntado por los ingenieros de Microsot AI.

La principal limitación es que los médicos a los que se enfrentaba la IA no disponían de libros de consulta ni podían apoyarse en compañeros ni en búsquedas de internet.

Los responsables de Microsoft AI apuntan que de esta forma se buscaba "establecer una comparación justa con el rendimiento bruto humano".

Meskó también señala como problemas que el modelo solo se basa en casos completados y publicados, no prospectivos, por lo que todavía no ha tenido una prueba en vida real, y no se utilizó pacientes sanos (es decir, no se testó la máquina frente a posibles falsos positivos).

Sin embargo, el modelo presentado por Microsoft puede suponer un avance crucial a la hora de acelerar los tiempos y la precisión diagnóstica.

Mientras que en trastornos prevalentes como buena parte de los cánceres, la demora entre la primera sospecha y un diagnóstico sólido puede ser de dos o tres meses, en el caso de enfermedades raras se demora una media de cuatro años.

Mustafa Suleyman, CEO de Microsoft AI, ha declarado que MAI-DxO "es solo el primer paso de un viaje largo y excitante. Nos entusiasma seguir probando y aprendiendo con nuestros socios del sector salud para lograr una atención mejor y más accesible para todas las personas".