El reciente anuncio en España de ChatGPT Health afianzó no solo la entrada de OpenAI al sector de la salud, sino la irrupción de la IA en los entornos médicos de hoy en día.
Google es consciente de ello y tras lanzar el año pasado su colección de modelos generativos de IA médica MedGemma, la gran G está actualizando varios de sus modelos con prestaciones únicas.
No solo se ha añadido un nuevo modelo médico abierto de voz a texto, MedASR, sino que se ha actualizado a MedGemma con un soporte mejorado para imágenes médicas, para adaptarse mejor a los entornos de salud.
Google actualiza sus modelos de IA médicos
La firma de Mountain View ha anunciado estos nuevos lanzamientos y actualizaciones guiándose en el feedback de la comunidad médica que ha adoptado estos modelos en sus consultas, investigaciones y hospitales.
La primera novedad reside en el lanzamiento de MedGemma 1.5 4B, una actualización del modelo principal que permite a los desarrolladores adaptar mejor a MedGemma en apps que involucran imágenes médicas.
Diagrama del flujo de uso previsto de MedGemma.
Concretamente, este modelo se convierte en una herramienta todavía más potente en imágenes médicas de alta dimensión —tomografía computarizada, resonancia magnética e histopatología—.
También lo hace con las imágenes médicas longitudinales —revisión de series temporales de radiografías de tórax— y la localización anatómica; localización de características anatómicas en radiografías de tórax.
Por último, también consigue una mejor comprensión de los documentos médicos, consistente en la extracción de datos estructurados de informes de laboratorio médico. Y no son sus únicas virtudes.
Google Research advierte que MedGemma 1.5 4B también es más preciso en sus funciones principales para texto, imágenes 2D y los historiales médicos, al menos respecto a su predecesor.
Colección MedGemma.
Por otro lado, el tamaño del modelo ha sido actualizado, haciéndolo lo suficientemente pequeño como para poder ejecutarlo sin conexión. Si se requieren aplicaciones de texto más complejas, existe el modelo MedGemma 1 27B.
Citando pruebas de parámetros internos, Google promete una mejor precisión en múltiples áreas médicas, como la localización anatómica, las imágenes médicas longitudinales o la extracción de informes de laboratorio.
Junto a esta nueva versión, Google ha dado a conocer MedASR, un nuevo modelo abierto de reconocimiento automático de voz (ASR) optimizado enteramente para el dictado médico.
El objetivo de este modelo ASR, en su versión inicial, es permitir a los desarrolladores convertir el habla médica a texto. Además, se integra con MedGemma en tareas de razonamiento avanzado.
Usos de MedASR de Google.
MedASR responde a la necesidad de realizar comunicaciones verbales en las consultas médicas, ya sea con dictados médicos o conversaciones entre pacientes y profesionales de la salud.
Este modelo transcribe el habla del dominio médico. Se puede usar para generar indicaciones naturales para MedGemma o para transcribir dictados médicos con una precisión muy superior a los modelos ASR generalistas.
Por si fuera poco, Google ha apostado por la accesibilidad. MedGemma 1.5, MedASR y los modelos HAI-DEF son gratuitos tanto para investigaciones y usos comerciales; se pueden descargar desde Hugging Face.
Google ha permitido a los usuarios acceder a todas las variantes de MedGemma a través de Hugging Face o Vertex AI de Google Cloud; lo mismo ocurre con MedASR, disponible en ambas plataformas.
Rendimiento de MedGemma 1.5 4B.
Además, la empresa recuerda que tienen un repositorio de MedGemma en GitHub para explorar colecciones completas de tutoriales para sacarle todo el partido a todas estas soluciones de IA.
