La combinación de datos sintéticos con inteligencia artificial promete adelantar la salud digital del futuro.

La combinación de datos sintéticos con inteligencia artificial promete adelantar la salud digital del futuro.

Investigación

Datos sintéticos para curar cuerpos de carne y hueso: así es la revolución de la IA en salud

El proyecto europeo SEARCH desarrolla algoritmos inteligentes a partir de datos biomédicos, genómicos e imágenes reales anónimos para acelerar la investigación y la medicina personalizada.

Más información: Datos e inteligencia artificial: la oportunidad crucial que pide transparencia y gobernanza para triunfar

Barcelona
Publicada

Bajo las llamativas siglas de SEARCH se esconde un proyecto europeo -Synthetic hEalthcare dAta goveRnance Hub- que aspira a transformar la manera en que entendemos la salud digital en el Viejo Continente. La vía para lograrlo es combinar datos sintéticos e inteligencia artificial.

Así, el proyecto utilizará nuevos modelos para crear réplicas sintéticas realistas utilizando diversos tipos de datos de salud, como los que ofrecen los dispositivos médicos de uso personal, historias clínicas, secuencias de imágenes y datos genómicos.

“La disponibilidad de un gran volumen de datos médicos de calidad es esencial para avanzar en investigación. Además, para cumplir con las estrictas normativas europeas, estos datos deben ser anónimos y gozar de una máxima protección. El proyecto SEARCH da respuesta a todo ello, fabricando datos sintéticos absolutamente fiables”, explica a DISRUPTORES - EL ESPAÑOL Carla Álvarez, responsable de Programas Públicos de la Fundación TIC Salud Social,

Este organismo del gobierno de Cataluña es una de las dos entidades españolas que participa en el consorcio europeo de 26 organizaciones de 14 países, junto con el centro de investigación y desarrollo tecnológico Tecnalia, de Vizcaya. Todo ello bajo el paraguas de la iniciativa europea de salud innovadora (IHI JU).

Liderado por el Trinity College Dublin, a través del Trinity Translational Medicine Institute (TTMI), el proyecto en cuestión reúne a expertos en salud, ciencia de datos, ética y tecnología y está pensado para generar y compartir datos biomédicos y metodologías generalizables, que a su vez construirán y validarán datos sintéticos.

Plataforma federada e IA

La información sintética generada se utilizará para desarrollar herramientas basadas en IA, que darán soporte al diagnóstico, tratamiento personalizado y predicción de resultados de salud, mejorando la atención a los pacientes. Paralelamente, está previsto que el proyecto cree un marco para evaluar el anonimato y la credibilidad de los datos sintéticos, que facilitará el uso de esta información en contextos regulados y de evaluación de tecnología sanitaria.

“SEARCH utiliza modelos generativos profundos para crear datos sintéticos realistas, replicando el rendimiento de los datos del mundo real y manteniendo a la vez la privacidad de ellos”, comenta Álvarez, que apunta que el proyecto desarrollará también herramientas con IA de última generación, “que permitirán diagnósticos más rápidos y personalizados”.

Para acceder y compartir los datos sintéticos generados, SEARCH construirá una plataforma federada e interoperable, y segura y respetuosa con la privacidad. Los datos sintéticos y los modelos que las generen se pondrán a disposición de la comunidad investigadoras según los principios FAIR (localizables, accesibles, interoperables y reutilizables). Para Álvarez, “uno de los aspectos más importantes es que la plataforma federada permitirá el análisis descentralizado de datos sin la necesidad de moverlos de su procedencia. La privacidad está garantizada”.

Carla Álvarez, responsable de Programas Públicos de la Fundación TIC Salud Social,

Carla Álvarez, responsable de Programas Públicos de la Fundación TIC Salud Social,

La plataforma federada permitirá entrenar algoritmos de manera colaborativa, utilizando datos distribuidos en diferentes ubicaciones, sin compartir la información original. “Cada hospital mantendrá sus datos locales y solamente enviará los parámetros actualizados del modelo a un servidor central”, explica Álvarez.

Proceso impecable

Cada hospital o institución que participa en el proyecto subirá sus datos a su propio nodo local, donde se armonizarán automáticamente para que estén limpios y estandarizados. Del mismo modo, los modelos de IA se entrenarán directamente en cada nodo y se compartirán solo los resultados de los entrenamientos.

Los usuarios podrán buscar modelos y datos sintéticos disponibles a través de una interfaz web, y podrán solicitar acceso a datos específicos para entrenar sus propios modelos que, una vez finalizados, se guardarán en un catálogo accesible.

El proyecto llevará a cabo seis estudios de validación sobre las tres áreas en las que se centra SEARCH: enfermedades gastrointestinales, que incluyen cáncer, enfermedades inflamatorias crónicas y enfermedades raras del intestino; cardiovasculares, como la fibrilación auricular y el ictus; y ginecológicas, concretamente el cáncer de cuello uterino y el de ovario.

Los estudios de validación se llevarán a cabo en hospitales de Dinamarca, Suecia, Irlanda y España. En nuestro país será la Fundación Privada Hospital de la Santa Creu i Sant Pau de Barcelona la que desarrollará un modelo de diagnóstico avanzado para el ictus cardioembólico agudo.

La salud del futuro

El proyecto, que cuenta con un presupuesto inicial de más de 15,2 millones de euros, ha de permitir un intercambio significativo de datos a la vez que se preserva la privacidad de éstos, apoya la investigación de forma más eficiente y fomenta la colaboración intersectorial basada en la transparencia legal y ética. Según los líderes del proyecto, SEARCH es un paso fundamental hacia una transformación de la salud fiable y basada en datos en toda Europa.

“Este proyecto se centra en tres áreas patológicas concretas, pero será la base para estudiar más a fondo las enfermedades raras, pues generará grandes volúmenes de datos sintéticos, algo imposible de obtener hasta ahora por la escasa cantidad de pacientes que las padecen”, Álvarez.

El programa finalizará en septiembre del 2028 y para entonces estarán disponibles una plataforma federada e interoperable para el acceso seguro a datos sintéticos y el entrenamiento de modelos de IA; herramientas de código abierto para la generación y validación de datos sintéticos; conjuntos de datos validados y casos prácticos que demuestren su uso en el mundo real; y recomendaciones y directrices para el uso ético y responsable de datos sintéticos en la atención médica.