Cuando la pandemia de la COVID-19 se empezó a cebar con Estados Unidos (Nueva York, para ser más exacto), había ya publicados unos 20.000 papers científicos sobre el tema. Una semana más tarde eran 50.000. Ahora mismo, la cifra supera los 70.000 documentos y creciendo.

Una cantidad ingente de información (la calidad ya es otro tema objeto de debate) que hace inviable que nadie pueda absorberla apropiadamente. «La comunidad científica no puede consultar todas estas publicaciones ni en todas sus vidas», reconoce Paul McLachlan, ejecutivo de Ericsson y líder del proyecto de la Casa Blanca COVID-19 Open Research Dataset Challenge.

Lo que esta iniciativa (que une a empresas, académicos y universidades) pretende es utilizar la inteligencia artificial para buscar respuestas a esta enfermedad entre toda esa vorágine de datos. 

Para ello, se usan modelos de recuperación de información que entienden las etiquetas de cada paper y si contesta o no a la necesidad del científico en cuestión. Luego, resume los datos clave y los hace visualmente accesibles para el lector.

Los impulsores del proyecto ya han hecho una primera entrega del sistema a la Casa Blanca, que está siendo usada de forma masiva.