Tecnología

La anonimización de los datos de análisis puede revertirse para reidentificar a los individuos, según estudio

24 julio, 2019 13:34

MADRID, 24 (Portaltic/EP)

Las técnicas de anonimización de los datos no son suficientes para proteger los datos de los usuarios y evitar el rastreo hasta ellos, como señalan investigadores de la Universidad Católica de Lovaina (Bélgica) y de la Escuela Imperial de Londres (Reino Unido), que han mostrado la probabilidad de reidentificar a los individuos con precisión.

En un trabajo publicado en Nature Communications y recogido en la página de noticias de la Universidad Católica de Lovaina, los investigadores concluyen que los conjuntos de datos que han pasado por un proceso de anonimización pueden llegar a identificar a los individuos mediante aprendizaje automático.

Los investigadores se han propuesto mostrar "la probabilidad de que un individuo específico sea correctamente reidentificado puede estimarse con gran precisión incluso cuando el conjunto de datos anonimizado está muy incompleto".

Los datos de los usuarios que recopilan, por ejemplos, los gobiernos o los hospitales, se encuentran bajo la cobertura de los correspondientes reglamentos de protección de datos, como el RGPD de la Unión Europea, que exigen el empleo de técnicas como el muestro o la anonimización (mediante la desvinculación del nombre o la dirección, por ejemplo) de los mismos para poder ser tratados por terceros.

No obstante, y siguiendo un proceso de ingeniería inversa con aprendizaje automático, los investigadores han concluido que se puede reidentificar a un individuo a partir de los datos anonimizados y, además, de una forma muy precisa, incluso si los conjuntos de datos están incompletos.

Como recoge el estudio, en el modelo empleado, "el 99,98 por ciento de los americanos serían correctamente reidentificado en cualquier conjunto de datos usando 15 atributos demograficos", entre los que se incluyen la edad, el sexo o el estado civil.