Los datos anónimos no existen, un algoritmo les puede poner nombre y apellidos

Campaña de información de la Policía Nacional para un uso seguro de Internet y las redes sociales. /Efe
Campaña de información de la Policía Nacional para un uso seguro de Internet y las redes sociales. / Efe

La Universidad Católica de Lovaina ha creado un proceso de anonimización que identifica a los individuos mediante aprendizaje automático

JOSÉ ANTONIO GONZÁLEZ

Esta semana, la Comisión Europea ha anunciado que va a proponer al Tribunal de Justicia de la Unión Europea (TJUE) que imponga a España una multa millonaria por no incorporar a su ordenamiento jurídico una directiva europea de protección de datos, que debería haberse traspuesto a la legislación española en mayo de 2018.

La importancia de los datos cobra, cada vez más, mayor importancia en el seno de la Unión y prueba de ello es el Reglamento General de Protección de Datos y las sanciones que se han impuesto a las empresas que han quebrantado la normativa comunitaria.

Sin embargo, la tecnología va más allá y la protección de la información de los usuarios en la red es complicada. Los datos anónimos «no son suficientes para proteger los datos de los usuarios y evitar el rastreo hasta ellos».

Esta es la conclusión de investigadores de la Universidad Católica de Lovaina (Bélgica) y de la Escuela Imperial de Londres (Reino Unido), que han mostrado la probabilidad de volver a identificar a los individuos con precisión.

En el trabajo, publicado en Nature Communications y recogido en la página de noticias de la Universidad Católica de Lovaina, los investigadores desvelan que los conjuntos de datos que han pasado por un proceso de anonimización pueden llegar a identificar a los individuos mediante aprendizaje automático.    

Los investigadores revelan que «puede estimarse con gran precisión incluso cuando el conjunto de datos anonimizado está muy incompleto».

Los datos de los usuarios que recopilan los gobiernos se encuentran bajo la cobertura de los correspondientes reglamentos de protección de datos, que exigen el empleo de técnicas como el muestro o la anonimización.

Sin embargo, los investigadores han concluido que se puede identificar a un individuo con su nombre y dirección a partir de los datos anonimizados e incluso si los conjuntos de datos están incompletos.

«El 99,98% de los americanos serían correctamente reidentificado en cualquier conjunto de datos usando 15 atributos demográficos, entre los que se incluyen la edad, el sexo o el estado civil», apuntan en el texto los investigadores de la Universidad Católica de Lovaina y de la Escuela Imperial de Londres.