Sunteți pe pagina 1din 10

Big Data Deidentification, Reidentification

and Anonymization
Big Data y el
manejo de Datos
• El uso de datos de gran tamaño
sólo es posible con la adecuada
difusión y anonimización de los datos
de acceso público.

De la población EEUU puede ser


87% identificado por su género, código
postal y fecha de nacimiento
Desidentificación, Reidentificación y
Anonimización
Desidentificación Reidentificación Anonimización
• Alteración de datos personales con el fin • Método para invertir la • Capacidad del responsable del
de establecer un uso alternativo de los desidentificación conectando la tratamiento para anonimizar los datos
datos personales, por lo que resulta casi identidad del interesado. de forma que sea imposible para nadie
imposible identificar al sujeto del que se establecer la identidad de los datos.
derivan los datos.
1. La Ley de Protección de Datos europea dice:
“Por "datos personales" se entenderá toda
información relativa a una persona física
identificada o identificable”

2. La Directiva 95/46/CE dice: “para anonimizar


cualquier dato, los datos deben ser despojados de
Leyes europeas y elementos suficientes para que el interesado ya no
estadounidenses pueda ser identificado”

3. El Departamento de Salud y Servicios Humanos


de los Estados Unidos establece estándares
específicos y estrictos para la desidentificación de
datos de salud cubiertos o información de salud
protegida (PHI, por sus siglas en inglés)
Métodos de seudonimización y
anonimización de datos

La seudonimización es el proceso Si se eliminaran todos los


de desidentificar conjuntos de elementos de identificación y se
datos reemplazando todos los dejara un identificador numérico
atributos de identificación que interno, la reidentificación sería
son particularmente únicos (por imposible para un tercero, pero
ejemplo, raza, género) en un muy fácil para el responsable del
registro por otro. tratamiento.
Obedece 3 directrices:
1. Eliminar la posibilidad de conectar
conjuntos de datos a otros conjuntos
de datos, haciendo que la
identificación de los datos anónimos
sea identificable de forma única.
2. Almacenar la clave de
encriptación de forma segura y
separada de los datos encriptados.
3. Protección de datos mediante
medidas de seguridad
administrativas, físicas y técnicas.

Seudonimización
Anonimización
El anonimato se consigue cuando los datos ya
no pueden ser utilizados para identificar a una
persona física utilizando "todos los medios que
puedan ser razonablemente utilizados por el
responsable del tratamiento o por cualquier
otra persona".
Técnicas de aleatorización
• Adición de Ruido: modifica los
atributos añadiendo o
sustrayendo un valor aleatorio
diferente para cada registro
• Permutación: Consiste en
intercambiar los valores de los
atributos de un sujeto de datos
a otro
Aplicación: Datathon
Interbank
• Objetivo: Predecir el mejor canal para concretar una
venta con el cliente
• Se proporcionó información financiera de clientes
del banco anonimizados: Sociodemográfica, Sistema
Financiero, Banco, Canales, Ventas, Campañas.
• La información parcialmente anonimizada fue:
Conclusiónes
• La data debe ser anonimizada para
proteger a la persona y no vulnerar su
privacidad.
• Los auditores deben conocer los
conceptos de Desidentificación,
Reidentificación y Anonimización.
• Es importante que los auditores conozcan
las técnicas y los legislamiento que
existen acerca de la anonimización de la
data.

S-ar putea să vă placă și