Détection des Données à Caractère Personnel dans les Bases Multidimensionnelles
Résumé
Cartographier les données à caractère personnel dans la démarche de
la de-identification est toujours un vrai pré-requis. Aujourd'hui avec les bases
de données de grandes masses, nous sommes dans l'obligation d'automatiser
l'étape de la détection dans cette démarche. Ce qui permet d'éviter les étapes
chronophages, d'augmenter la précision de la détection et essentiellement permet de garantir la confidentialité. Pour toutes ces raisons nous avons proposé
une nouvelle approche pour détecter les données personnelles. L'approche dé-
taillée dans ce travail est adaptée aux bases de données multidimensionnelles.
Nos méthodes utilisées dans cette approche sont sur deux niveaux. Nous proposons deux solutions de détection au niveau des données, et une solution au niveau
des méta-données. Après détection des données à caractère personnel dans une
base en utilisant les scores d'identifications, nous utilisons les scores de sensibilité afin d'évaluer la sensibilité totale de la base multidimensionnelle avant et
après anonymisation.