Réinitialiser mot de passe
E-mail
Password
RNTI

MODULAD
Anonymiser des données multidimensionnelles à l'aide du coclustering
In EGC 2017, vol. RNTI-E-33, pp.153-164
Résumé
Dans cet article, nous proposons une méthodologie pour anonymiser
une table de données multidimensionnelles contenant des données individuelles
(soit n individus décrits par m variables). L'objectif est de publier une table ano-
nyme construite à partir d'une table initiale qui protège contre le risque de ré-
identification. En d'autres termes, on ne doit pas pouvoir retrouver dans les don-
nées publiées un individu présent dans la table originale. La solution proposée
consite à agréger les données à l'aide d'une technique de coclustering, puis à uti-
liser le modèle produit pour générer une table de données synthétiques du même
format que les données initiales. Les données synthétiques, qui contiennent des
individus fictifs, peuvent maintenant être publiées. Les données produites sont
évaluées en termes d'utilité pour différentes tâches de fouille (analyse explora-
toire, classification) et de niveau de protection.