RNTI

MODULAD
Anonymiser des données multidimensionnelles à l'aide du coclustering
In EGC 2017, vol. RNTI-E-33, pp.153-164
Résumé
Dans cet article, nous proposons une méthodologie pour anonymiser une table de données multidimensionnelles contenant des données individuelles (soit n individus décrits par m variables). L'objectif est de publier une table ano- nyme construite à partir d'une table initiale qui protège contre le risque de ré- identification. En d'autres termes, on ne doit pas pouvoir retrouver dans les don- nées publiées un individu présent dans la table originale. La solution proposée consite à agréger les données à l'aide d'une technique de coclustering, puis à uti- liser le modèle produit pour générer une table de données synthétiques du même format que les données initiales. Les données synthétiques, qui contiennent des individus fictifs, peuvent maintenant être publiées. Les données produites sont évaluées en termes d'utilité pour différentes tâches de fouille (analyse explora- toire, classification) et de niveau de protection.