Vers une méthode automatique de construction de hiérarchies contextuelles
Résumé
Dans de nombreux domaines (e.g., fouille de données, entrepôts de
données), l'existence de hiérarchies sur certains attributs peut être extrêmement
utile dans le processus analytique. Toutefois, cette connaissance n'est pas toujours
disponible ou adaptée. Il est alors nécessaire de disposer d'un processus
de découverte automatique pour palier ce problème. Dans cet article, nous combinons
et adaptons des techniques issues de la théorie de l'information et du
clustering pour proposer une technique orientée données de construction automatique
de taxonomies. Les deux principaux avantages d'une telle approche
sont son caractère totalement non-supervisé et l'absence de paramètre utilisateur
à spécifier. Afin de valider notre approche, nous l'avons appliquée sur des
données réelles et avons conduit plusieurs types d'expérimentation. D'abord,
les hiérarchies obtenues ont été expertisées pour en examiner le pouvoir informatif.
Ensuite, nous avons évalué l'apport de ces taxonomies comme support à
des tâches de fouille de données nécessitant une définition hiérarchique des valeurs
d'attributs : l'extraction de séquences fréquentes multidimensionnelles et
multi-niveaux ainsi que la construction de résumés de tables relationnelles. Les
résultats obtenus permettent de conclure quant à l'intérêt de notre approche