Une représentation des arborescences pour la recherche de sous-structures fréquentes
Résumé
La recherche de structures fréquentes au sein de données ar-
borescentes est une problématique actuellement très active qui trouve
de nombreux intérêts dans le contexte de la fouille de données comme,
par exemple, la construction automatique d'un schéma médiateur à par-
tir de schémas XML. Dans ce contexte, de nombreuses propositions ont
été réalisées mais les méthodes de représentation des arborescences sont
très souvent trop coûteuses. Dans cet article, nous proposons donc une
méthode originale de représentation de ces données. Les propriétés de
cette représentation peuvent être avantageusement utilisées par les algorithmes de recherche de structures fréquentes (sous-arbres fréquents). La
représentation proposée et les algorithmes associés ont été évalués sur
des jeux de données synthétiques montrant ainsi l'inter^et de l'approche
proposée.