Recherche de sous-structures fréquentes pour l'intégration de schémas XML
Abstract
La recherche d'un schéma médiateur à partir d'un ensemble de schémas
XML est une problématique actuelle où les résultats de recherche issus
de la fouille de données arborescentes peuvent être adoptés. Dans ce contexte,
plusieurs propositions ont été réalisées mais les méthodes de représentation des
arborescences sont souvent trop coûteuses pour permettre un véritable passage
à l'échelle. Dans cet article, nous proposons des algorithmes de recherche de
sous-schémas fréquents basés sur une méthode originale de représentation de
schémas XML. Nous décrivons brièvement la structure adoptée pour ensuite
détailler les algorithmes de recherche de sous-arbres fréquents s'appuyant sur
une telle structure. La représentation proposée et les algorithmes associés ont
été évalués sur différentes bases synthétiques de schémas XML montrant ainsi
l'intérêt de l'approche proposée