Intégration Holistique des Graphes basée sur la Programmation Linéaire pour l'Entreposage des Open Data
Abstract
Dans cet article, nous proposons une approche holistique pour l'intégration
des graphes d'Open Data. Ces graphes représentent une classification
hiérarchique des concepts extraits des Open Data. Nous nous focalisons sur la
conservation de hiérarchies strictes lors de l'intégration afin de pouvoir définir
un schéma multidimensionnel à partir de ces hiérarchies et entreposer par la suite
ces sources de données. Notre approche est basée sur un programme linéaire
qui résout automatiquement la tâche de matching des graphes tout en maximisant
globalement la somme des similarités entre les concepts. Ce programme est
composé de contraintes sur la cardinalité du matching et de contraintes sur la
structure des graphes. A notre connaissance, notre approche est la première à
fournir une solution optimale globale pour le matching holistique des graphes
avec un temps de résolution raisonnable. Nous comparons également la qualité
des résultats de notre approche par rapport à d'autres approches de la littérature.