Vers l'intégration multidimensionnelle d'Open Data dans les entrepôts de données
Abstract
L'émergence de nombreuses sources d'Open Data poussent plusieurs
communautés de recherche ainsi que des entreprises à développer des outils permettant
leur exploitation. En particulier, les données statistiques présentes dans
les Open Data peuvent constituer des informations utiles aux analyses décisionnelles.
Toutefois les Open Data très hétérogènes et disséminés en plusieurs morceaux
de données sur le web, rendent difficile leur intégration au sein d'un entrepôt
de données. Les travaux actuels sur l'intégration des Open Data proposent
des processus d'intégration basés sur des Linked Open Data, dont la mise en
place n'est pas automatisée. Dans cet article, nous proposons un processus visant
à automatiser l'entreposage multidimensionnel des Open Data. Notre démarche
repose sur la transformation des Open Data en un graphe générique et
enrichi favorisant leur intégration. Ce graphe sert de support pour la définition
semi-automatique et incrémentale du schéma multidimensionnel d'entreposage.