RNTI

MODULAD
Vers l'intégration multidimensionnelle d'Open Data dans les entrepôts de données
In EDA 2013, vol. RNTI-B-9, pp.101-110
Abstract
L'émergence de nombreuses sources d'Open Data poussent plusieurs communautés de recherche ainsi que des entreprises à développer des outils permettant leur exploitation. En particulier, les données statistiques présentes dans les Open Data peuvent constituer des informations utiles aux analyses décisionnelles. Toutefois les Open Data très hétérogènes et disséminés en plusieurs morceaux de données sur le web, rendent difficile leur intégration au sein d'un entrepôt de données. Les travaux actuels sur l'intégration des Open Data proposent des processus d'intégration basés sur des Linked Open Data, dont la mise en place n'est pas automatisée. Dans cet article, nous proposons un processus visant à automatiser l'entreposage multidimensionnel des Open Data. Notre démarche repose sur la transformation des Open Data en un graphe générique et enrichi favorisant leur intégration. Ce graphe sert de support pour la définition semi-automatique et incrémentale du schéma multidimensionnel d'entreposage.