RNTI

MODULAD
Modélisation d'un entrepôt de documents XML
In EDA 2014, vol. RNTI-B-10, pp.17-26
Abstract
Le format XML est aujourd'hui omniprésent dans les organisations et sur le Web. Il facilite le transport et l'échange de données complexes et hétérogènes représentant une information précieuse très peu, voire pas du tout exploitée. Les technologies OLAP et les systèmes d'entrepôts de données actuels permettent l'analyse et le stockage des données transactionnelles issues des bases données relationnelles. Cependant, ces outils ne sont pas adaptés à l'analyse des documents XML du fait de leur structure hiérarchique, ou de leur contenu étant souvent textuel. Nous proposons dans cet article une approche permettant de construire un entrepôt de document XML « centré document » dont le schéma conceptuel est modélisé en utilisant le formalisme UML ; nous présentons aussi une architecture pour l'intégration physique de ces documents dans un environnement XML natif.