RNTI

MODULAD
Optimisation des performances dans les entrepôts de données NoSQL en colonnes
In EGC 2017, vol. RNTI-E-33, pp.69-80
Résumé
Le modèle NoSQL orienté colonnes propose un schéma de données flexible et hautement dénormalisé. Dans cet article, nous proposons une méthode d'implantation d'un entrepôt de données dans un système NoSQL en colonnes. Notre méthode est basée sur une stratégie de regroupement des attributs issus des tables de faits et de dimensions, sous forme de familles de colonnes. Nous utilisons deux algorithmes OEP et k-means. Pour évaluer notre méthode, nous avons effectué plusieurs tests sur le benchmark TPC-DS au sein du SGBD NoSQL orienté colonnes Hbase, avec une architecture de type MapReduce sur une plateforme Hadoop.