Optimisation des performances dans les entrepôts de données NoSQL en colonnes
Résumé
Le modèle NoSQL orienté colonnes propose un schéma de données
flexible et hautement dénormalisé. Dans cet article, nous proposons
une méthode d'implantation d'un entrepôt de données dans un système
NoSQL en colonnes. Notre méthode est basée sur une stratégie de regroupement
des attributs issus des tables de faits et de dimensions, sous forme
de familles de colonnes. Nous utilisons deux algorithmes OEP et k-means.
Pour évaluer notre méthode, nous avons effectué plusieurs tests sur le
benchmark TPC-DS au sein du SGBD NoSQL orienté colonnes Hbase,
avec une architecture de type MapReduce sur une plateforme Hadoop.