RNTI

MODULAD
L'opérateur CUBE pour les entrepôts de données NoSQL orientés colonnes
In EDA 2014, vol. RNTI-B-10, pp.27-36
Résumé
L'émergence de grands volumes de données, imposée par les grands acteurs du web, nécessite de nouveaux modèles de gestion de données et des nouvelles architectures de stockage et de traitement capables de trouver rapidement une information dans une volumétrie considérable de données. Les bases de données NoSQL (Not Only SQL) orientées colonnes offrent pour les big data, un modèle approprié aux entrepôts de données et à une structuration multidimensionnelles sous forme de cube OLAP(On-Line Analytical Processing). Cependant, en l'absence d'opérateur de calcul de cube OLAP, nous proposons dans cet article, un nouvel opérateur d'agrégation, baptisé CN-CUBE (Columnar NoSQL CUBE), qui permet de calculer des cubes de données à partir d'entrepôts de données stockés dans un système de gestion de base de données NoSQL orientées colonnes. Nous avons implémenté l'opérateur CN-CUBE sous l'interface SQL (Phoenix 1) du SGBD orienté colonnes Hbase 2, et réalisé des expérimentations sur un entrepôt de données publiques dans un environnement distribué réalisé avec Hadoop 3. Nous avons pu montrer ainsi que notre opérateur CN-CUBE présente des temps de calcul de cubes OLAP intéressants pour les entrepôts de big data.