Entrepôts de données multidimensionnelles NoSQL
Abstract
Les données des systèmes d'analyse en ligne (OLAP, On-Line Analytical
Processing) sont traditionnellement gérées par des bases de données relationnelles.
Malheureusement, il devient difficile de gérer des mégadonnées (de
gros volumes de données, « Big Data »). Dans un tel contexte, comme alternative,
les environnements « Not-Only SQL » (NoSQL) peuvent fournir un passage
à l'échelle tout en gardant une certaine flexibilité pour un système OLAP. Nous
définissons ainsi des règles pour convertir un schéma en étoile, ainsi que son optimisation,
le treillis d'agrégats pré-calculés, en deux modèles logiques NoSQL :
orienté-colonnes ou orienté-documents. En utilisant ces règles, nous implémentons
et analysons deux systèmes décisionnels, un par modèle, avec MongoDB et
HBase. Nous comparons ces derniers sur les phases de chargement des données
(générées avec le benchmark TPC-DS), de calcul d'un treillis et d'interrogation.