Un benchmark enrichi pour l'évaluation des entrepôts de données noSQL volumineuses et variables
Résumé
Avec le développement des données massives (Big Data), de nou-
veaux besoins émergent dans l'évaluation des systèmes d'information décision-
nels. En particulier, les bancs d'essais (benchmarks) dédiés aux entrepôts de
données multidimensionnelles doivent être adaptés aux volumes et à la diversité
des données massives. Dans ce contexte, nous proposons un nouveau bench-
mark dédié aux entrepôts des données multidimensionnelles qui supporte plu-
sieurs types de systèmes (relationnel, noSQL) et des modèles de données (flo-
con, étoile, aplati) structurées et non structurées. Pour tester des volumes très
importants, il supporte la génération parallèle sur plusieurs machines (cluster).
Il enrichit le processus de génération des données pour évaluer plusieurs niveaux
de diversité des données. Dans ce papier, nous présentons ce benchmark, appelé
KoalaBench, et les premiers résultats expérimentaux de son utilisation.