RNTI

MODULAD
Un benchmark enrichi pour l'évaluation des entrepôts de données noSQL volumineuses et variables
In EDA 2017, vol. RNTI-B-13, pp.11-26
Résumé
Avec le développement des données massives (Big Data), de nou- veaux besoins émergent dans l'évaluation des systèmes d'information décision- nels. En particulier, les bancs d'essais (benchmarks) dédiés aux entrepôts de données multidimensionnelles doivent être adaptés aux volumes et à la diversité des données massives. Dans ce contexte, nous proposons un nouveau bench- mark dédié aux entrepôts des données multidimensionnelles qui supporte plu- sieurs types de systèmes (relationnel, noSQL) et des modèles de données (flo- con, étoile, aplati) structurées et non structurées. Pour tester des volumes très importants, il supporte la génération parallèle sur plusieurs machines (cluster). Il enrichit le processus de génération des données pour évaluer plusieurs niveaux de diversité des données. Dans ce papier, nous présentons ce benchmark, appelé KoalaBench, et les premiers résultats expérimentaux de son utilisation.