Nouvelle stratégie pour le traitement distribué des processus décisionnels massifs dans un Big Data Warehouse
Résumé
Cet article traite du problème de l'optimisation de l'exécution des
charges de requêtes massives dans le cadre des entrepôts de données (ED) dis-
tribués où le nombre de processus simultanés à traiter se compte par milliers.
En nous inspirant des techniques d'optimisation utilisées dans le contexte cen-
tralisé, nous proposons dans cet article une nouvelle stratégie de sélection et de
stockage de vues matérialisées (MV) basée sur système de fichiers distribués ;
puis nous abordons le traitement des charges de requêtes décisionnelles mas-
sives en utilisant les MV. Notre approche joue un rôle de médiateur entre les
utilisateurs et l'entrepôt de données pour proposer de meilleurs plans d'exécu-
tion à leurs requêtes. Les premiers résultats que nous avons obtenus, à partir de
nos expérimentations montrent que dans un environnement distribué notre ap-
proche améliore de plus de 50% le coût d'exécution d'une charge de requêtes
par rapport au système fourni par défaut.