RNTI

MODULAD
Nouvelle stratégie pour le traitement distribué des processus décisionnels massifs dans un Big Data Warehouse
In EDA 2016, vol. RNTI-B-12, pp.81-94
Résumé
Cet article traite du problème de l'optimisation de l'exécution des charges de requêtes massives dans le cadre des entrepôts de données (ED) dis- tribués où le nombre de processus simultanés à traiter se compte par milliers. En nous inspirant des techniques d'optimisation utilisées dans le contexte cen- tralisé, nous proposons dans cet article une nouvelle stratégie de sélection et de stockage de vues matérialisées (MV) basée sur système de fichiers distribués ; puis nous abordons le traitement des charges de requêtes décisionnelles mas- sives en utilisant les MV. Notre approche joue un rôle de médiateur entre les utilisateurs et l'entrepôt de données pour proposer de meilleurs plans d'exécu- tion à leurs requêtes. Les premiers résultats que nous avons obtenus, à partir de nos expérimentations montrent que dans un environnement distribué notre ap- proche améliore de plus de 50% le coût d'exécution d'une charge de requêtes par rapport au système fourni par défaut.