Index de Jointure Binaires: Stratégies de Sélection & Étude de Performances

Ladjel Bellatreche, Benameur Ziani, Boukhalfa Kamel

In EDA 2010, vol. RNTI-B-6, pp.173-189

Résumé

La conception physique des entrepôts de données relationnels est basée essentiellement sur la sélection d'un ensemble d'index afin de réduire le coût d'exécution des requêtes OLAP complexes. Ces entrepôts sont généralement modélisés par un schéma en étoile caractérisé par une table de faits volumineuse et un ensemble de tables de dimension liées à la table des faits par leurs clés étrangères. Les requêtes définies sur ce schéma (appelées requêtes de jointure en étoile) comportent plusieurs jointures entre la tables des faits et les tables de dimension ce qui rend leur coût d'exécution considérable. Les index de jointure binaires sont très adaptés pour réduire le coût d'exécution de ces jointures. Ils sont défini sur la table de faits en utilisant un ou plusieurs attributs de dimension. Sélectionner une configuration d'index pour réduire le coût d'exécution d'un ensemble de requêtes est reconnu comme un problème NP-Complet. Dans ce papier, nous présentons d'abord le problème de sélection des index de jointure binaires et les principaux travaux effectués dans ce domaine. Nous présentons par la suite notre approche de sélection et les algorithmes que nous proposons. Nous effectuons des expériences pour comparer les différentes stratégies de sélection. Enfin, nous effectuons une validation réelle des différents algorithmes sous Oracle en utilisant les données issues du banc d'essai APB1.

Aperçu Voir bibtex

Télécharger