La fragmentation dans les entrepôts de données : une approche basée sur les algorithmes génétiques
Abstract
La fragmentation horizontale est une technique d'optimisation
non redondante de requêtes décisionnelles de type ROLAP. L'utilisation
de cette technique dans les entrepôts de données représente un enjeu plus
important que dans un contexte de bases de données traditionnelles. Cette
importance est due au différents choix des tables (de dimensions ou des
faits) à fragmenter. Dans le contexte des entrepôts, la fragmentation n'a
un sens que si la table des faits est partitionnée en fonction des schémas
de fragmentation des tables de dimensions. Mais ce type de fragmentation
de la table des faits pourrait engendrer un nombre important de
fragments qui rendrait le processus de maintenance très coûteux. Afin de
réduire ce nombre ou le rendre contrôlable par l'administrateur de l'entrepôt, nous proposons l'utilisation d'un algorithme génétique. Ce dernier
a pour but de sélectionner les tables de dimension à fragmenter pour (1)
éviter l'explosion du nombre de fragments de la table des faits et (2)
garantir une meilleure performance d'exécution des requêtes. Notre algorithme
génétique est développé sous visual C et validé par une étude
expérimentale en utilisant le banc d'essai APB-1 release II.