Dépendances fonctionnelles et matérialisation partielle des cubes de données
Résumé
La sélection de vues à matérialiser dans des entrepôts de données de
plus en plus volumineux est une nécessité. Dans cet article, nous montrons qu'il
existe un lien très étroit entre recherche des cuboïdes à matérialiser dans un cube
de données afin d'optimiser les traitements et les dépendances fonctionnelles sur
celui-ci. La contrainte que nous imposons sur les vues que l'on matérialise ne
porte pas sur une borne d'espace de stockage à ne pas dépasser comme c'est
le cas dans la plupart des travaux relatifs, mais elle porte sur le facteur de performance
f que celles-ci vérifient. Nous tentons cependant d'utiliser le moins
d'espace mémoire pour atteindre cet objectif. Nous caractérisons formellement
toute solution optimale (en terme d'espace mémoire) répondant à ce critère. On
prouve que ce problème est NP-difficile et on démontre l'efficacité de nos algorithmes
gloutons pour répondre à ce problème en respectant la contrainte de
performance fixée par l'utilisateur.