CND-Cube : Nouvelle représentation concise sans perte d'information d'un cube de données
Abstract
Le calcul des cubes de données est excessivement coûteux aussi bien
en temps d'exécution qu'en mémoire et son stockage sur disque peut s'avérer
prohibitif. Plusieurs efforts ont été consacrés à ce problème à travers les cubes
fermés, où les cellules préservant la sémantique d'agrégation sont réduites à une
cellule, sans perte d'information. Dans cet article, nous introduisons le concept
du cube de données non-dérivable fermé, nommé CND-Cube, qui généralise
la notion des modèles non-dérivables fermés fréquents bidimensionnels à un
contexte multidimensionnel. Nous proposons un nouvel algorithme pour extraire
le CND-Cube à partir des bases de données multidimensionnelles en se basant
sur trois contraintes anti-monotones, à savoir “être fréquent”, “être non dérivable”
et “être un générateur minimal”. Les expériences montrent que notre
proposition fournit la représentation la plus concise d'un cube de données et elle
est ainsi la plus efficace pour réduire l'espace de stockage