CND-Cube : Nouvelle représentation concise sans perte d'information d'un cube de données

Hanen Brahmi, Tarek Hamrouni, Riadh Ben Messaoud, Sadok Ben Yahia

In EGC 2010, vol. RNTI-E-19, pp.261-272

Résumé

Le calcul des cubes de données est excessivement coûteux aussi bien en temps d'exécution qu'en mémoire et son stockage sur disque peut s'avérer prohibitif. Plusieurs efforts ont été consacrés à ce problème à travers les cubes fermés, où les cellules préservant la sémantique d'agrégation sont réduites à une cellule, sans perte d'information. Dans cet article, nous introduisons le concept du cube de données non-dérivable fermé, nommé CND-Cube, qui généralise la notion des modèles non-dérivables fermés fréquents bidimensionnels à un contexte multidimensionnel. Nous proposons un nouvel algorithme pour extraire le CND-Cube à partir des bases de données multidimensionnelles en se basant sur trois contraintes anti-monotones, à savoir “être fréquent”, “être non dérivable” et “être un générateur minimal”. Les expériences montrent que notre proposition fournit la représentation la plus concise d'un cube de données et elle est ainsi la plus efficace pour réduire l'espace de stockage

Aperçu Voir bibtex

Télécharger