Fouille de Données Multidimensionnelles : Différentes Stratégies pour Prendre en Compte la Mesure
Abstract
Les entrepôts de données contiennent de gros volumes de données historisées
stockées à des fins d'analyse. Des techniques d'extraction de motifs séquentiels
multidimensionnels ont été développées afin de mettre en exergue des
corrélations entre des positions sur des dimensions au cours du temps. Même si
ces méthodes offrent unemeilleure appréhension des données sources en prenant
en compte certaines spécificités des cubes de données (e.g. multidimensionnalité,
hiérarchies, relation d'ordre), aucune méthode ne permet de prendre directement
en compte la valeurs des agrégats (mesure) dans l'extraction des motifs.
Dans cet article, nous définissons deux méthodes de comptage du support
d'une séquence multidimensionnelle en s'appuyant sur les valeurs des agrégats
des cellules qui supportent cette séquence. Des expérimentations sont décrites et
montrent l'intérêt de notre proposition.