Découverte de motifs graduels partiellement ordonnés : application aux données d'expériences scientifiques
Résumé
Les données séquentielles sont aujourd'hui omniprésentes et
concernent divers domaines d'application. La fouille de données de séquences
permet d'extraire des informations et des connaissances pouvant être à forte valeur
ajoutée. Cependant, lorsque les données de séquences sont riches en données
numériques, des méthodes de fouille de données plus fines sont nécessaires
pour extraire des connaissances plus expressives représentant la variabilité des
valeurs numériques ainsi que leur éventuelle interdépendance. Dans cet article,
nous présentons une nouvelle méthode de découverte de séquences graduelles
fréquentes représentées par des graphes à partir d'une source de données de séquences
en RDF (Resource Description Framework 1). Ces dernières sont transformées
en graphes graduels partiellement ordonnés, gpo. Nous proposons un
algorithme permettant de découvrir les sous-graphes gpo fréquents. Une expérimentation
sur deux jeux de données réelles ont montré la faisabilité et la pertinence
de notre approche.