L'analyse relationnelle de concepts pour la fouille de données temporelles – Application à l'étude de données hydroécologiques
Résumé
Cet article présente une méthode d'exploration de données temporelles,
fondée sur l'analyse relationnelle de concepts (ARC) et appliquée à des
données séquentielles construites à partir d'échantillons physico-chimiques et
biologiques prélevés dans des cours d'eau. Notre but est de mettre au jour des
sous-séquences pertinentes et hiérarchisées, associant les deux types de paramètres.
Pour faciliter la lecture, ces sous-séquences sont représentées sous la
forme de motifs partiellement ordonnés (po-motifs). Le processus de fouille de
données se décompose en plusieurs étapes : construction d'un modèle temporel
ad hoc et mise en oeuvre de l'ARC ; extraction des sous-séquences synthétisées
sous la forme de po-motifs ; sélection des po-motifs intéressants grâce à une
mesure exploitant la distribution des extensions de concepts. Le processus a été
testé sur un jeu de données réelles et évalué quantitativement et qualitativement.