Clustering semi-supervisé de séries temporelles multivariées par apprentissage profond
Résumé
De grands volumes de données sont aujourd'hui produits par différents
capteurs qui mesurent, généralement, plusieurs variables au cours du temps.
Ces informations peuvent être organisées sous forme de séries temporelles multivariées.
Recueillir suffisamment d'échantillons étiquetés, pour mettre en place
une analyse d'apprentissage automatique supervisée pour ce type de données,
est quasiment impossible. Dans ce contexte, les méthodes de clustering semisupervisé
représentent un outil particulièrement adapté pour exploiter au mieux
la quantité réduite de connaissances à disposition. Dans le but d'améliorer l'analyse
de séries temporelles multivariées dans ce contexte, nous proposons une
approche de clustering semi-supervisé (sous contrainte) de séries temporelles
basée sur des méthodes d'apprentissage profond utilisant des contraintes de type
must- et cannot-link comme forme de supervision faible. L'évaluation expérimentale
de cette méthode sur différents jeux de données a mis en évidence la
plus value de notre proposition.