Construction non-supervisée de variables pour la détection d'anomalies dans les séries temporelles
Résumé
Pour détecter avec précision et sans a priori des anomalies dans une
série temporelle, vaut-il mieux apprendre les détecteurs à partir de la représentation
temporelle initiale ou calculer une nouvelle représentation (tabulaire) à
l'aide d'une bibliothèque existante de construction automatique de variables?
Dans cet article, nous répondons à cette question en menant une étude expérimentale
approfondie pour deux détecteurs très populaires (Isolation Forest et
Local Outlier Factor). Les résultats obtenus, pour 5 jeux de données différents,
montrent que la nouvelle représentation, calculée à l'aide de la bibliothèque tsfresh,
permet à Isolation Forest d'améliorer significativement sa performance.