Approximation du score CFOF de détection d'anomalie dans un arbre d'indexation iSAX : Application au contexte SI de la SNCF
Résumé
La finalité de notre travail est la détection des anomalies dans les
traces de fonctionnement de l'infrastructure de communication du Système d'In-
formation (SI) de la SNCF. Deux techniques récentes et indépendantes semblent
particulièrement appropriées dans notre cas. Il s'agit d'une part du stockage et de
l'indexation de séries temporelles dans un arbre appelé arbre iSAX, et d'autre
part d'un score de détection d'anomalie nommé CFOF dont la robustesse au
phénomène de concentration en haute dimension a été établie de façon formelle.
Dans cet article nous montrons qu'il est possible d'utiliser la structuration des
informations dans l'arbre iSAX pour déterminer rapidement une approximation
du score CFOF. La valeur obtenue est proche du score exact sur des données
synthétiques et réelles. Les premiers retours d'expertises indiquent que la mé-
thode semble pertinente pour le déclenchement d'alarmes sur les données issues
de trace d'activité du SI de la SNCF.