Etude comparative des méthodes de détection d'anomalies
Résumé
La détection d'anomalies est un problème en plein essor et qui
revêt une importance dans plusieurs domaines. A titre d'exemple, la cybercriminalité peut provoquer des pertes économiques considérables et
menacer la survie des entreprises. Sécuriser son système d'information est
devenu une priorité et un enjeu stratégique pour tous les types d'entreprises. D'autres domaines sont également impactés tels que la santé, les
transports, etc. Les solutions de supervision mises en place sont souvent
basées sur des algorithmes de détection d'anomalies issus du datamining
et du machine learning. Nous présentons dans ce papier un état de l'art
complet sur les algorithmes de détection d'anomalies. Nous proposons une
classification de ces méthodes en se basant à la fois sur le type de jeux de
données (flux, séries temporelles, graphes, etc.), le domaine d'application
et l'approche considérée (statistique, classification, clustering, etc.). Nous
nous focalisons ensuite sur trois algorithmes : LOF, OC-SVM et Isolation Forest que nous testons sur deux jeux de données différents afin de
comparer leurs performances.