Détection d'anomalies textuelles par ensemble d'autoencodeurs robustes
Résumé
La détection d'anomalies en apprentissage automatique, un défi étudié
dans divers domaines, suscite un intérêt croissant, présentant des défis uniques. Dans le cadre du texte, les approches existantes négligent souvent un aspect crucial: le type d'anomalie ciblé. De plus, les protocoles expérimentaux ne différencient pas les types d'anomalies textuelles, limitant la portée des travaux.
Après avoir formalisé deux types d'anomalies (indépendantes et contextuelles), nous proposons AREnT une nouvelle approche utilisant des autoencodeurs ensemblistes robustes, connectés aléatoirement. Notre approche réussit à détecter des anomalies simples et complexes. On note également que AREnT excelle non seulement à fournir des résultats compétitifs par rapport aux méthodes existantes, mais également dans le traitement des anomalies contextuelles.