Encodeur hybride pour la détection automatique de désinformation
Résumé
L'encodage de texte pour des tâches de classification repose aujourd'hui grandement sur de larges modèles de langage difficilement explicables et nécessitant de grandes quantités de données pour fonctionner. Ces modèles sont à la base de tâches de classification comme la détection de désinformation, importante aujourd'hui. Récemment, les approches hybrides entre l'apprentissage profond et l'IA symbolique tentent de surpasser les performances des modèles à base d'attention en introduisant du raisonnement dans le processus de décision pour le rendre moins opaque à l'utilisateur. Dans cet article, nous proposons CATS, un mécanisme d'attention basé sur la compréhension sémantique des documents, améliorant les performances des modèles neuronaux équivalents, réduisant le besoin en données annotées et facilitant l'explicabilité de la décision.