RNTI

MODULAD
Benchmark pour la classification de commentaires toxiques sur le jeu de données Civil Comments
In EGC 2023, vol. RNTI-E-39, pp.19-30
Résumé
La détection des commentaires toxiques sur les réseaux sociaux est devenue essentielle pour la modération automatique des messages. Dans cet article, nous présentons une comparaison d'un large éventail de modèles sur un ensemble de données multi-labels de discours haineux. Nous prenons en compte dans notre comparaison le temps d'inférence, les performances et le biais en utilisant différentes métriques. Nous avons découvert que tous les modèles BERT ont des performances similaires, indépendamment de leur taille, des optimisations ou du langage utilisé pour le pré-entraînement. Les réseaux BiLSTM restent un bon compromis entre la performance et le temps d'inférence. Le modèle RoBERTa utilisant la fonction Focal Loss pour l'entraînement demeure le moins biaisé de tous. Comme prévu, le modèle DistilBERT a le temps d'inférence le plus faible des modèles BERT. Enfin, tous les modèles sont affectés par le biais d'association des identités à la toxicité. Les modèles BERT, RNN et XLNet y sont moins sensibles que les CNN et les Compact Convolutional Transformers.