Expliquer les prédictions des réseaux de neurones par l'exploration de l'espace de représentation et de la frontière de décision à l'aide d'EBBE-Text
Résumé
En classification automatique de textes, de nombreux travaux récents
portent sur l'interprétation des réseaux de neurones par la production d'explications
associées aux prédictions. Dans ce contexte, EBBE-Text offre une visualisation
interactive de la frontière de décision, du positionnement des textes vis-àvis
de celle-ci (et donc de la certitude d'un réseau en ses prédictions), des chemins
menant d'un texte à la frontière de décision, des informations concernant la
proximité entre les textes, tout cela au sein de différentes localités dans l'espace
de représentation des textes. Ces informations permettent d'intuiter comment le
réseau de neurones de classification fonctionne et ainsi aider à son interprétabilité.
Notre méthode crée des données sur la frontière de décision puis utilise des
ensembles flous simplicials pour créer un graphe avant d'aligner linéairement les
données créées sur la frontière de décision. Enfin, un processus itératif place les
données d'entrée autour des arrangements linéaires des données de la frontière.