Les raisons majoritaires : des explications abductives pour les forêts aléatoires
Résumé
Les forêts aléatoires constituent un modèle d'apprentissage automatique
efficace, ce qui explique qu'elles soient encore massivement utilisées aujourd'hui.
S'il est assez facile de comprendre le fonctionnement d'un arbre de
décision, il est beaucoup plus complexe d'interpréter la décision prise par une
forêt aléatoire, car elle est typiquement issue d'un vote majoritaire entre de nombreux
arbres. Nous examinons ici diverses définitions d'explication abductive du
classement prédit par une forêt aléatoire. Nous nous intéressons au problème de
leur génération (trouver une explication) et au problème de leur minimisation
(trouver une explication parmi les plus courtes). Nous montrons notamment que
les explications abductives irredondantes (ou raisons suffisantes) peuvent être
difficiles à calculer pour les forêts aléatoires. Nous proposons à leur place les
raisons majoritaires, des explications abductives en théorie moins concises mais
que l'on peut calculer en temps polynomial.