RNTI

MODULAD
Les raisons majoritaires : des explications abductives pour les forêts aléatoires
In EGC 2022, vol. RNTI-E-38, pp.123-134
Résumé
Les forêts aléatoires constituent un modèle d'apprentissage automatique efficace, ce qui explique qu'elles soient encore massivement utilisées aujourd'hui. S'il est assez facile de comprendre le fonctionnement d'un arbre de décision, il est beaucoup plus complexe d'interpréter la décision prise par une forêt aléatoire, car elle est typiquement issue d'un vote majoritaire entre de nombreux arbres. Nous examinons ici diverses définitions d'explication abductive du classement prédit par une forêt aléatoire. Nous nous intéressons au problème de leur génération (trouver une explication) et au problème de leur minimisation (trouver une explication parmi les plus courtes). Nous montrons notamment que les explications abductives irredondantes (ou raisons suffisantes) peuvent être difficiles à calculer pour les forêts aléatoires. Nous proposons à leur place les raisons majoritaires, des explications abductives en théorie moins concises mais que l'on peut calculer en temps polynomial.