Un critère d'évaluation Bayésienne pour la construction d'arbres de décision
Abstract
Nous présentons dans cet article un nouvel algorithme automatique
pour l'apprentissage d'arbres de décision. Nous abordons le problème selon une
approche Bayésienne en proposant, sans aucun paramètre, une expression ana-
lytique de la probabilité d'un arbre connaissant les données. Nous transformons
le problème de construction de l'arbre en un problème d'optimisation : nous
recherchons dans l'espace des arbres de décision, l'arbre optimum au sens du
critère Bayésien ainsi défini, c'est à dire l'arbre maximum a posteriori (MAP).
L'optimisation est effectuée en exploitant une heuristique de pré-élagage. Des
expérimentations comparatives sur trente bases de l'UCI montrent que notre
méthode obtient des performances prédictives proches de celles de l'état de l'art
tout en étant beaucoup moins complexes.