Classification faiblement supervisée : arbre de décision probabiliste et apprentissage itératif

Riwal Lefort, Ronan Fablet, Jean-Marc Boucher

In FDC 2011, vol. RNTI-E-21, pp.171-192

Résumé

Dans le domaine de la fouille de données, il existe plusieurs types de modèles de classification qui dépendent de la complexité de l'ensemble d'apprentissage. Ce papier traite de la classification faiblement supervisée pour laquelle l'ensemble d'apprentissage est constitué de données de labels inconnus mais dont les probabilités de classification a priori sont connues. Premièrement, nous proposons une méthode pour apprendre des arbres de décision à l'aide des probabilités de classification a priori. Deuxièmement, une procédure itérative est proposée pour modifier les labels des données d'apprentissage, le but étant que les a priori faibles convergent vers des valeurs binaires, et donc vers un a priori fort. Les méthodes proposées sont évaluées sur des jeux de données issus de la base de données UCI, puis nous proposons d'appliquer ces méthodes d'apprentissage dans le cadre de l'acoustique halieutique

Aperçu Voir bibtex

Télécharger