RNTI

MODULAD
Classification faiblement supervisée : arbre de décision probabiliste et apprentissage itératif
In FDC 2011, vol. RNTI-E-21, pp.171-192
Résumé
Dans le domaine de la fouille de données, il existe plusieurs types de modèles de classification qui dépendent de la complexité de l'ensemble d'apprentissage. Ce papier traite de la classification faiblement supervisée pour laquelle l'ensemble d'apprentissage est constitué de données de labels inconnus mais dont les probabilités de classification a priori sont connues. Premièrement, nous proposons une méthode pour apprendre des arbres de décision à l'aide des probabilités de classification a priori. Deuxièmement, une procédure itérative est proposée pour modifier les labels des données d'apprentissage, le but étant que les a priori faibles convergent vers des valeurs binaires, et donc vers un a priori fort. Les méthodes proposées sont évaluées sur des jeux de données issus de la base de données UCI, puis nous proposons d'appliquer ces méthodes d'apprentissage dans le cadre de l'acoustique halieutique