Classification faiblement supervisée : arbre de décision probabiliste et apprentissage itératif
Résumé
Dans le domaine de la fouille de données, il existe plusieurs types de
modèles de classification qui dépendent de la complexité de l'ensemble d'apprentissage.
Ce papier traite de la classification faiblement supervisée pour laquelle
l'ensemble d'apprentissage est constitué de données de labels inconnus
mais dont les probabilités de classification a priori sont connues. Premièrement,
nous proposons une méthode pour apprendre des arbres de décision à l'aide des
probabilités de classification a priori. Deuxièmement, une procédure itérative
est proposée pour modifier les labels des données d'apprentissage, le but étant
que les a priori faibles convergent vers des valeurs binaires, et donc vers un a
priori fort. Les méthodes proposées sont évaluées sur des jeux de données issus
de la base de données UCI, puis nous proposons d'appliquer ces méthodes
d'apprentissage dans le cadre de l'acoustique halieutique