Repondération Préférentielle pour l'Apprentissage Biqualité
Résumé
Cet article propose une vision originale et globale de l'Apprentissage
Faiblement Supervisé, menant à la conception d'approches génériques capable
de traiter tout type de faiblesses en supervision. Un nouveau cadre appelé
“Données Biqualité" est introduit, qui suppose qu'un petit jeu de données fiable
d'exemples correctement étiquetés est disponible, en plus d'un jeu de données
non fiable comprenant un grand nombre d'exemples potentiellement corrompus.
Dans ce cadre nous proposons un nouveau schéma de repondération capable de
détecter les exemples non corrompus du jeu de données non fiable. Cet algorithme
permet d'apprendre des classifieurs sur les deux jeux de données. Nos
expériences simulant plusieurs types de bruits d'étiquetage démontrent empiriquement
que l'algorithme proposé sur-performe l'état de l'art.