Détection non supervisée d'une sous-population par méthode d'ensemble et changement de représentation itératif
Résumé
L'apprentissage non supervisé a classiquement pour objectif la détection
de sous-populations homogènes (classes) considérées de manière équivalente
sans information a priori sur celles-ci. Le problème étudié dans cet article
est quelque peu distinct. On se focalise ici uniquement sur une sous-population
d'intérêt que l'on cherche à identifier avec un rappel et une précision optimales.
Nous proposons, pour cela, une méthode s'appuyant sur les principes suivants :
(1) travailler dans l'espace de représentation fourni par des experts faibles pour
cette tâche, (2) confronter ces experts pour détecter des seuils de sélection plus
pertinents, et (3) les combiner itérativement afin de converger vers l'expert idéal.
Cette méthode est éprouvée et comparée sur des données synthétiques.