Classification sous contraintes probabilistes par les cartes topologiques
Abstract
La classification automatique est un processus non supervisé qui vise à regrouper
des données en un ensemble de classes hétérogènes. En outre, Différents travaux ont
montré que l'intégration de contraintes peut augmenter le taux de ce processus de classification
tout en diminuant le temps d'exécution. Cette nouvelle démarche a connu, ces dernières
années, un travail bien étendu. La forme la plus répandue de ces dites contraintes est de type
« Must-Link » dont le nom indique l'obligation d'avoir les données dans une même classe, et
les contraintes « Cannot-Link » dont le nom indique l'interdiction d'avoir les données dans
une même classe. Le travail présenté dans cet article décrit une nouvelle version des cartes
topologiques que nous appelons « PrTM » (Probabilistic constrained Topological Map) pour
intégrer des contraintes probabilistes. PrTM représente une variante d'un algorithme populaire
des cartes topologiques probabilistes GTM (Generative Topographic Mapping). Pour
valider notre approche, des comparaisons entre notre proposition « PrTM » et d'autres algorithmes
de classification sous contraintes, sont présentées sur différentes bases de données
issues de la littérature.