Classification probabiliste non supervisée et visualisation des données séquentielles
Abstract
Nous proposons dans ce papier un nouvel algorithme de classification
non supervisée à base de modèle de mélange topologique pour des données
non i.i.d (non independently and identically distributed). Ce nouveau paradigme
probabiliste, plonge les cartes topologiques probabilistes dans une formulation
sous forme de chaînes de Markov cachées. Dans cette formulation, la génération
d'une observation à un instant donné du temps est conditionnée par les états
voisins au même instant du temps. Ainsi, une grande proximité impliquera une
grande probabilité pour la contribution à la génération. L'approche proposée est
évaluée en utilisant des données séquentielles réelles issues des bases de données
de l'Institut Nationale de l'Audiovisuel (INA). Les résultats obtenus sont
très encourageants et prometteurs.