Carte auto-organisatrice probabiliste sur données binaires
Résumé
Lesméthodes factorielles d'analyse exploratoire statistique définissent
des directions orthogonales informatives à partir d'un ensemble de données.
Elles conduisent par exemple à expliquer les proximités entre individus à l'aide
d'un groupe de variables caractéristiques.Dans le contexte du datamining lorsque
les tableaux de données sont de grande taille, une méthode de cartographie synthétique
s'avère intéressante. Ainsi une carte auto-organisatrice (SOM) est une
méthode de partitionnement munie d'une structure de graphe de voisinage -sur
les classes- le plus souvent planaire. Des travaux récents sont développés pour
étendre le SOM probabiliste Generative Topographic Mapping (GTM) aux modèles
de mélanges classiques pour données discrètes. Dans ce papier nous présentons
et étudions un modèle génératif symétrique de carte auto-organisatrice
pour données binaires que nous appelons Bernoulli Aspect Topological Model
(BATM). Nous introduisons un nouveau lissage et accélérons la convergence de
l'estimation par une initialisation originale des probabilités en jeu.