RNTI

MODULAD
Carte auto-organisatrice probabiliste sur données binaires
In EGC 2006, vol. RNTI-E-6, pp.445-456
Résumé
Lesméthodes factorielles d'analyse exploratoire statistique définissent des directions orthogonales informatives à partir d'un ensemble de données. Elles conduisent par exemple à expliquer les proximités entre individus à l'aide d'un groupe de variables caractéristiques.Dans le contexte du datamining lorsque les tableaux de données sont de grande taille, une méthode de cartographie synthétique s'avère intéressante. Ainsi une carte auto-organisatrice (SOM) est une méthode de partitionnement munie d'une structure de graphe de voisinage -sur les classes- le plus souvent planaire. Des travaux récents sont développés pour étendre le SOM probabiliste Generative Topographic Mapping (GTM) aux modèles de mélanges classiques pour données discrètes. Dans ce papier nous présentons et étudions un modèle génératif symétrique de carte auto-organisatrice pour données binaires que nous appelons Bernoulli Aspect Topological Model (BATM). Nous introduisons un nouveau lissage et accélérons la convergence de l'estimation par une initialisation originale des probabilités en jeu.