RNTI

MODULAD
Un modèle génératif pour l'Apprentissage de la Topologie
In AAFD 2009, vol. RNTI-A-3, pp.49-76
Résumé
Un nuage de points est plus qu'un ensemble de points isolés. La distribution des points peut être gouvernée par une structure topologique cachée, et du point de vue de la fouille de données, modéliser et extraire cette structure est au moins aussi important que d'estimer la seule densité de probabilité du nuage. Dans cet article, nous proposons un modèle génératif basé sur le graphe de Delaunay d'un ensemble de prototypes représentant le nuage de points, et supposant un bruit gaussien. Nous dérivons les équations de l'algorithme Expectation- Maximisation de maximisation de la vraisemblance, et nous utilisons le critère d'information bayésien (BIC) pour sélectionner le modèle de complexité optimale. Ce modèle ne nécessite aucun réglage manuel arbitraire de paramètres. Les expériences que nous menons sur des données jouets et des bases d'images montrent que la connexité du graphe reproduit correctement celle du nuage de points. Nous montrons aussi que ce modèle peut être utilisé en tant qu'outil de prétraitement en classification supervisée de caractères manuscrits. Ce travail a pour objectif de poser les premières pierres d'un cadre théorique basé sur les modèles génératifs statistiques, permettant la construction automatique de modèles topologiques d'un nuage de points.