Observations sur les distributions latentes aux matrices laplaciennes de graphes
Résumé
L'algorithme de clustering spectral permet en principe d'extraire des
clusters de formes arbitraires à partir de données numériques. Cette propriété a
contribué à sa popularité, et même si ses bases théoriques sont établies depuis
plus d'une décennie, des variantes en ont été proposées jusqu'à récemment. Son
fonctionnement repose sur une transformation vers un espace latent dans lequel
des formes de clusters arbitraires sont converties en structures faciles à traiter
par un algorithme tel que k-means. Toutefois, les distributions dans cet espace
latent n'ont été que peu discutées, beaucoup d'auteurs supposant que les propriétés
prédites par la théorie sont vérifiées. Cet article propose alternativement
une approche qualitative pour vérifier si cette structure idéale est effectivement
obtenue en pratique. Le travail consiste également à identifier les paramètres
de variabilité commandant à la transformation vers l'espace latent, via un état
de l'art synthétique de la théorie sous-jacente au clustering spectral. Les observations
tirées de nos expériences permettent d'identifier les combinaisons de
paramètres efficaces, et les conditions de cette efficacité.