Généralisation des k-moyennes pour produire des recouvrements ajustables
Résumé
La recherche de groupes non-disjoints à partir de données non-étiquetées
est une problématique importante en classification non-supervisée. La
classification recouvrante (Overlapping clustering) contribue à la résolution de
plusieurs problèmes réels qui nécessitent la détermination de groupes qui se chevauchent.
Cependant, bien que les recouvrements entre groupes soient tolérés
voire encouragés dans ces applications, il convient de contrôler leur importance.
Nous proposons dans ce papier des généralisations de k-moyennes offrant le
contrôle et le paramétrage des recouvrements. Deux principes de régulation sont
mis en place, ils visent à contrôler les recouvrements relativement à leur taille
et à la dispersion des classes. Les expérimentations réalisées sur des jeux de
données réelles, montrent l'intérêt des principes proposés.