Vers une modularité pour données vectorielles
Abstract
La modularité, introduite par Newman pour mesurer la qualité d'une
partition des sommets d'un graphe, ne prend pas en compte d'éventuelles valeurs
associées à ces sommets. Dans cet article, nous introduisons une mesure de modularité
complémentaire, basée sur l'inertie, et adaptée pour évaluer la qualité
d'une partition d'éléments représentés dans un espace vectoriel réel. Cette mesure
se veut un pendant pour la classification non supervisée de la modularité
de Newman. Nous présentons également 2Mod-Louvain, une méthode utilisant
ce critère de modularité basée sur l'inertie conjointement à la modularité de
Newman pour détecter des communautés dans des réseaux d'information. Les
expérimentations que nous avons menées ont montré qu'en exploitant à la fois
les données relationnelles et vectorielles, 2Mod-Louvain détectait plus efficacement
les communautés que des méthodes utilisant un seul type de données et
qu'elle était robuste face à des dégradations des données.