Une métrique de sélection de variables appliquée à la centralité et à la détection des rôles communautaires
Résumé
La F-Mesure de trait est une métrique de sélection de variables statistique
sans paramètres qui a montré de bonnes performances pour la classification,
l'étiquetage de clusters ou encore la mesure de qualité des clusters. Dans
cet article, nous proposons d'évaluer son utilisation dans le contexte des graphes
de terrain et de leur structure communautaire pour bénéficier de son système
sans paramètres et de ses performances bien évaluées. Nous étudions donc sur
des graphes synthétiques réalistes les corrélations qui existent entre la F-Mesure
de trait et certaines mesures de centralité, mais surtout avec des mesures destinées
à caractériser le rôle communautaire des noeuds. Nous montrons ainsi que
cette mesure est liée à la centralité des noeuds du réseau, et qu'elle est particulièrement
adaptée à la mesure de leur connectivité au regard de la structure
de communautés. Nous observons par ailleurs que les mesures usuelles de détection
des rôles communautaires sont fortement dépendantes de la taille des
communautés alors que celles que nous proposons sont par définition liées à la
densité de la communauté, ce qui rend les résultats comparables d'un réseau à
un autre. Ceci offre donc la possibilité d'applications comme le suivi temporel
de la structure des communautés. Enfin, le processus de sélection appliqué aux
noeuds permet de disposer d'un système universel, contrairement aux seuils fixés
auparavant empiriquement pour l'établissement des rôles communautaires.