Un algorithme distribué pour le clustering de grands graphes
Résumé
Le clustering de graphes est l'une des techniques clés qui permet de
comprendre les structures présentes dans les données de graphe. La détection
des clusters et l'identification des ponts et des bruit sont également des tâches
critiques car elles jouent un rôle important dans l'analyse des graphes. Récemment, plusieurs algorithmes de clustering de graphes ont été proposés et utilisés
dans de nombreux domaines d'application. La plupart de ces algorithmes sont
basés sur les algorithmes de clustering structurel. Néanmoins, ces derniers ont
été conçus pour le traitement des petits graphes. D'où, leur performance peut se
dégrader dans le cas des graphes larges qui imposent des défis supplémentaires.
Dans cet article, nous proposons DSCAN, un algorithme distribué de clustering
de graphes qui est basé sur le clustering structurel. Notre algorithme est implimenté sur la base de framework de traitement de grands graphes BLADYG.
L'évaluation expérimentale de DSCAN a montré son efficacité et sa compétitivité pour le traitement de grands graphes.