GraphMDL : sélection de motifs de graphes avec le principe MDL
Résumé
Plusieurs algorithmes de fouille de motifs ont été proposés pour identifier des structures récurrentes dans les graphes. Le principal défaut de ces approches est qu'elles produisent généralement trop de motifs pour qu'une analyse
humaine soit possible. Récemment, des méthodes de fouille de motifs ont traité
ce problème sur des données transactionnelles, séquentielles et relationnelles en
utilisant le principe MDL (Minimum Description Length). Dans ce papier, nous
proposons une approche MDL pour sélectionner un sous-ensemble représentatif
de motifs sur des graphes étiquetés. Une notion clé de notre approche est l'introduction de ports pour encoder les connections entre occurrences de motifs,
sans perte d'information. Nos expériences montrent que le nombre de motifs
est drastiquement réduit et que les motifs sélectionnés peuvent avoir des formes
complexes.