Défi EGC 2016 : Analyse par Motifs Fréquents et Topic Modeling
Résumé
Dans le domaine de l'analyse de textes, l'extraction de motifs est une
technique très populaire pour mettre en évidence des relations fréquentes entre
les mots. De même, les techniques de topic modeling ont largement fait leurs
preuves lorsqu'il s'agit de classer automatiquement des ensembles de textes partageant
des thématiques similaires. Ainsi, ce papier a pour ambition de montrer
l'intérêt de l'utilisation conjointe de ces deux techniques afin de mettre en évidence,
sous la forme d'un graphe biparti, des mots partageant des thématiques
similaires mais aussi leurs relations fréquentes, intra et inter thématiques. Les
données du Défi EGC 2016 permettent de valider l'intérêt de l'approche, tout
en montrant l'évolution des thématiques et des mots clés parmi les papiers de la
conférence EGC sur ces onze dernières années.