Extraction de chaînes cohérentes en vue de reconstuire la Trajectoire de l'information
Résumé
Sur Internet, l'information se propage en particulier au travers des documents
textuels. Cette propagation soulève de nombreux défis : identifier une
information, suivre son évolution dans le temps, comprendre les mécanismes qui
régissent sa propagation, etc. Étant donné un document parmi un grand corpus
dans lequel de nombreuses informations circulent, pouvons-nous retrouver les
chemins empruntés par l'information pour arriver à ce document ? Nous proposons
de définir la notion de trajectoire comme l'ensemble des chemins le long
desquels de l'information s'est propagée et nous proposons une méthode pour
l'estimer. Nous avons mis en oeuvre une évaluation humaine pour juger de la
qualité des chemins calculés. Nous montrons que les évaluations concordent la
plupart du temps et que notre algorithme est efficace pour retrouver les bons
chemins.