RNTI

MODULAD
Analyse en rôles sémantiques pour le résumé automatique
In EGC 2018, vol. RNTI-E-34, pp.251-256
Résumé
Cet article présente une approche visant à extraire les informations exprimées dans un corpus de textes et en produire un résumé. Plusieurs variantes de méthodes extractives de résumé de texte ont été implémentées et évaluées. Leur principale originalité réside dans l'exploitation de structures appelées CDS (pour Clause Description Structure) issues d'un composant d'annotation en rôles sémantiques et non directement des phrases composant les textes. Le résumé obtenu est un sous-ensemble des CDS issus du corpus d'origine ; ce format permettra dans la suite la détection d'incohérences textuelles. Dans ce travail, nous retransformons les CDS résumés en texte pour permettre la comparaison de notre approche avec celles de la littérature. Les premiers résultats sont très encourageants : les variantes que nous proposons obtiennent généralement de meilleurs scores que des implémentations de méthodes de référence.