RNTI

MODULAD
REDIRE : Réduction Extrême de DImension pour le Résumé Extractif
In EGC 2024, vol. RNTI-E-40, pp.199-206
Résumé
Nous présentons un modèle de résumé automatique non supervisé capable d'extraire les phrases les plus importantes d'un ensemble de textes. Pour extraire les phrases dans un résumé, nous utilisons des plongements de mots pré-entraînés afin de représenter les documents. A partir de cet épais nuage de vecteurs de mots, nous appliquons une réduction extrême de dimension permettant d'identifier des mots importants que nous regroupons par proximité. Les phrases sont extraites grâce à l'optimisation linéaire pour maximiser l'information présente dans le résumé. Nous évaluons l'approche sur des documents de grande taille et présentons des premiers résultats très encourageants.