Extraction de tâches dans les e-mails : une approche fondée sur les rôles sémantiques
Résumé
Il est estimé qu'en 2019 environ 1,4 milliard d'e-mails sont envoyés
chaque jour en France (293 milliards dans le monde). Les e-mails augmentent
sensiblement le volume des communications dans les entreprises. Il en découle
une difficulté pour les salariés de consulter la totalité des messages reçus afin
d'identifier les tâches à mener. À la fin des années 1990, les premiers systèmes
visant à repérer les tâches dans les e-mails ont fait leur apparition. De nombreux
travaux ont été réalisés à ce sujet (toujours d'actualité) fondés sur des méthodes
d'apprentissage, des méthodes symboliques, et des méthodes hybrides. Deux
approches sont communément adoptées : 1) classification d'actes de langages au
niveau du message dans son intégralité ou de ses segments textuels, 2) extraction
d'informations fondée sur des patrons morphosyntaxiques. Nous proposons et
expérimentons une nouvelle approche fondée sur les rôles sémantiques afin de
repérer les tâches dans les e-mails et de les structurer. L'évaluation de notre
système sur des e-mails professionnels montre la pertinence notre proposition.