Vers une approche semi-automatique pour la définition de motifs d'argumentation utilisés dans les résumés de projets scientifiques du domaine de la biodiversité
Abstract
Nous positionnons notre travail dans le domaine de l'analyse et de la
visualisation de données textuelles produites par les scientifiques et réunies en
corpus calibré. Ce domaine est reconnu pour sa contribution à la réflexion sur
la composition et l'évaluation des politiques scientifiques. Le corpus que nous
utilisons est une collection de tous les résumés de projets acceptés dans des
guichets d'appels à projet dans le domaine de la biodiversité référencés par le
réseau européen BiodivERsA. L'objectif de ce travail ancré dans la sociologie
des sciences consiste à mieux comprendre les principales caractéristiques utilisées
par les scientifiques pour présenter leur projet et convaincre de ses qualités.
Pour cela nous avons utilisé une pluralité d'outils face à la difficulté de dépouiller
l'information pour associer le niveau sémantique (structure de
l'information) au niveau pragmatique (relations entre les rédacteurs de projet).
Notre contribution repose sur un nouveau type d'extraction d'information, hors
entités nommées, basé sur l'extraction de motifs d'argumentation. D'une part
on remarque que l'usage de ces motifs marque la présence d'arguments dans
des résumés de projets, et d'autre part croît avec le temps.