RNTI

MODULAD
Etudier l'incertitude dans les articles scientifiques : mise en perspective d'une méthode linguistique
In EGC 2025, vol. RNTI-E-41, pp.111-122
Résumé
L'incertitude fait partie intégrante du processus de recherche scientifique et est inhérente à la construction de nouvelles connaissances. Dans cet article, nous examinons la manière dont l'incertitude est exprimée dans les articles scientifiques et proposons un cadre d'annotation rendant compte des différentes dimensions de cette notion. L'incertitude scientifique est définie ici comme l'expression d'un manque de connaissance ou d'un manque de précision dans les informations sur un sujet ou un concept identifié. Nous proposons un jeu de données de référence (gold standard), composé de 1 839 phrases d'articles scientifiques annotées manuellement et provenant de plusieurs disciplines. Nous proposons également une approche à base de connaissances linguistiques pour l'annotation automatique des articles et pour la détection et la catégorisation de l'incertitude scientifique. Nous comparons l'efficacité de notre approche en termes de scores de Précision, Rappel et F1 aux méthodes de prompts few-shot réalisées via les Grands Modèles de Langue Phi-3.5 et Llama 3 pour la même tâche d'annotation. Cette évaluation comparative montre des scores similaires entre les approches, allant jusqu'à des scores F1 de 0,858 pour notre approche.