Etudier l'incertitude dans les articles scientifiques : mise en perspective d'une méthode linguistique
Résumé
L'incertitude fait partie intégrante du processus de recherche scientifique
et est inhérente à la construction de nouvelles connaissances. Dans cet article,
nous examinons la manière dont l'incertitude est exprimée dans les articles
scientifiques et proposons un cadre d'annotation rendant compte des différentes
dimensions de cette notion. L'incertitude scientifique est définie ici comme l'expression
d'un manque de connaissance ou d'un manque de précision dans les
informations sur un sujet ou un concept identifié. Nous proposons un jeu de données
de référence (gold standard), composé de 1 839 phrases d'articles scientifiques
annotées manuellement et provenant de plusieurs disciplines. Nous proposons
également une approche à base de connaissances linguistiques pour l'annotation
automatique des articles et pour la détection et la catégorisation de l'incertitude
scientifique. Nous comparons l'efficacité de notre approche en termes
de scores de Précision, Rappel et F1 aux méthodes de prompts few-shot réalisées
via les Grands Modèles de Langue Phi-3.5 et Llama 3 pour la même tâche
d'annotation. Cette évaluation comparative montre des scores similaires entre
les approches, allant jusqu'à des scores F1 de 0,858 pour notre approche.