Enjeux et opportunités de la fouille textes pour stimuler la recherche pluridisciplinaire
Résumé
Les travaux de sciences des données textuelles ont connu un formidable essor en ouvrant
des perspectives nombreuses depuis l'avènement des modèles de langues et des grands modèles
de langues (LLM - Large Language Model). Dans ce contexte, les travaux pluridisciplinaires
intégrant des ressources textuelles hétérogènes offrent de nouvelles perspectives.
Dans un premier temps, cette présentation dresse un panorama d'approches de fouille de textes
intégrées dans différents projets appliqués à l'agriculture et à la santé dans une perspective One
Health (une seule santé). Les recherches pluridisciplinaires peuvent se nourrir mutuellement et
conduire à la co-construction de démarches génériques.
Dans un deuxième temps, nous montrerons de quelles manières (i) les travaux disciplinaires
peuvent alimenter les travaux pluridisciplinaires et (ii) comment les problématiques thématiques
peuvent engendrer de nouveaux verrous scientifiques pour la fouille de textes et les
recherches du monde académique.
Enfin, cette présentation discutera la manière dont les nouvelles problématiques méthodologiques
et disciplinaires liées aux LLM et à leur usage ouvrent de nouveaux défis pluridisciplinaires
en particulier dans les pays du Sud : biais issus des modèles, traitement de langues peu
dotées, intégration de connaissances (syntaxiques et sémantiques) dans les modèles, explicabilité,
frugalité, etc.