RNTI

MODULAD
Enjeux et opportunités de la fouille textes pour stimuler la recherche pluridisciplinaire
In EGC 2025, vol. RNTI-E-41, pp.7-8
Résumé
Les travaux de sciences des données textuelles ont connu un formidable essor en ouvrant des perspectives nombreuses depuis l'avènement des modèles de langues et des grands modèles de langues (LLM - Large Language Model). Dans ce contexte, les travaux pluridisciplinaires intégrant des ressources textuelles hétérogènes offrent de nouvelles perspectives. Dans un premier temps, cette présentation dresse un panorama d'approches de fouille de textes intégrées dans différents projets appliqués à l'agriculture et à la santé dans une perspective One Health (une seule santé). Les recherches pluridisciplinaires peuvent se nourrir mutuellement et conduire à la co-construction de démarches génériques. Dans un deuxième temps, nous montrerons de quelles manières (i) les travaux disciplinaires peuvent alimenter les travaux pluridisciplinaires et (ii) comment les problématiques thématiques peuvent engendrer de nouveaux verrous scientifiques pour la fouille de textes et les recherches du monde académique. Enfin, cette présentation discutera la manière dont les nouvelles problématiques méthodologiques et disciplinaires liées aux LLM et à leur usage ouvrent de nouveaux défis pluridisciplinaires en particulier dans les pays du Sud : biais issus des modèles, traitement de langues peu dotées, intégration de connaissances (syntaxiques et sémantiques) dans les modèles, explicabilité, frugalité, etc.