DACE pour la désambiguïsation d'acronymes ferroviaires
Résumé
La désambiguïsation d'acronymes (DA) est un défi fondamental dans
le traitement de textes techniques, en particulier dans les secteurs spécialisés où
une forte ambiguïté complique l'analyse automatique. Cet article aborde la DA
dans le contexte de la compétition TextMine'26 portant sur la documentation
ferroviaire française. Nous présentons DACE (Dynamic Prompting, Retrieval
Augmented Generation, Contextual Selection, and Ensemble Aggregation), un
cadre méthodologique qui améliore les grands modèles de langage (LLM) grâce
à un apprentissage en contexte adaptatif et l'injection de connaissances externes.
En ajustant dynamiquement les prompts selon l'ambiguïté des acronymes et en
agrégeant les prédictions d'ensemble, DACE atténue les hallucinations et gère
efficacement les scénarios à faibles ressources. Notre approche a obtenu la première
place de la compétition avec un score F1 de 0,9069.