RNTI

MODULAD
GeoNLPlify : Une augmentation spatiale de corpus liés aux crises pour des tâches de classification
In EGC 2023, vol. RNTI-E-39, pp.441-448
Résumé
L'article "Deux cygnes retrouvés mort au Parc de la Tête d'Or à Lyon" parle-t-il de l'épidémie de grippe aviaire ? Nos travaux proposent d'utiliser l'information spatiale pour générer des données artificielles étiquetées afin d'améliorer les classifications de textes basées sur BERT. Ainsi, après avoir mis en évidence, par des méthodes d'explicabilité, l'importance de l'information spatiale dans les corpus liés à des crises, nous proposons différentes stratégies d'augmentation de données qui tirent profit de ce constat. Notre méthode, GeoNLPlify, est évaluée sur des jeux de données publics (PADI-web et Cri-sisNLP) et comparée aux augmentations de données classiques.