RNTI

MODULAD
Perdido : librairie Python pour le geoparsing et le geocoding de textes en français
In EGC 2023, vol. RNTI-E-39, pp.573-580
Résumé
Cet article présente la librairie Python Perdido pour le geoparsing et le geocoding de textes en français. Nous présentons l'architecture générale de l'outil Perdido composée de trois couches : back-office, API et librairie Python. Nous détaillons les méthodes utilisées pour le développement de la chaîne de traitement et des différentes tâches (reconnaissance et classification des entités nommées et résolution des toponymes). Enfin, nous présentons les différentes fonctionnalités de la librairie Python et la façon de l'utiliser. La librairie est développée comme une surcouche faisant appel aux services de l'API et permet de manipuler, visualiser et exporter les résultats du geoparsing et du geocoding. Un notebook 1 Jupyter décrit, sous la forme d'un tutoriel, l'ensemble des fonctionnalités implémentées dans la librairie.