Interprétation automatique d'itinéraires à partir d'un corpus de récits de voyages pilotée par un usage pédagogique.
Résumé
De larges corpus à fort ancrage territorial deviennent disponibles sous
forme numérique dans les médiathèques et plus particulièrement dans les médiathèques
de dimension régionale. Les défis qu'offrent ces gigas octets de documents
bruts sont énormes en terme de traitement automatique des contenus.
Nous proposons dans cet article deux modèles computationnels et une méthode
complète permettant de réaliser un traitement automatique afin d'extraire des itinéraires
dans des textes relatant des récits de voyage. Le premier modèle est un
modèle des attendus. Il s'intéresse au concept d'itinéraire et adopte le point de
vue du pédagogue et fait intervenir très tôt les usages envisagés. Le deuxième
modèle est un modèle d'extraction, il permet de modéliser l'expression du déplacement
dans des textes du genre récit de voyage. Nous proposons alors une
méthode automatique pour : d'une part extraire et interpréter automatiquement
les déplacements d'un récit et d'autre part passer des déplacements à l'itinéraire,
c'est-à-dire alimenter de manière automatique le modèle des attendus à partir du
modèle d'extraction. Nous montrons également comment les itinéraires extraits
interviennent soit dans la phase de construction d'activités pédagogiques soit
directement comme matériau dans une activité d'apprentissage. Nous présentons
enfin ¼R, un Prototype pour l'Interprétation d'Itinéraires dans des Récits
de voyages, qui implémente notre approche. Il prend en entrée un texte brut et
fournit l'interprétation de l'itinéraire décrit dans le texte. Il permet également de
visualiser sur un fond cartographique l'itinéraire extrait.