Interprétation automatique d'itinéraires à partir d'un corpus de récits de voyages pilotée par un usage pédagogique.

Pierre Loustau, Mauro Gaio, Thierry Nodenot

In EGC 2008, vol. RNTI-E-13, pp.177-206

Résumé

De larges corpus à fort ancrage territorial deviennent disponibles sous forme numérique dans les médiathèques et plus particulièrement dans les médiathèques de dimension régionale. Les défis qu'offrent ces gigas octets de documents bruts sont énormes en terme de traitement automatique des contenus. Nous proposons dans cet article deux modèles computationnels et une méthode complète permettant de réaliser un traitement automatique afin d'extraire des itinéraires dans des textes relatant des récits de voyage. Le premier modèle est un modèle des attendus. Il s'intéresse au concept d'itinéraire et adopte le point de vue du pédagogue et fait intervenir très tôt les usages envisagés. Le deuxième modèle est un modèle d'extraction, il permet de modéliser l'expression du déplacement dans des textes du genre récit de voyage. Nous proposons alors une méthode automatique pour : d'une part extraire et interpréter automatiquement les déplacements d'un récit et d'autre part passer des déplacements à l'itinéraire, c'est-à-dire alimenter de manière automatique le modèle des attendus à partir du modèle d'extraction. Nous montrons également comment les itinéraires extraits interviennent soit dans la phase de construction d'activités pédagogiques soit directement comme matériau dans une activité d'apprentissage. Nous présentons enfin ¼R, un Prototype pour l'Interprétation d'Itinéraires dans des Récits de voyages, qui implémente notre approche. Il prend en entrée un texte brut et fournit l'interprétation de l'itinéraire décrit dans le texte. Il permet également de visualiser sur un fond cartographique l'itinéraire extrait.

Aperçu Voir bibtex

Télécharger