Extraction de connaissances à partir de données textuelles : application à la découverte de règles de changement d'usage des sols
Résumé
Dans le cadre de la modélisation de dynamiques spatiales, les connaissances
expertes permettent de définir des règles d'état ou de changement d'état.
Ces connaissances contribuent à la cohérence des modèles mais sont fastidieuses
à obtenir. Ce travail propose une approche d'extraction automatique de connaissances
à partir de données textuelles, appliquée aux dynamiques de changement
d'occupation et d'usage des sols en Afrique de l'Ouest. L'objectif principal est
d'identifier des segments de texte pertinents à partir d'un corpus d'articles scientifiques
en anglais, en mobilisant des méthodes de traitement automatique de
la langue et d'apprentissage automatique. Nous comparons deux approches de
classification supervisée avec une approche non supervisée reposant sur la proximité
sémantique et montrons leur capacité à identifier l'information pertinente à
partir de données non structurées.