Un système d'aide à l'extraction de relations sémantiques pour la construction d'ontologies à partir de textes
Résumé
Cet article présente une méthode d'extraction de relations sémantiques
pour la construction d'ontologies à partir de corpus de textes. Notre objectif est
de proposer une méthode générique, qui soit indépendante du domaine et de la
langue. Elle repose sur une analyse distributionnelle des unités sémantiques du
corpus pour faire émerger des relations sémantiques candidates. Cette méthode
ne fait aucune hypothèse sur les types de relations recherchées ni sur leur forme
linguistique. Il s'agit de regrouper les associations de termes dans des classes
qui représentent des relations sémantiques candidates. L'hypothèse sous-jacente
est que les occurrences de ces associations réunies sur la base des éléments de
contexte qu'elles partagent ont des chances de relever d'une même relation sémantique
et que les relations candidates ainsi proposées peuvent aider le travail
de conceptualisation de l'ontologue