Exploitation de l'asymétrie entre termes pour l'extraction automatique de taxonomies à partir de textes
Abstract
Nous présentons dans cet article une nouvelle approche pour la génération
automatique de structures lexicales (ou taxonomies) à partir de textes.
Cette tâche est fondée sur l'hypothèse forte selon laquelle l'accumulation de
faits statistiques simples sur les usages en corpus permet d'approximer des informations
de niveau sémantique sur le lexique. Nous utilisons la prétopologie
comme cadre de travail afin de formaliser et de combiner plusieurs hypothèses
sur les usages terminologiques et enfin de structurer le lexique sous la forme
d'une taxonomie. Nous considérons également le problème de l'évaluation des
taxonomies résultantes et proposons un nouvel indice afin de les comparer et de
positionner notre approche par rapport à la littérature.