Une mesure de proximité et une méthode de regroupement pour l'aide à l'acquisition d'ontologies spécialisées
Résumé
Cet article traite du regroupement d'unités textuelles dans une perspective
d'aide à l'élaboration d'ontologies spécialisées. Le travail présenté s'inscrit
dans le cadre du projet BIOTIM. Nous nous concentrons ici sur l'une des
étapes de construction semi-automatique d'une ontologie qui consiste à structurer
un ensemble d'unités textuelles caractéristiques en classes susceptibles de
représenter les concepts du domaine. L'approche que nous proposons s'appuie
sur la dénition d'une nouvelle mesure non-symétrique permettant d'évaluer la
proximité entre lemmes, en utilisant leurs contextes d'apparition dans les documents.
En complément de cette mesure, nous présentons un algorithme de
classication non-supervisée adapté à la problématique et aux données traitées.
Les premières expérimentations présentées sur les données botaniques laissent
percevoir des résultats pertinents pouvant être utilisés pour assister l'expert dans
la détermination et la structuration des concepts du domaine.