RNTI

MODULAD
Une mesure de proximité et une méthode de regroupement pour l'aide à l'acquisition d'ontologies spécialisées
In EGC 2006, vol. RNTI-E-6, pp.163-174
Résumé
Cet article traite du regroupement d'unités textuelles dans une perspective d'aide à l'élaboration d'ontologies spécialisées. Le travail présenté s'inscrit dans le cadre du projet BIOTIM. Nous nous concentrons ici sur l'une des étapes de construction semi-automatique d'une ontologie qui consiste à structurer un ensemble d'unités textuelles caractéristiques en classes susceptibles de représenter les concepts du domaine. L'approche que nous proposons s'appuie sur la dénition d'une nouvelle mesure non-symétrique permettant d'évaluer la proximité entre lemmes, en utilisant leurs contextes d'apparition dans les documents. En complément de cette mesure, nous présentons un algorithme de classication non-supervisée adapté à la problématique et aux données traitées. Les premières expérimentations présentées sur les données botaniques laissent percevoir des résultats pertinents pouvant être utilisés pour assister l'expert dans la détermination et la structuration des concepts du domaine.