Apprentissage d'espaces prétopologiques dans un cadre multi-instance pour la structuration de données
Résumé
Nous présentons dans cet article une méthode supervisée de structu-
ration (en DAG) d'un ensemble d'éléments. Étant donnés une structure cible et
un ensemble de relations sur ces éléments, il s'agit d'apprendre un modèle de
structuration par combinaison des relations initiales. Nous formalisons ce pro-
blème dans le cadre de la théorie de la prétopologie qui permet d'atteindre des
modèles de structuration complexes.
Nous montrons que la non-idempotence de la fonction d'adhérence rentre dans
le cadre du formalisme de l'apprentissage (supervisé) multi-instance et nous pro-
posons un algorithme d'apprentissage reposant sur le dénombrement des «sacs»
positifs et négatifs plutôt que sur un ensemble d'apprentissage standard.
Une première expérimentation de cette méthode est présentée dans un cadre
applicatif de fouille de textes, consistant à apprendre un modèle de structuration
taxonomique d'un ensemble de termes.