Apprentissage de structures séquentielles pour l'extraction d'entités et de relations dans des textes d'appels d'offres
Résumé
Dans cet article nous présentons une étude exploitant des méthodes
d'apprentissage automatique de structures séquentielles pour extraire des rela-
tions sémantiques dans des textes issus de bases d'appels d'offres. L'une des
relations que nous considérons concerne l'emprise d'un projet d'aménagement,
caractérisée par une association entre les concepts qui définissent les infrastruc-
tures (bâtiments) et les concepts qui définissent leur(s) surface(s) d'implantation.
L'étude propose une analyse comparée d'approches à base de champs condi-
tionnels aléatoires (CRF), de CRF d'ordre supérieur (H-CRF), de CRF semi-
Markoviens, Modèles de Markov cachés (HMM) et de perceptrons structurés.