RNTI

MODULAD
Reconnaissance d'entités nommées itérative sur une structure en dépendances syntaxiques avec l'ontologie NERD
In EGC 2019, vol. RNTI-E-35, pp.81-92
Résumé
La reconnaissance des entités nommées (REN) consiste à repérer des éléments textuels et à les classer dans des catégories prédéfinies (noms de per- sonnes, d'organisations, de marques, d'équipes sportives, etc.). La REN est sou- vent considérée comme l'une des briques de fondation des systèmes visant à structurer un texte tout-venant. Dans cet article, nous décrivons notre système symbolique de REN qui se caractérise par 1) l'utilisation de ressources diction- nairiques limitées et 2) la prise en compte de résultats provenant d'autres briques telles que la résolution de coréférences et l'extraction de relations. Le système est basé sur la sortie d'un analyseur syntaxique en dépendances qui adopte un flot d'exécution itératif intégrant des résultats d'autres briques d'analyse. À chaque itération, des catégories candidates sont générées et sont toutes prises en compte dans les itérations suivantes. L'intérêt d'un tel système est de sélectionner défi- nitivement le meilleur candidat uniquement à la fin du traitement afin de tenir compte de l'ensemble des éléments fournis par les différentes briques. Le sys- tème est comparé à des systèmes académiques et industriels.