RNTI

MODULAD
Extraction de contraintes dans des spécifications de validation de données
In EGC 2022, vol. RNTI-E-38, pp.297-304
Résumé
Les spécifications de la validation de données, dans le domaine ferroviaire par exemple, sont majoritairement constituées de phrases dont les groupes verbaux expriment des contraintes à vérifier. Dans une optique d'automatisation du traitement de ces spécifications écrites en langage naturel, il est nécessaire d'identifier ces contraintes en utilisant des outils de traitement automatique de la langue. Nous avons expérimenté une approche utilisant un modèle BERT avec un apprentissage spécialisé. Une liste de contraintes à extraire, ainsi qu'un corpus de phrases et propositions syntaxiques a été élaboré pour l'entraînement, et un générateur de paraphrases a été utilisé pour pallier le manque de données. Les résultats sont encourageant, mais peuvent encore être améliorés, notamment en complétant les exemples pour l'entraînement.