Extraction de contraintes dans des spécifications de validation de données
Résumé
Les spécifications de la validation de données, dans le domaine ferroviaire
par exemple, sont majoritairement constituées de phrases dont les groupes
verbaux expriment des contraintes à vérifier. Dans une optique d'automatisation
du traitement de ces spécifications écrites en langage naturel, il est nécessaire
d'identifier ces contraintes en utilisant des outils de traitement automatique de la
langue. Nous avons expérimenté une approche utilisant un modèle BERT avec
un apprentissage spécialisé. Une liste de contraintes à extraire, ainsi qu'un corpus
de phrases et propositions syntaxiques a été élaboré pour l'entraînement, et
un générateur de paraphrases a été utilisé pour pallier le manque de données. Les
résultats sont encourageant, mais peuvent encore être améliorés, notamment en
complétant les exemples pour l'entraînement.