Complémentarités de représentations vectorielles pour la similarité sémantique
Résumé
La tâche de similarité sémantique textuelle consiste à exprimer automatiquement
un nombre reflétant la similarité sémantique de deux fragments
de texte. Chaque année depuis 2012, les campagnes de SemEval déroulent cette
tâche de similarité sémantique textuelle. Cet article présente une méthode associant
différentes représentations vectorielles de phrases dans l'objectif d'améliorer
les résultats obtenus en similarité sémantique. Notre hypothèse est que différentes
représentations permettraient de représenter différents aspects sémantiques,
et par extension, d'améliorer les similarités calculées, la principale difficulté
étant de sélectionner les représentations les plus complémentaires pour
cette tâche. Notre système se base sur le système vainqueur de la campagne de
2015 ainsi que sur notre méthode de sélection par complémentarité. Les résultats
obtenus viennent confirmer l'intérêt de cette méthode lorsqu'ils sont comparés
aux résultats de la campagne de 2016.