Une mesure de similarité entre phrases basée sur des noyaux sémantiques
Résumé
Nous proposons une nouvelle approche pour le calcul de similarité sémantique
entre phrases en utilisant les noyaux sémantiques qui les composent.
Ces noyaux, sous la forme de triplets (sujet, verbe et objet) sont supposés porteurs
de l'information des phrases dont ils sont extraits. Sur la base de la comparaison
sémantique de noyaux, on extrait un ensemble d'indicateurs descriptifs.
Nous utilisons ensuite un apprentissage automatique, sur un benchmark contenant
des phrases dont la similarité sémantique a été évaluée par des experts humains,
afin de déterminer l'importance de chaque indicateur et de construire
ainsi un modèle capable de fournir une mesure de similarité sémantique entre
phrases. Les expérimentations et les études comparatives, effectuées avec d'autres
approches permettant l'estimation des similarités sémantiques entre phrases,
montrent les bonnes performances de notre approche. En se basant sur cette dernière,
un outil de navigation sémantique est en cours de développement.