Prédiction de liens dans les graphes de connaissances avec les concepts de plus proches voisins
Résumé
La nature ouverte des graphes de connaissances implique souvent
qu'ils soient incomplets. La prédiction de liens consiste à inférer de nouveaux
liens entre entités sur la base des liens existants. La plupart des approches exis-
tantes s'appuient sur l'apprentissage de vecteurs de traits latents pour l'encodage
des entités et des relations. En général cependant, les traits latents ne sont pas
facilement interprétables. Les approches à base de règles sont interprétables
mais un ensemble de règles différent doit être appris pour chaque relation. Nous
proposons une nouvelle approche qui n'a pas besoin de phase d'apprentissage
et qui peut fournir des explications intelligibles pour chaque inférence. Elle
repose sur le calcul de Concepts de plus proches voisins (Concepts of Nearest
Neighbours, CNN) pour identifier des entités similaires fondées sur des motifs
de graphe communs. La théorie de Dempster-Shafer est ensuite utilisée pour tirer
des inférences à partir des CNN. Nous évaluons notre approche sur FB15k-237,
un benchmark classique en prédiction de liens, où elle obtient de meilleures
performances que les approches existantes.