AlasQA : Système Neurosymbolique de Questions-Réponses sur Graphes de Connaissances
Résumé
Nous nous intéressons à la tâche d'interrogation d'un graphe de
connaissances en langue naturelle. Les graphes de connaissances peuvent être
interrogés de façon fiable via des langages formels comme SPARQL. Toutefois
cela exige une traduction complexe du langage naturel vers le langage formel.
Les grands modèles de langue (LLM) sont capables de répondre directement aux
questions en langue naturelle mais n'offrent aucune garantie concernant la validité
des réponses qu'ils génèrent. Nous proposons un système neurosymbolique,
appelé AlasQA, qui répond à des questions posées en langue naturelle en combinant
la fiabilité d'un langage formel comme SPARQL et la puissance des LLMs.
La proposition s'appuie sur un outil intermédiaire de construction interactive de
requêtes SPARQL. Des expérimentations menées sur les jeux de données QALD
et TEXT2SPARQL valident l'intérêt de cette approche hybride.