Développement collaboratif d'outils par des agents LLM et humains pour résoudre des problèmes complexes : application à la synthèse scientifique
Résumé
Cette démonstration présente une architecture collaborative pour le
développement itératif d'outils neuro-symboliques utilisant modèles de langage
(LLM) et intervention humaine pour la synthèse scientifique. L'approche se
concentre sur l'apprentissage de génération de contenus structurés, tels que des
articles de recherche ou des brevets, à partir d'un titre et d'un résumé initiaux.
Le processus d'apptentissage intègre quatre agents LLM principaux (Coach,
Développeur, Critique, Capitaliseur) dans une boucle de feedback humain afin
d'améliorer continuellement les performances des outils. Les contributions clés
incluent : (1) un cadre d'apprentissage itératif combinant distances sémantiques
automatisées et feedback humain ; (2) une collaboration homme-LLM pour générer
et valider des fonctions Python neuro-symboliques adaptées à des tâches
complexes ; (3) l'adaptation et l'extension à différents types de contenus (articles
scientifiques, brevets, synthèses).