Augmentation de données des agents conversationnels pour une application ressources humaines
Résumé
Les chatbots sont des agents conversationnels conçus afin d'engager
des conversations textuelles avec des utilisateurs finaux. Ils ont fait l'objet de
plusieurs recherches scientifiques et expérimentales dans les universités ainsi
que dans l'industrie depuis l'émergence des techniques de l'intelligence artificielle
et de traitement automatique du langage naturel. L'obtention des données
d'apprentissage est cruciale pour la création des agents conversationnels. La majorité
des chatbots nécessite la collecte des intentions ainsi que l'ensemble des
expressions en langage humain, etc. Il s'agit généralement d'un processus manuel
et fastidieux nécessitant des outils automatiques de génération de données
d'apprentissage permettant de construire des chatbots robustes. L'une des solutions
pour optimiser ce processus est l'augmentation de données. Cet article vise
à étudier l'impact de l'augmentation de données sur la performance des chatbots
construits sous Rasa, un outil open source pour générer les agents conversationnels.
Des expérimentations ont été menées sur des données réelles. Il s'agit des
données de ressources humaines permettant de construire un chatbot générique
au sein de l'entreprise Alcatel-Lucent Enterprise (ALE).