RNTI

MODULAD
Modèle de Langue à base de Concepts pour la Recherche d'Information
In EGC 2010, vol. RNTI-E-19, pp.91-96
Résumé
La majorité des modèles de langue appliqués à la recherche d'information repose sur l'hypothèse d'indépendance des mots. Plus précisément, ces modèles sont estimés à partir des mots simples apparaissant dans les documents sans considérer les éventuelles relations sémantiques et conceptuelles. Pour pallier ce problème, deux grandes approches ont été explorées : la première intègre des dépendances d'ordre surfacique entre les mots, et la seconde repose sur l'utilisation des ressources sémantiques pour capturer les dépendances entre les mots. Le modèle de langue que nous présentons dans cet article s'inscrit dans la seconde approche. Nous proposons d'intégrer les dépendances entre les mots en représentant les documents et les requêtes par les concepts.