RNTI

MODULAD
Méthodes à noyaux appliquées aux textes structurés
In AAFD 2008, vol. RNTI-A-2, pp.185-207
Résumé
Cet article ébauche un état de l'art sur l'utilisation des noyaux pour le traitement des données structurées. Les applications modernes de la fouille de données sont de plus en plus confrontés à des données structurées, notamment textuelles. Les algorithmes d'apprentissage doivent donc être capables de tirer parti des informations apportées par la structure, ce qui pose d'intéressants problèmes de représentation des données. L'une des approches possibles consiste à utiliser les noyaux de Mercer. Ces noyaux permettent de calculer la similarité entre deux données de type quelconque, et peuvent être utilisés par une large gamme d'algorithmes d'apprentissage (Machines à Vecteur de Support, ACP, Analyse Discriminante, Perceptron, etc). Nous présentons dans cet article les principaux noyaux proposés ces dernières années pour le traitement des structures telles que les séquences, les arbres et les graphes.