Etude comparée des performances de SVM multi-classes en prédiction de la structure secondaire des protéines
Résumé
Les SVM bi-classes, introduites en bioinformatique à la fin des années
90, font aujourd'hui référence pour de nombreux problèmes de traitement
de séquences biologiques. Les SVM multi-classes, de conception plus récente,
sont progressivement appliquées à ces problèmes, singulièrement en biologie
structurale prédictive. Dans cet article, nous proposons une étude comparée des
performances de trois SVM multi-classes en prédiction de la structure secondaire
des protéines. Les modèles impliqués sont celui de Weston et Watkins,
celui de Lee et co-auteurs ainsi qu'une nouvelle machine nommée M-SVM2.
Cette étude se conçoit comme une étape dans la mise au point d'une méthode de
prédiction hybride, intégrant systèmes discriminants et génératifs et s'appuyant
sur une approche hiérarchique du problème.