Apprentissage de fonctions de tri pour la prédiction d'interactions protéine-ARN
Abstract
Les fonctions biologiques dans la cellule mettent en jeu des interactions
3D entre protéines et ARN. Les avancées des techniques exérimentales
restent insuffisantes pour de nombreuse applications. Il faut alors pouvoir prédire
in silico les interactions protéine-ARN. Dans ce contexte, nos travaux sont
focalisés sur la construction de fonctions de score permettant d'ordonner les solutions
générées par le programme d'amarrage protéine-ARN RosettaDock. La
méthodologie d'évaluation utilisée par RosettaDock impose de trouver une fonction
de score s'exprimant comme une combinaison linéaire de mesures physicochimiques.
Avec une approche d'apprentissage supervisé par algorithme génétique,
nous avons appris différentes fonctions de score en imposant des
contraintes sur la nature des poids recherchés. Les résultats obtenus montrent
l'importance de la signification des poids à apprendre et de l'espace de recherche
associé.