Approche préventive de la qualité des données d'importation dans le contexte de la protéomique clinique
Abstract
Dans le domaine biomédical, la protéomique est confrontée à des
sources de données de plus en plus nombreuses et à des volumes de données
très importants du fait de la multiplication des technologies dites à haut débit.
L'hétérogénéité de la provenance des données implique de fait une hétérogénéité
dans la représentation et le contenu de ces données. Les données peuvent
aussi se révéler incorrectes ce qui engendre des erreurs sur les conclusions des
expériences protéomiques. Notre approche a pour objectif de garantir la qualité
initiale des données lors de leur importation dans un système d'information
dédié à la protéomique. Elle est basée sur le couplage entre des modèles représentant
les sources et le système protéomique, et des ontologies utilisées comme
médiatrices entre les modèles. Les différents contrôles que nous proposons de
mettre en place garantissent la validité des domaines de valeurs, la sémantique
et la cohérence des données lors de l'importation.