RNTI

MODULAD
Fusion et greffes de données
In MODULAD 2001, vol. Modulad 27, pp.43-66
Résumé
La fusion statistique de fichiers a pour but de compléter un fichier "receveur" où certaines variables ne sont pas renseignées (questions non posées) à l'aide d'un ou plusieurs fichiers "donneurs" portant sur d'autres individus Le fichier donneur comprend bien sûr des variables communes ainsi que les variables d'intérêt renseignées pour tous les individus, Les remplacements de données manquantes se, font soit par des méthodes d'imputation basées sur des proches voisins (injection) soit à l'aide de méthodes explicites de type régression. Les greffes d'enquêtes poursuivent des objectifs proches, en ce sens qu'il s'agit par exemple de positionner des résultats d'un sondage (une analyse factorielle) sur ceux d'un autre en utilisant des variables passerelles, mais sans nécessairement chercher à estimer les données manquantes. Cet exposé présentera la problématique, les principales techniques utilisées, ainsi que les dangers potentiels...