Résolution d'entités pour améliorer la qualité des données transactionnelles dans un système de santé
Résumé
Les données de santé impliquent un réseau complexe d'entités telles que les patients, les prestataires de soin et les payeurs. Suivre chaque entité du système avec un haut degré de confiance est l'un des principaux défis en matière de qualité de données dans le domaine de la santé. Souvent désigné par "résolution d'entités", l'association précise des épisodes de soins de chaque patient est essentielle pour récupérer des historiques complets. Dans cet article applicatif sur les données transactionnelles du système de santé, nous dressons d'abord un inventaire des problèmes liés a la désambiguïsation des patients comme les dissociations d'identifiants et les collisions. Ensuite, sur un jeu de données réel enregistrant plus de 150 milliards d'interactions patient-professionnel de santé, nous proposons une approche pour reconnaître les identifiants de patients issus d'erreurs ou de dédoublements. Leur filtrage nous permet d'observer une réduction de 93% de l'écart entre le nombre de patients dans nos données et le nombre de patients attendus d'après le recensement Census.