Classification multi-label de données médicales par LSTM temporel et clustering flou
Résumé
La prévention de la santé est un aspect très important de la recherche en informatique médicale grâce à la prédiction d'événements médicaux. Dans ce travail, nous proposons une approche d'apprentissage profond pour effectuer des prédictions multi-label sur les actes de soins médicaux. L'approche proposée utilise un réseau LSTM temporel (time-aware long short-term memory) et l'étend avec des informations supplémentaires à partir d'un clustering flou du même portefeuille. Le premier mécanisme (time-aware) est utilisé pour gérer l'irrégularité temporelle entre les éléments d'une trajectoire médicale, tandis que le second mécanisme (fuzzy clustering) aide à modéliser l'hétérogénéité entre les patients et les traitements. En utilisant un large portefeuille d'actes médicaux remboursés (plus de 16 millions d'actes médicaux consommés) par une assurance médicale en France, nous montrons que notre approche surpasse les méthodes traditionnelles et d'apprentissage profond dans la classification médicale multi-label. Notre travail a pour objectif de soutenir la prévention médicale et plus largement améliorer la qualité des services de santé et des assurances.