OptiClust4Rec: Optimisation du clustering des données de patients suivant une thérapie médicale pour l'aide à l'amélioration de la qualité de vie
Résumé
Lors de l'introduction de nouvelles thérapies médicales, un ensemble
de données présentant des caractéristiques sémantiques variées est recueilli auprès d'une cohorte de participants. Le recours à l'apprentissage non supervisé est privilégié comme première étape pour explorer ces données, permettant ainsi d'extraire des informations précieuses avant d'entreprendre la tâche laborieuse de l'étiquetage. Le clustering émerge comme l'une des techniques offrant un aperçu complet de l'analyse exploratoire des données, facilitant l'identification de communautés de patients. Avec OptiClust4Rec 1, nous proposons une méthodologie
visant à caractériser les groupes, fournissant ainsi des recommandations
pour les patients suivant un traitement thérapeutique. Cette approche repose sur l'utilisation de deux ensembles de données distincts : le premier contenant les données cliniques des patients et le second regroupant les réponses des patients à un questionnaire portant sur leur qualité de vie. Notre objectif principal est d'optimiser le processus de clustering et la réduction de la dimensionnalité, en nous appuyant sur des métriques concises et une analyse de la topologie des données, afin d'étiqueter efficacement les différents clusters et de générer des règles d'association pertinentes.