Apprendre à classer des textes hospitaliers rédigés en anglais selon la classification CIM-9 avec une approche par budget
Résumé
Le codage médical vise à annoter les comptes rendus médicaux selon les diagnostics et les traitements. Cette tâche est liée à la facturation clinique. Dernièrement, le codage automatique est devenu un domaine de recherche actif pour lequel de nombreux modèles, utilisant des architectures basées sur des réseaux neuronaux, ont été proposés. La plupart de ces approches sont validées sur le jeu de données MIMIC-III. Dans cet article, nous revenons sur la qualité de ce jeu et proposons un nouveau découpage. Puis, nous expérimentons un classificateur basé sur une approche par budget dont l'objectif est de faciliter ce codage en adaptant le nombre de codes à plusieurs combinaisons de contraintes.