RNTI

MODULAD
Segmentation automatique des rapports médicaux en utilisant les réseaux de neurones convolutionnels
In EDA 2018, vol. RNTI-B-14, pp.17-30
Résumé
L'un des défis majeurs de la médecine de précision est d'orienter la recherche et le développement de solutions thérapeutiques spécifiques en exploitant les informations contenues dans les rapports médicaux. Ces rapports sont souvent maintenus sous forme de textes non structurés et constituent un volume important de données. L'extraction de connaissances à l'aide des techniques de traitement automatique de langage naturel (TALN) pourrait donc aider à améliorer les soins de santé et la prise de décisions médicales. Cette étape est souvent précédée par une phase de segmentation de textes pour bien identifier les parties du rapport d'un grand intérêt. Dans cet article, nous présentons notre système automatique de segmentation de rapports médicaux en sections sémantiques et qui consiste en deux étapes complémentaires. D'abord un algorithme basé sur la détection de titres pour l'identification de certaines sections. La deuxième partie est une tâche de classification de phrases supervisée basée sur des algorithmes d'apprentissage profond. Ce système a été testé sur 500 rapports et a atteint une précision de classification de plus de 96%.