RNTI

MODULAD
Partitionnement des données pour les problèmes de classement difficiles: Combinaison des cartes topologiques mixtes et SVM
In AAFD 2008, vol. RNTI-A-2, pp.43-64
Abstract
Dans ce papier, nous présentons un modèle pour aborder les problèmes de classement difficiles. Ces problèmes ont souvent la particularité d'avoir des taux d'erreurs en généralisations très élevés et ce quelles que soient les méthodes utilisées. Pour ce genre de problème, nous proposons d'utiliser un modèle de classement combinant le modèle de partitionnement des cartes topologiques mixtes et les machines à vecteur de supports (SVM). Le modèle non supervisé est dédié à la visualisation et au partitionnement des données composées de variables quantitatives et/ou qualitatives. Le deuxième modèle supervisé, est dédié au classement. Dans ce papier, nous présentons une combinaison de deux modèles qui permettent d'améliorer la visualisation des données et d'augmenter les performances en classement. Ce modèle consiste à entraîner des cartes autoorganisatrices pour construire une partition organisée des données, constituée de plusieurs sous-ensembles qui vont servir à reformuler le problème de classement initial en sous-problème de classement. Pour chaque sous-ensemble, on entraîne un classeur SVM spécifique. Pour la validation de notre modèle (CTSVM), nous avons utilisé quatre jeux de données. La première base est un extrait d'une grande base médicale sur l'étude de l'obésité à l'Hôpital Hôtel-Dieu de Paris, et les trois dernières bases sont issues de la littérature. Les résultats obtenus montrent l'apport de ce modèle dans la visualisation et le classement de données complexes.