Défi EGC 2017: Modélisation Cost-Sensitive et Enrichissement de données
Résumé
La conférence EGC'2017 propose un défi dont le contexte est la gestion
des espaces verts pour la ville de Grenoble, et notamment des arbres qui y
sont présents. L'objectif est de proposer un modèle basé sur des données fournies
qui permettrait de prédire au mieux les arbres malades, ainsi que la localisation
potentielle de la maladie. Après avoir obtenu quelques résultats intéressants
avec des modèles standards, notre approche utilisant un modèle Cost-Sensitive
One Against All (CSOAA) nous permet d'obtenir une exactitude de 0,86, une
précision de 0,88, et un rappel de 0,91 sur la prédiction unilabel, et une précision/
rappel micro de 0,82/0,74 ainsi qu'une précision/rappel macro de 0,66/0,46
pour la prédiction multilabel. L'extraction de connaissances pour la tâche 2 nous
a permis de mettre en relief l'intérêt de l'ajout de données sur la nature des maladies
et la concentration de la pollution dans la ville.