RNTI

MODULAD
Prédiction des niveaux de risque pollinique à partir de données historiques multi-sources
In EGC 2022, vol. RNTI-E-38, pp.195-206
Résumé
Dans la littérature scientifique, de nombreuses études montrent que les conditions météorologiques ont un impact sur l'émission, la dispersion et la suspension des pollens dans l'air. Plusieurs espèces allergisantes menacent la santé des millions de personnes en France. Une information préventive du risque d'exposition pollinique fiable constitue un réel atout pour les allergiques. L'objectif principal de cet article est d'étudier, grâce à des techniques d'apprentissage statistique exploitant des données historiques, et les paramètres météorologiques du jour (J), la capacité à prédire à 3 jours (J+3) à l'avance les niveaux de risques de présence de pollens dans l'air sur un territoire donné (en France Métropolitaine). Nous nous sommes intéressés à la prévision de risque pour 3 familles de pollens qui font partie des espèces les plus allergisantes (ambroisie, cupressacées et graminées). Pour chacun des 4 niveaux de risque considérés, l'agrégation de modèles de régression logistique binaire par un classifieur de type Forêt aléatoire a permis de prédire le niveau du risque pollinique avec des performances de l'ordre de 75% à 90% d'AUC et 70% de précision et de rappel, les confusions concernant principalement les niveaux faible et moyen.