Prédiction des niveaux de risque pollinique à partir de données historiques multi-sources
Résumé
Dans la littérature scientifique, de nombreuses études montrent
que les conditions météorologiques ont un impact sur l'émission, la dispersion
et la suspension des pollens dans l'air. Plusieurs espèces allergisantes
menacent la santé des millions de personnes en France. Une information
préventive du risque d'exposition pollinique fiable constitue un réel atout
pour les allergiques. L'objectif principal de cet article est d'étudier, grâce
à des techniques d'apprentissage statistique exploitant des données historiques,
et les paramètres météorologiques du jour (J), la capacité à prédire
à 3 jours (J+3) à l'avance les niveaux de risques de présence de pollens
dans l'air sur un territoire donné (en France Métropolitaine). Nous nous
sommes intéressés à la prévision de risque pour 3 familles de pollens qui
font partie des espèces les plus allergisantes (ambroisie, cupressacées et
graminées). Pour chacun des 4 niveaux de risque considérés, l'agrégation
de modèles de régression logistique binaire par un classifieur de type Forêt
aléatoire a permis de prédire le niveau du risque pollinique avec des performances
de l'ordre de 75% à 90% d'AUC et 70% de précision et de rappel,
les confusions concernant principalement les niveaux faible et moyen.