RNTI

MODULAD
Découverte d'un sous-groupe optimal dans des données purement numériques
In EGC 2020, vol. RNTI-E-36, pp.25-36
Résumé
La découverte de sous-groupes dans des données étiquetées consiste à calculer des motifs dans un espace de description des objets pour faire émerger des ensembles d'objets qui ont une répartition particulière du point de vue des étiquettes, par exemple la surreprésentation d'une valeur. Découvrir des sousgroupes intéressants dans des données purement numériques - attributs et étiquette cible - a été peu traité. Généralement, on exploite des discrétisations qui engendrent une perte d'information et des résultats sous-optimaux. Nous traitons le problème du calcul d'un sous-groupe optimal au regard d'une mesure de qualité dans des données purement numériques. Nous exploitons des concepts de fermetures sur des motifs d'intervalles et des techniques d'élagage sophistiquées. Nous validons empiriquement la pertinence de notre algorithme et décrivons succinctement un cas d'application à l'optimisation de la pousse de végétaux en environnement contrôlé.