RNTI

MODULAD
Découvrir de nouvelles classes dans des données tabulaires
In EGC 2023, vol. RNTI-E-39, pp.467-474
Résumé
Dans le domaine du Novel Class Discovery (NCD), le but est de trouver de nouvelles classes dans un ensemble non étiqueté lorsqu'un ensemble étiqueté de classes connues mais différentes est disponible. Bien que le NCD ait récemment attiré l'attention de la communauté scientifique, aucune solution n'a encore été proposée pour les données tabulaires, alors qu'il s'agit d'une représentation très courante des données. Dans cet article, nous proposons une nouvelle méthode pour résoudre ce problème, dans le contexte de données tabulaires contenant des variables hétérogènes. Ce processus est en partie réalisé par une nouvelle méthode de définition de pseudo-étiquettes ainsi que par une mise en œuvre des découvertes récentes de l'apprentissage multi-tâches pour optimiser une fonction objectif conjointe. Notre méthode démontre que le NCD n'est pas seulement applicable aux images mais aussi aux données tabulaires hétérogènes.