Identification de classes non-disjointes ayants des densités différentes
Abstract
La classification recouvrante correspond à un enjeu important en classification
non-supervisée en permettant à une observation d'appartenir à plusieurs
clusters. Plusieurs méthodes ont été proposées pour faire face à cette
problématique en utilisant plusieurs approches usuelles de classification. Cependant,
malgré l'efficacité de ces méthodes à déterminer des groupes non-disjoints,
elles échouent lorsque les données comportent des groupes de densités différentes
car elles ignorent la densité locale de chaque groupe et ne considèrent
que la distance Euclidienne entres les observations. Afin de détecter des groupes
non-disjoints de densités différentes, nous proposons deux méthodes de classification
intégrant la variation de densité des différentes classes dans le processus
de classification. Des expériences réalisées sur des ensembles de données artificielles
montrent que les méthodes proposées permettent d'obtenir de meilleures
performances lorsque les données contiennent des groupes de densités différentes.