Prétraitement de grands ensembles de données pour la fouille visuelle
Résumé
Nous présentons une nouvelle approche pour le traitement des ensembles
de données de très grande taille en fouille visuelle de données. Les limites
de l'approche visuelle concernant le nombre d'individus et le nombre de
dimensions sont connues de tous. Pour pouvoir traiter des ensembles de données
de grande taille, une solution possible est d'effectuer un prétraitement de
l'ensemble de données avant d'appliquer l'algorithme interactif de fouille visuelle.
Pour ce faire, nous utilisons la théorie du consensus (avec une affectation
visuelle des poids). Nous évaluons les performances de notre nouvelle approche
sur des ensembles de données de l'UCI et du Kent Ridge Bio Medical
Dataset Repository.