SVM incrémental, parallèle et distribué pour le traitement de grandes quantités de données
Résumé
Nous présentons un nouvel algorithme de SVM (Support Vector
Machine ou Séparateur à Vaste Marge) linéaire et non-linéaire, parallèle et
distribué permettant le traitement de grands ensembles de données dans un
temps restreint sur du matériel standard. A partir de l'algorithme de Newton-
GSVM proposé par Mangasarian, nous avons construit un algorithme
incrémental, parallèle et distribué permettant d'améliorer les performances en
temps d'exécution et mémoire en s'exécutant sur un groupe d'ordinateurs. Ce
nouvel algorithme a la capacité de classifier un million d'individus en 20
dimensions et deux classes en quelques secondes sur un ensemble de dix PC