Découverte de motifs à la demande dans une base de données distribuée
Résumé
De nombreuses applications s'appuient sur des bases de données dis-
tribuées. Pourtant, peu de méthodes de découverte de motifs ont été proposées
pour les extraire sans centraliser les données. Il faut dire que cette centralisa-
tion est souvent moins coûteuse que la communication des motifs extraits. Pour
contourner cette difficulté, cet article adopte une approche parcimonieuse en
coûts de communication en fournissant à l'utilisateur des motifs à la demande.
Plus précisément, nous proposons l'algorithme DDSAMPLING qui tire un mo-
tif dans une base de données distribuée proportionnellement à son intérêt. Nous
démontrons son exactitude et analysons sa complexité en temps et en commu-
nication soulignant son efficacité. Enfin, une étude expérimentale montre sur
plusieurs jeux de données la robustesse de DDSAMPLING face aux défaillances
d'un site ou du réseau.