RNTI

MODULAD
EXGRAF: Exploration et Fragmentation de Graphes au Service du Traitement Scalable de Requêtes RDF
In EDA 2020, vol. RNTI-B-16, pp.47-60
Résumé
Les facilités de représentation de données offertes par RDF ont largement contribué à son succès et sa standardisation. Il est le langage incontournable pour le Web, la Biologie, etc. En allégeant la notion de schéma, il offre une représentation flexible des données. Son adoption rapide par les fournisseurs des données a contribué à la multiplication des masses de données RDF nécessitant à la fois d'un traitement efficace et scalable. Pour satisfaire ces besoins, plusieurs systèmes ont été proposés que nous divisons en deux catégories principales : (1) les systèmes orientés-mémoire comme gStore et (2) les systèmes orientés-disque comme RDF-3X et Virtuoso. Les systèmes de la 1ère catégorie sont très gourmands en mémoire surtout lorsqu'il s'agit de traiter une masse de données RDF. Ceux qui appartiennent à la 2ème catégorie utilisent la table traditionnelle en changeant automatiquement structure logique d'une donnée RDF. En conséquence, ils sont moins performants pour des requêtes complexes. Dans cet article, nous proposons une nouvelle approche orientée-disque (appelée EXGRAF) de traitement de requêtes RDF. Elle est basée sur l'EXploration logique de graphe RDF et la Fragmentation physique de triplets RDF. Nos expérimentations en utilisant des jeux de données réelles et synthétiques montrent le bon compromis entre l'efficacité et le passage à l'échelle de EXGRAF.