Intégration des Tableaux Multidimensionnels en Pig pour l'Entreposage de Données sur les Nuages
Résumé
Les entrepôts de données et les systèmes OLAP correspondent à des
technologies d'aide à la décision. Ils permettent d'analyser à la volée de gros volumes
de données représentés en fonction d'un modèlemultidimensionnel. L'informatique
dans les nuages, sous l'impulsion des grandes compagnies telles que
Google, Microsoft ou encore Amazon, a récemment suscité une attention particulière.
Considérer l'interrogation OLAP et les entrepôts de données au sein
de telles infrastructures devient alors un enjeu majeur. Les problèmes devant
être considérés sont ceux classiques des systèmes largement distribués (interrogation
de gros volumes de données, hétérogénéité sémantique et structurelle
ou encore variabilité), mais d'un nouveau point de vue devant considérer les
spécificités de ces architectures (facturation à l'utilisation, élasticité et facilité
d'utilisation). Dans ce papier nous abordons dans un premier temps les règles
de facturation à l'utilisation pour le stockage des entrepôts de données. Nous
proposons d'utiliser des techniques de stockage pour nuages à base de tableaux
multidimensionnels. De premières expérimentations montrent l'intérêt de notre
proposition. Ensuite, nous listons des perspectives de recherche.