Semantic Classification for Big Data Analysis
Résumé
Les Big Data peuvent être définies comme un ensemble de données contenant un énorme
volume d'informations pouvant être analysées pour découvrir des modèles inconnus et utiles. En effet, Deep Learning est une technique principalement utilisée pour faciliter l'analyse des Big Data en extrayant des abstractions complexes de haut niveau. Néanmoins, l'hétérogénéité des données représente un défi majeur dans le contexte de l'analyse des Big Data. Généralement, les fournisseurs de données utilisent différentes techniques pour représenter le même objet réel. De plus, ils manquent des méthodes pour l'automatisation de la classification des images d'entrée. Par conséquent, nous devons ajouter l'aspect sémantique dans la classification pour améliorer le processus d'analyse des Big Data. Afin de répondre à cette exigence, nous proposons une approche qui permet de sémantiser la classification en utilisant le réseau de neurones convolutifs et la mémoire sémantique. Nous appliquons l'opération de pooling pour réduire la taille des données d'entrée. Après une succession de filtres, les cartes de convolution sont concaténées dans un vecteur 1-D, puis nous utilisons la mémoire sémantique pour classer ces données d'entrée.