Exploration de données de traçabilité issues de la RFID par apprentissage non-supervisé
Résumé
La RFID (Radio Frequency IDentification) est une technologie avancée d'enregistrement
de données spatio-temporelles de traçabilité. L'objectif de ce travail est de transformer ces
données spatio-temporelles en connaissances exploitables par les utilisateurs par l'intermé-
diaire d'une méthode de classification automatique des données. Les systèmes RFID peuvent
être utilisés pour étudier les sociétés animales, qui sont des systèmes dynamiques complexes
caractérisés par beaucoup d'interactions entre les individus (Fresneau et al., 1989). Le cadre
applicatif choisi pour ce travail est l'étude de la structure d'un groupe d'individus en interaction
sociale et en particulier la division du travail au sein d'une colonie de fourmis1.
La RFID générant d'importants volumes de données, il est nécessaire de développer des
méthodes appropriées afin d'en comprendre le sens. Nous proposons pour cela un algorithme
de classification topographique non-supervisée pour l'exploration de ce type de données, ca-
pable de détecter les groupes d'individus exprimant le même comportement. L'algorithme
DS2L-SOM (Density-based Simultaneous Two-Level - SOM, Cabanes et Bennani (2008)) est
capable de détecter non seulement les groupes définis par une zone vide de donnée, grâce à
une estimation de la pertinence des connexions entre référents, mais aussi les groupes défi-
nis seulement par une diminution de densité, grâce à une estimation de la densité autour des
référents pendant l'apprentissage.