Classer, discriminer et visualiser des séquences d'événements
Résumé
Cet article 1 présente un ensemble d'outils destiné à analyser des séquences
d'événements en sciences sociales et à visualiser les résultats obtenus.
Nous commençons par formaliser la notion de séquence d'événements avant de
définir une mesure de dissimilarité entre ces séquences afin de construire des
typologies et de tester les liens entre ces séquences et d'autres variables d'intérêts.
Initialement définie par Moen (2000), cette mesure se base sur la notion de
distance d'édition entre séquences et permet d'identifier les différences d'ordonnancement
et de temporalité des événements. Nous proposons une extension de
celle-ci afin de pouvoir prendre en compte la simultanéité des événements ainsi
qu'une méthode de normalisation qui garantit le respect de l'inégalité triangulaire.
Dans un deuxième temps, nous présentons un ensemble d'outils destinés
à interpréter les résultats. Nous proposons ainsi deux méthodes de visualisation
d'un ensemble de séquences et nous introduisons la notion de sous-séquence
discriminante qui permet d'identifier les différences d'ordonnancement des événements
les plus significatives entre groupes. L'ensemble des outils présentés est
disponible au sein de la librairie R TraMineR.