CATI : une approche interactive de découverte et de classification de grands corpus de documents
Résumé
Dans cet article, nous présentons CATI, une application web interactive
d'exploration et de classification de documents. Notre application permet à
des utilisateurs non-informaticiens d'explorer et classifier de grandes collections
de documents pouvant contenir du texte, des images, et des méta-données telles
qu'une date, un auteur, une géolocalisation, etc... CATI fournit un ensemble
d'assistants de classification tels qu'un module de détection d'événements, ou
encore des méthodes de clustering basées sur des images et du texte. Nous montrons
que CATI permet de classifier de grands jeux de données en quelques clics,
à l'aide des assistants de classification implémentés et d'assistants permettant à
l'utilisateur de sélectionner des attributs méta-données pertinents pour la classification
d'un jeu de données.