RNTI

MODULAD
CATI : une approche interactive de découverte et de classification de grands corpus de documents
In EGC 2022, vol. RNTI-E-38, pp.75-86
Résumé
Dans cet article, nous présentons CATI, une application web interactive d'exploration et de classification de documents. Notre application permet à des utilisateurs non-informaticiens d'explorer et classifier de grandes collections de documents pouvant contenir du texte, des images, et des méta-données telles qu'une date, un auteur, une géolocalisation, etc... CATI fournit un ensemble d'assistants de classification tels qu'un module de détection d'événements, ou encore des méthodes de clustering basées sur des images et du texte. Nous montrons que CATI permet de classifier de grands jeux de données en quelques clics, à l'aide des assistants de classification implémentés et d'assistants permettant à l'utilisateur de sélectionner des attributs méta-données pertinents pour la classification d'un jeu de données.