Catégorisation des évaluations dans un corpus de blogs multi-domaine
Abstract
Dans le cadre de la fouille d'opinion, nous proposons une méthode
automatique pour la détection et la catégorisation des évaluations localement
exprimées dans un corpus de blogs multi-domaine. Cette méthode s'appuie sur
deux théories linguistiques modélisant le processus d'évaluation dans le langage
naturel et sur des ressources lexicales. Nous présentons deux composants logiciels
qui s'intègrent à la plateforme UIMA 1 et qui permettent : l'extraction
automatique de structures symboliques spécifiques à l'expression évaluative et
la catégorisation des évaluations à partir des structures symboliques apprises.
L'outil de catégorisation vise en particulier à analyser la signification axiologique,
la modalité et la configuration énonciative d'une évaluation. L'objectif à
terme est d'associer les évaluations ainsi catégorisées à leur sujet.