Approches Statistique et Linguistique Pour la Classification de Textes d'Opinion Portant sur les Films
Abstract
Les sites communautaires sont par nature des lieux consacrés à l'expression
et au partage d'avis et d'opinions. www.flixster.com est un exemple de
site participatif où se retrouvent chaque jour des dizaines de millions de fans
dans le but de partager leurs impressions et sentiments sur les films. Une étude
approfondie de cette richesse d'information permettrait une meilleure connaissance
des utilisateurs, de leurs attentes, de leurs besoins. Pour y parvenir, une
étape nécessaire est la classification automatique d'opinion.Dans ce papier nous
décrivons trois approches permettant de classer des textes selon l'opinion qu'ils
expriment. La première approche consiste à étiqueter lesmots porteurs d'opinion
à l'aide de techniques linguistiques, ces mots permettant par la suite de classer
les textes. La deuxième approche est basée sur des techniques statistiques. La
dernière approche est une approche hybride qui combine approche linguistique,
pour prétraiter le corpus, et approche statistique, afin de classer les textes.