RNTI

MODULAD
Approches Statistique et Linguistique Pour la Classification de Textes d'Opinion Portant sur les Films
In FDO 2009, vol. RNTI-E-17, pp.144-167
Abstract
Les sites communautaires sont par nature des lieux consacrés à l'expression et au partage d'avis et d'opinions. www.flixster.com est un exemple de site participatif où se retrouvent chaque jour des dizaines de millions de fans dans le but de partager leurs impressions et sentiments sur les films. Une étude approfondie de cette richesse d'information permettrait une meilleure connaissance des utilisateurs, de leurs attentes, de leurs besoins. Pour y parvenir, une étape nécessaire est la classification automatique d'opinion.Dans ce papier nous décrivons trois approches permettant de classer des textes selon l'opinion qu'ils expriment. La première approche consiste à étiqueter lesmots porteurs d'opinion à l'aide de techniques linguistiques, ces mots permettant par la suite de classer les textes. La deuxième approche est basée sur des techniques statistiques. La dernière approche est une approche hybride qui combine approche linguistique, pour prétraiter le corpus, et approche statistique, afin de classer les textes.