RNTI

MODULAD
Construction et exploitation d'un corpus multilingue algérien pour l'analyse des opinions et des émotions
In EGC 2019, vol. RNTI-E-35, pp.321-326
Résumé
Le contenu de ce papier prend en compte la nature linguistique informelle et mixte des langues de médias sociaux qui sont associées au dialecte algérien et utilisées comme moyen d'exprimer des opinions ou des sentiments. Après avoir identifié les défis de ce type de recherche et mis en avant les spécificités du multilinguisme, une plateforme collaborative appelée TWIFIL (TWIter proFIL) pour l'annotation de données multilingues est proposée. Le résultat est un corpus de tweets annotés. Les premières informations recueillies ont permis d'enrichir les informations de chaque tweet. Des tests ont été realisés sur le corpus généré en utilisant les techniques d'apprentissage automatique.