Topic modeling neuronal non-paramétrique pour l'extraction d'insight client : une application à l'industrie du pneumatique
Résumé
À l'ère des médias sociaux, les clients sont devenus des faiseurs d'opinion : toute personne intéressée par un produit peut rechercher des avis sur les plateformes d'internet. Le web-scraping reste souvent la seule voie d'accès, et malgré le recours à l'ETL, l'hétérogénéité des données rend la tâche d'extraction d'insight ardue et induit le besoin d'outils ad-hoc. Pour contourner ce problème, nous appliquons l'Embedded Dirichlet Process et l'Embedded Hierarchical Di-richlet Process dans un cadre industriel autour du cas du pneumatique. Ces topic models non-paramétriques apprennent les thèmes et leur nombre, des plongements de thèmes et des plongements de mots, de telle sorte à désambiguïser les mots et à offrir davantage de niveaux analytiques. Ils peuvent également servir à affiner des processus ETL. L'EDP et l'EHDP atteignent des niveaux de vraisemblance similaires voire plus élevés que ceux des techniques de l'état de l'art testées, sans ré-exécutions pour trouver le nombre de thèmes.