RNTI

MODULAD
Filtrage des sites Web à caractère violent par analyse du contenu textuel et structurel
In EGC 2007, vol. RNTI-E-9, pp.343-354
Résumé
Dans cet article, nous proposons une solution pour la classification et le filtrage des sites Web à caractère violent. A la différence de la majorité de systèmes commerciaux basés essentiellement sur la détection de mots indicatifs ou l'utilisation d'une liste noire manuellement collectée, notre solution baptisée, "WebAngels Filter", s'appuie sur un apprentissage automatique par des techniques de data mining et une analyse conjointe du contenu textuel et structurel de la page Web. Les résultats expérimentaux obtenus lors de l'évaluation de notre approche sur une base de test sont assez bons. Comparé avec des logiciels, parmi les plus populaires, "WebAngels Filter" montre sa performance en terme de classification.