Annotation sémantique de pages web
Résumé
Cet article présente un système automatique d'annotation sémantique
de pages web. Les systèmes d'annotation automatique existants sont essentiellement
syntaxiques, même lorsque les travaux visent à produire une annotation
sémantique. La prise en compte d'informations sémantiques sur le domaine pour
l'annotation d'un élément dans une page web à partir d'une ontologie suppose
d'aborder conjointement deux problèmes : (1) l'identification de la structure
syntaxique caractérisant cet élément dans la page web et (2) l'identification du
concept le plus spécifique (en termes de subsumption) dans l'ontologie dont
l'instance sera utilisée pour annoter cet élément. Notre démarche repose sur la
mise en oeuvre d'une technique d'apprentissage issue initialement des wrappers
que nous avons articulée avec des raisonnements exploitant la structure formelle
de l'ontologie.