Clustering de données relationnelles pour la structuration de flux télévisuels
Abstract
Les approches existantes pour structurer automatiquement un flux de
télévision (i.e. reconstituer un guide de programme exact et complet), sont supervisées.
Elles requièrent de grandes quantités de données annotées manuellement,
et aussi de définir a priori les types d'émissions (publicités, bandes annonces,
programmes, sponsors...). Pour éviter ces deux contraintes, nous proposons
une classification non supervisée. La nature multi-relationnelle de nos
données proscrit l'utilisation des techniques de clustering habituelles reposant
sur des représentations sous forme attributs-valeurs. Nous proposons et validons
expérimentalement une technique de clustering capable de manipuler ces données
en détournant la programmation logique inductive (PLI) pour fonctionner
dans ce cadre non supervisé.