Prévision de liens dans les graphes bipartites avec attributs
Abstract
Les réseaux sociaux se modélisent fréquemment par des graphes exprimant les relations explicites ou implicites entre les entités considérées. Ces graphes sont très dynamiques: de nouveaux liens, de nouvelles entités apparaissent et disparaissent rapidement. Ce travail porte sur la prévision de liens dans les graphes bipartites dynamiques, en particulier dans le cas où des données (attributs) sont associées aux entités. Ce cas est important en pratique, notamment pour les systèmes de recommandation: la prévision de liens dans un réseau Clients/Produits revient en effet à prévoir les produits qu'un client est susceptible d'acquérir dans un avenir proche.
Le problème de prévision de liens peut s'aborder en considérant les propriétés structurelles du graphes (approches topologiques) ou via les systèmes de recommandation (eg filtrage collaboratif). Nous proposons des méthodes qui prennent en compte simultanément les attributs des noeuds et des liens. Nous illustrons ces méthodes sur le cas bien connu des graphes de collaborations scientifiques, où nos modèles utilisent à la fois les relations de co-publications et les résumés des articles.
Pour les graphes bipartites, une proposons approche basée sur les règles d'association liées au voisinage des noeuds. L'évaluation sur 4 sections d'arXiv montre que ces méthodes permettent d'obtenir, par rapport aux approches topologiques et le filtrage collaboratif, une amélioration d'AUC située entre 6% et 16%.