Un modèle Bayésien de co-clustering de données mixtes
Résumé
Nous proposons un modèle de co-clustering de données mixtes et un
critère Bayésien de sélection du meilleur modèle. Le modèle infère automatiquement
les discrétisations optimales de toutes les variables et effectue un coclustering
en minimisant un critère Bayésien de sélection de modèle. Un avantage
de cette approche est qu'elle ne nécessite aucun paramètre utilisateur. De
plus, le critère proposé mesure de façon exacte la qualité d'un modèle tout en
étant régularisé. L'optimisation de ce critère permet donc d'améliorer continuellement
les modèles trouvés sans pour autant sur-apprendre les données. Les expériences
réalisées sur des données réelles montrent l'intérêt de cette approche
pour l'analyse exploratoire des grandes bases de données.