Khiops: outil d'apprentissage supervisé automatique pour la fouille de grandes bases de données multi-tables
Résumé
Khiops est un outil d'apprentissage supervisé automatique pour la
fouille de grandes bases de données multi-tables. L'importance prédictive des
variables est évaluée au moyen de modèles de discrétisation dans le cas numérique
et de groupement de valeurs dans le cas catégoriel. Dans le cas d'une
base multi-tables, par exemple des clients avec leurs achats, une table d'analyse
individus × variables est produite par construction automatique de variables.
Le modèle de classification utilisé est un classifieur Bayésien naïf avec sélection
de variables et moyennage de modèles. L'outil est adapté à l'analyse des
grandes bases de données, avec des millions d'individus, des dizaines de milliers
de variables et des centaines de millions d'enregistrements dans les tables
secondaires.