Les nouvelles théories de l'incertain
Résumé
La notion d'incertitude a été longtemps un sujet de controverses. En particulier la prééminence
de la théorie des probabilités dans les sciences tend à gommer les différences présentes
dans les premières tentatives de formalisation, remontant au 17ème siècle, entre l'incertitude
due à la variabilité des phénomènes répétables et l'incertitude due au manque d'information
(dite épistémique). L'école Bayésienne affirme que quelle que soit l'origine de l'incertitude,
celle-ci peut être modélisée par une distribution de probabilité unique. Cette affirmation a été
beaucoup remise en cause dans les trente dernières années. En effet l'emploi systématique
d'une distribution unique en cas d'information partielle mène à des utilisations paradoxales de
la théorie des probabilités.
Dans de nombreux domaines, il est crucial de distinguer entre l'incertitude due à la variabilité
d'observations et l'incertitude due à l'ignorance partielle. Cette dernière peut être réduite
par l'obtention de nouvelles informations, mais pas la première, dont on ne se prémunit que
par des actions concrètes. Dans le cas des bases de données, il est souvent supposé qu'elles
sont précises, et l'incertitude correspondante est souvent négligée. Quant elle est abordée on
reste souvent dans une approche probabiliste orthodoxe.
Néanmoins, les statisticiens ont développé des outils qui ne relèvent pas de la théorie de
Kolmogorov pour pallier le manque de données (intervalles de confiance, principe de maximum
de vraisemblance...).
De nouvelles théories de l'incertain ont émergé, qui offrent la possibilité de représenter les
incertitudes épistémiques et aléatoires de façon distincte, notamment l'incertitude épistémique,
en remplaçant la distribution de probabilité unique par une famille de distributions possibles,
cette famille étant d'autant plus grande que l'information est absente. Cette représentation
complexe possède des cas particuliers plus simples à utiliser en pratique, comme les ensembles
aléatoires (théorie des fonctions de croyance), les distributions de possibilité (représentant des
ensembles flous de valeurs possibles) et les p-boxes, notamment.
Le but de cet exposé est de susciter l'intérêt pour ces nouvelles théories de l'incertain,
d'en donner les bases formelles, d'en discuter la philosophie sous-jacente, de faire le lien avec
certaines notions en statistique, et de les illustrer sur des exemples.