Software Heritage: que faire avec tout le code source du monde?
Abstract
Software Heritage est une initiative à but non lucratif dont l'objectif ambitieux est de col-
lecter, préserver et partager le code source de tous les logiciels jamais écrits, avec leur histo-
rique de développement complet, en construisant une base de connaissances logicielle univer-
selle. Software Heritage répond à une variété de besoins : préserver nos connaissances scienti-
fiques et technologiques, améliorer le développement et la réutilisation des logiciels pour la so-
ciété et l'industrie, favoriser la science ouverte et construire une infrastructure essentielle pour
des études logicielles reproductibles à grande échelle. Nous avons déjà collecté plus de 4 mil-
liards de fichiers sources uniques provenant de plus de 80 millions d'origines. Manipuler ce gi-
gantesque ensemble de données est une mission complexe et nécessite de nouvelles approches
pour stocker et requêter l'information d'une manière compatible avec la croissance explosive
du développement logiciel collaboratif. Dans cette conférence, nous explorons quelques uns
des nouveaux défis et opportunités que présente Software Heritage.