Préserver le patrimoine logiciel

Présentation de Software Heritage, plateforme de collecte, préservation et partage de logiciels via leur code source

La mission principale de Software Heritage est de collecter, préserver et partager tous les logiciels disponibles au public sous forme de code source.

L'idée est de construire une infrastructure commune à long terme, pour soutenir une variété d'applications dans les domaines du patrimoine culturel, de l'industrie et de la recherche.

L’archive Software Heritage contient déjà une quantité importante de code source ; elle inclut notamment les éléments suivants :

  • les dépôts publics de GitHub ;
  • les paquets source de la distribution Debian ;
  • les dépôts publics de l’ancien hébergeur Gitorious ;
  • les dépôts publics de l’ancien hébergeur Google Code ;
  • les versions tarball du projet GNU (à compter d’août 2015).

Tout le contenu stocké dans le dépôt « reçoit un identifiant intrinsèque unique, obtenu à l’aide de plusieurs fonctions de hachage cryptographique différentes. Une zone de recherche permet de vérifier si l’archive contient déjà le code source via son SHA1 ». Il est en outre possible de naviguer dans le contenu de l’archive en utilisant l’application Web Software Heritage.

Cette application web permet d’effectuer des recherches dans les origines logicielles (dépôts, paquets sources, etc.) déjà archivées. D'autres fonctionnalités sont envisagées comme la possibilité de soumettre directement les URL des projets susceptibles d’être archivés, la mention des métadonnées d'origine du contenu horodaté ainsi que la recherche en texte intégral du code source.


Sources


Réseaux et médias sociaux


Veille Éducation Numérique - Publication du Centre de documentation de la DGESCO