ATTENTION : ces archives ne sont plus tenues à jour, des liens peuvent être brisés.

Les archives de l’Internet : une étude de la BNF

Depuis 2006, la Bibliothèque nationale de France (Bnf ) a pour mission le dépôt légal de l'Internet français. Des collectes automatiques sont assurées par le service du dépôt légal numérique, dont le résultat est accessible à titre expérimental en bibliothèque de recherche. Une étude prospective et qualitative, relative à la constitution de ces archives de l'internet, a été conduite fin 2010–début 2011, auprès de ses utilisateurs potentiels, par la délégation à la stratégie et à la recherche de la Bnf, la direction des collections et la direction des services et des réseaux. Les résultats de cette étude sont en ligne.

La consultation des archives de l'internet

Depuis 2008, les archives de l'internet sont consultables à la BnF sur l’ensemble des postes des salles de lecture de la bibliothèque de recherche, selon trois modes de recherche ou de navigation : par adresse URL, par mot (mais la plus grande partie des collectes n’est pas indexée), selon quatre parcours thématiques réalisés par des bibliothécaires : le web vert - le web militant - s'écrire en ligne : journaux personnels et littéraires - cliquer, voter : l’Internet électoral.

Objectif de l'étude

L’objectif de la présente étude était de mener une enquête auprès de publics potentiels des archives de l’Internet, afin d’explorer leurs besoins en termes de contenus (collections) et de services. Il s’agissait également d’analyser leurs pratiques de recherche sur le web et leurs représentations de ces archives afin d’identifier les moyens permettant d’accroître leur consultation. Une série d’entretiens a été réalisée par la BnF auprès de chercheurs, de professionnels et d'usagers de la bibliothèque de recherche afin d’explorer les attentes et les besoins de ces publics potentiels.

Quinze entretiens ont été réalisés au sein de ces trois types de publics :
1 - Chercheurs (histoire, philosophie, sociologie, sciences et techniques) ;
2 - Professionnels (avocat, consultant marketing, documentaliste, ingénieur brevet, journaliste) ;
3 - Tout venant (usagers de la bibliothèque de recherche).

Quelques éléments de l'étude

Intérêt d'une mémoire du web

Les chercheurs

«Les chercheurs interrogés s'accordent tous sur l'intérêt de conserver une mémoire du web. Ils ont pris conscience de la volatilité de l’Internet et se sont souvent constitués leurs propres archives... La plupart des chercheurs interrogés ont déjà eu l’expérience d’un site dont la disparition ou la modification a porté préjudice à leur recherche. Le monde des blogs est considéré comme particulièrement fragile, étant souvent le fait d’amateurs, de passionnés qui n’ont pas un temps indéfini ni des moyens conséquents à consacrer à leur passion. La disparition de contenus en ligne peut être également voulue par leurs auteurs eux-mêmes, en particulier pour les sites institutionnels souhaitant effacer les traces de leurs évolutions, pour afficher un discours immuable. Cette fragilité du Web donne à son archive une « force politique ».

Les professionnels

Pour les professionnels un certain nombre de représentations du Web viennent freiner leur intérêt pour les archives de l'internet, Leur usage étant  essentiellement tourné vers l’instant présent, ils n'associent pas internet à l’idée d’archive ou d’archivage. C'est la pertinence des résultats du moment où la recherche est effectuée qui les intéressent.
Internet apparaît, pour eux , comme une masse d’informations tellement énorme qu’internet semble se suffire à lui-même et  semble constituer sa propre archive. Cette idée est renforcée par la place incontournable du moteur de recherche (Google), présentant dans sa recherche avancée une sélection par date de mise en ligne (« dernières 24h », « sept derniers jours », etc.)... Pour certains, par ailleurs, l’archivage systématique va contre une certaine naturalité de l’oubli. »
«A ces représentations, vient s’ajouter un frein important pour les professionnels : le coût humain d’un déplacement à la BNF rapporté à l’incertitude de trouver ce que l’on cherche.

Le Tout venant

«Malgré la conscience de la volatilité d'internet, l’intérêt de cet archivage est perçu de manière très différente. » Pour certains il faut tout mémoriser car tout peut être intéressant  « On ne peut pas décider pour le futur», la nécessité de conserver les sites de chercheurs amateurs, de fans, de blogs amateurs apparaissant comme une évidence. D'autres ont du mal à percevoir l’intérêt d’un archivage pour les sites qu’ils consultent : « Intérêt ? Je n’en vois pas ! ». Il suffit que ces sites aient « leurs propres archives en ligne ». Au cours de l’entretien, plusieurs personnes manifestent une difficulté à se représenter ce qu’est une archive de l’Internet. Il a été nécessaire à plusieurs reprises de réorienter l’entretien et d’expliquer à partir d’exemples précis la notion d’« état antérieur » d’un site.

Pratiques du web

Les chercheurs

«L’usage du Web est aujourd’hui omniprésent pour les chercheurs en sciences humaines. Par effet de retour, le Web devient un lieu d’exposition du chercheur lui-même, désormais actif dans les réseaux sociaux et sur les blogs. Les mots utilisés pour décrire le contenu observé insistent à la fois sur sa nouveauté et sa futilité : « dernier truc », « air du temps », « petits papiers », « petits objets », opposée aux « papiers académiques ». Cette insignifiance est précisément ce qui intéresse le chercheur : « C’est presque un début de terrain pour moi, une forme d’air du temps que j’observe, des petits objets à faire étudier à des élèves.» Pour leur recherche,  certains chercheurs développent des pratiques de veille filtrante : ils ne font plus de recherche directement sur l’Internet, mais ils paramètrent leur « écoute du Web » en sélectionnant des sources de veille. Si cette veille permet de filtrer l’information, elle lui ajoute une dimension conversationnelle dans la mesure où elle passe aujourd’hui par les réseaux sociaux comme Twitter ou Facebook. Twitter est plébiscité au détriment de la veille standard par flux RSS.»

Les professionnels

«On peut dessiner trois ensembles d’usages :
- Des recherches ciblées, indispensables pour leur activité quotidienne et situées le plus souvent « en amont » de celle-ci : accès aux publications officielles, recherche d’information sur un client, etc.
- Une veille plus fluctuante, qui vise à « sentir un peu l’air du temps », « donner la température » d’un domaine, « suivre l’actualité ». Cette veille se concentre autour des blogs...
- Un usage d’enrichissement et de contextualisation de contenus qui se situe « en aval » de l’activité habituelle : Google Earth, Street View ou Flickr. En apparence plus anecdotique, cet usage n’en dit pas moins un nouveau rapport à l’Internet depuis quelques années : donner à voir le monde à distance. Au point que Flickr fait partie des sites qu’un professionnel recommande d’archiver..»

Le tout venant

Pour le « tout venant » de la bibliothèque de Recherche (trois étudiants, un universitaire et un chercheur-amateur sur le site François-Mitterrand), les usages décrits sont à la fois spécifiques et éclatés.
Le Web comme objet d’étude à part entière est uniquement cité par un doctorant en philosophie, il utilise les moteurs de recherche classiques pour voir si les concepts sur lesquels il travaille sont « toujours actifs aujourd’hui », si « des communautés sur le Web s’y réfèrent » et de quelle manière.». Un autre, chercheur-amateur à la retraite, passionné par l’histoire de sa région natale (l’Anjou), ne consulte l’Internet qu’en complément d’une recherche préalable sur les archives papiers. Il vient d’abord consulter à la BnF les anciens journaux de sa région et teste ensuite ses découvertes sur le Web . Deux étudiants interrogés, n’ont pas de recherche sur le Web à proprement parler. Ils consultent un nombre limité de sites, uniquement professionnels ou scientifiques, qui leur fournissent des informations factuelles (chiffres, résultats d’études), toujours en lien direct avec leur recherche.»

En conclusion

Cette Etude a permis de mettre en relief les pratiques Web de la communauté des chercheurs (stratégies de recherche, utilisation des réseaux sociaux, typologie des données collectées etc..) et de connaître leur point de vue sur l'intérêt de constituer une mémoire d'internet. «Ces trois communautés s’accordent sur un point : d’une part, il est impossible de préjuger des contenus qui auront à l’avenir un intérêt pour les chercheurs professionnels et amateurs. Mais d’autre part, la sélection est légitime car elle est constitutive de tout acte d’archivage et les volumes existants la rendent inévitable. De ce point de vue, l’étude confirme que la stratégie retenue par la BnF, c’est-à-dire le « modèle intégré » associant des collectes de grande ampleur et des sélections humaines plus ciblées, apparaît comme le meilleur moyen de répondre à cette demande contradictoire.»

Sommaire de l'étude

1. Résumé exécutif

1.1. Principaux résultats
1.2. Recommandations

2. Rappel du contexte et méthodologie de l'étude

2.1. Contextes et objectifs
2.2. Constitution de l'échantillon
2.3. Liste des personnes interrogées 

3. Résultats

3.1. Les chercheurs

3.1.1. Pratiques du Web
3.1.2. Perception des archives de l’Internet
3.1.3. Contenus
3.1.4. Outils et services

3.2. Les professionnels

3.2.1. Pratiques du Web

3.2.2. Intérêt pour les archives de l’Internet

3.2.3. Recommandations et attentes

3.3. Le « tout venant » de la bibliothèque de recherche

3.3.1. Pratiques du Web

3.3.2. Contenus

3.3.3. Outils

Annexe 1 : Guide d'entretien

Annexe 2 : Liste des sites cités dans les entretiens

Consulter l’étude :
http://www.bnf.fr/documents/enquete_archives_web.pdf