L’archivage du Web
  Plus récemment, la BnF a engagé, à travers son département de la Bibliothèque numérique, spécialisé dans la recherche et le développement dans le champ des nouvelles technologies de l’information, des actions de coopération novatrices en matière d’archive des données numériques.
Elle s’efforce d’associer à ses travaux les pôles associés qui acceptent de l’accompagner dans ses recherches et expérimentations.
 
Petabox
C’est sur les « Petabox » que sont stockées les archives de la Toile à la BnF © BnF
L’une de ces actions innovantes concerne l’archivage des sites web au titre du dépôt légal, qui s’inscrit dans la continuité des partenariats engagés en matière de valorisation des collections par la numérisation, autour de Gallica et de ce que deviendra la Bibliothèque numérique de France : le document « né numérique » est en effet complémentaire du document numérisé. Il lui succédera progressivement.
La politique des réseaux nationaux de collaboration documentaire construits autour de la bibliothèque numérique pourrait ainsi se poursuivre en intégrant les archives de la Toile. L’idée de collaborations nouvelles autour du dépôt légal d’Internet fait son chemin car, même avec une organisation étoffée et le recours à des captures automatiques à grande échelle au moyen de robots qui « aspirent » des pans entiers de l’Internet, la BnF ne peut prétendre couvrir complètement sa mission de dépôt légal du Web sans s’appuyer sur des renforts et des compétences extérieurs.
Ce n’est pas seulement une question d’effectifs. La BnF a également besoin de recourir à des sensibilités et des expertises documentaires, qu’elle ne possède pas toujours. L’expérience menée en 2006 et 2007 avec la Fondation nationale des sciences politiques constitue un modèle intéressant. Ce projet, conduit dans le cadre de la convention de pôle associé liant les deux bibliothèques, a pris la forme d’une étude d’usage associant chercheurs, étudiants et bibliothécaires autour d’un corpus de sites et d’outils de consultation expérimentaux faisant l’objet d’un enseignement à « Sciences po » et d’observations et d’entretiens à la BnF.
L’étude a permis de recueillir les besoins des futurs utilisateurs des archives du Web et de préparer ainsi l’ouverture prochaine des accès dans les salles de lecture de la BnF. Les exemples les plus significatifs de coopération concernent les campagnes d’archivage de sites électoraux. Une collaboration avec les bibliothèques de dépôt légal imprimeur a été initiée dès 2004 à l’occasion de l’archivage des sites relatifs aux élections régionales. Les bibliothèques municipales de Lyon, Caen, Rennes et Toulouse ont été pionnières lors de ce galop d’essai.
Mais, en trois ans, la situation a considérablement évolué : nouveau support de publication, Internet s’est affirmé,
à l’occasion des campagnes électorales de 2007, comme un espace privilégié de débat politique. Partis et candidats ont utilisé toutes les ressources que leur offrait ce nouveau média, tandis que les militants s’en sont servis comme un outil d’expression aux nombreuses facettes. L’ensemble de ces sites – blogs, forums, messages audiovisuels, etc. – représente un corpus essentiel pour les futurs chercheurs et tous les citoyens. Mais les traces de cette manifestation de la vie démocratique sont menacées de disparition rapide si les institutions patrimoniales n’organisent pas leur conservation. C’est pourquoi, dès octobre 2006, la BnF a ressenti la nécessité d’archiver les sites traitant de l’élection présidentielle de 2007. Pour étendre ce projet aux élections législatives, il était indispensable de bénéficier de relais au sein de bibliothèques en région, mieux au fait de la vie politique locale, pour identifier les sites les plus actifs et les plus représentatifs de la campagne.
Le projet a impliqué huit bibliothèques dépositaires du dépôt légal imprimeur : Caen, Dijon, Lille, Limoges, Lyon, Nouméa, Poitiers et Strasbourg. L’identification et la sélection des sites à collecter ont été faites par chaque bibliothèque.
Leur liste de sites à moissonner a alors été envoyée aux techniciens de la BnF, qui se sont chargés de réaliser les collectes. Grâce au travail conjoint de la BnF et des BDLI, 3 500 sites liés aux élections législatives ont été régulièrement capturés, d’avril à juillet 2007. Ils se sont adjoints aux 2 500 sites traitant de l’élection présidentielle. On peut donc parler d’une couverture véritablement nationale de la « web campagne », l’ensemble constituant un corpus cohérent qui permettra, demain, de retracer l’appropriation du web par les acteurs politiques et par les citoyens pendant une période importante de la vie politique nationale. Pour les bibliothèques participantes réunies autour de la BnF, tête de réseau,
ce projet s’est inscrit aussi bien dans leur mission de dépôt légal que dans le cadre du recueil d’une documentation régionale et patrimoniale. Cette constitution de fonds locaux d’un nouveau genre sensibilise également les équipes impliquées aux enjeux du numérique et d’Internet en particulier. Mais cela peut aussi être l’occasion de valoriser le rôle et l’image de la bibliothèque comme vecteur de l’actualité et médiateur entre Internet et les lecteurs. À l’heure où les bibliothèques s’interrogent avec inquiétude sur leur rôle dans la société de l’information, le bénéfice de ce type de partenariat est loin d’être anodin.
La BnF envisage de poursuivre dans cette voie en associant systématiquement des bibliothèques partenaires aux futurs projets de collectes thématiques de la Toile. Ces associations pourraient être définies soit selon des critères documentaires thématiques, en fonction des thèmes, événements et priorités retenus, soit selon des critères géographiques, avec le souci constant de constituer des collections numériques qui soient le reflet de sensibilités éditoriales et d’opinion véritablement nationales.