Stocker n’est pas archiver

Lorsque l’on se place du point de vue de l’activité humaine dont l’Archive est le témoin, l’important réside dans le contenu informationnel, la preuve de l’activité, qui est l’objet même de la conservation.

Le terme « archivage » est bien souvent dévoyé dans le domaine des technologies de l’information.

Il est largement employé pour désigner un déplacement du stockage des données vers un espace dédié, à des fins d’optimisation des espaces utilisés couramment. La même confusion est faite avec l’archivage des documents physiques, qui pourrait être réduite à déléguer la conservation des supports à un autre service, par le biais d’un transport.

Lorsqu’on parle d’archivage numérique des documents, l’un des sujets récurrents concerne la capacité des supports de stockage à assurer la conservation de l’information binaire pour la durée souhaitée, fut-elle virtuellement illimitée.

Même si ce problème est central, conserver les données n’est pas archiver: Les technologies de stockage les plus rapides, les plus fiables, les plus pérennes, ne seront jamais en mesure que de conserver une suite de zéros et de uns inintelligibles pour un être humain.

Pour archiver, il faut donc être en mesure de restituer le contenu informationnel lorsqu’il doit être utilisé. C’est là qu’intervient la notion d’encodage ou de format de représentation, qui définit la manière dont les données binaires sont organisées. Elle doit permettre à un dispositif technique de décoder le flux binaire pour fournir à l’utilisateur une représentation intelligible de l’information contenue, le plus souvent sur un moniteur d’ordinateur.

Voici donc l’objet de cette série de publications: Nonobstant le problème du stockage des données binaires, comment s’assurer que le contenu informationnel encodé dans les formats numériques d’aujourd’hui sera exploitable dans 10, 30, 500 ans ou plus ?

Ce besoin appelle au moins trois actions essentielles :

L’identification et la caractérisation du format d’encodage des contenus numériques. Cette tâche peut être dévolue au producteur lui-même s’il possède les outils techniques et la connaissance, ou à défaut (ce qui sera le cas le plus souvent) au service qui a la responsabilité de la conservation.

La conservation de l’information sur le format et des moyens de restituer l’information à partir des contenus numériques. Le modèle OAIS intègre ceci dans son modèle conceptuel en tant qu’information de représentation.

La pérennisation des moyens techniques de restitution du contenu informationnel tout au long du cycle de vie de l’information. Deux grands axes sont aujourd’hui explorés: convertir le contenu binaire encodé dans un format qui devient obsolète vers un format plus récent ou plus pérenne, propre à être exploité par le plus grand nombre pour une période plus ou moins longue, ou bien conserver l’environnement technique qui permet de restituer l’information.