logo Maarch
Le format pour l’archivage

En informatique, le format peut être défini comme la manière dont un type de données est représenté dans une chaîne binaire.

Qu’est-ce qu’un format ?

En informatique, le format peut être défini comme la manière dont un type de données est représenté dans une chaîne binaire. Il sert de convention, éventuellement normalisée, utilisée par les systèmes d’information pour représenter les contenus, notamment dans le cas des documents numériques, pour que l’utilisateur puisse en prendre connaissance dans un périphérique d’affichage.

Il permet aussi aux systèmes d’échanger les données, ce qui constitue, avec les interfaces publiques et l’absence de restriction d’accès ou de mise en œuvre, une partie essentielle de la notion d’interopérabilité. Lorsque le contenu est enregistré dans un système de fichiers, on parle de format de fichier.

Ouvert, fermé, standard, pérenne ?

Un format dont les spécifications sont publiquement accessibles est appelé un format ouvert. A l’inverse, la spécification d’un format fermé est gardée secrète et n’est généralement pleinement exploitable que par un logiciel ou une suite de logiciels eux-mêmes non ouverts.

Un format normalisé fait l’objet d’une normalisation par une institution publique ou internationale (NF, ISO, W3C). Ceci permet aux organisations de prendre connaissance de la spécification dans le but d’exploiter les contenus en développant un logiciel adapté.

Un format propriétaire a été conçu par une entreprise, dans un but essentiellement commercial. Même ouvert et normalisé, l’entreprise qui en est à l’origine peut tenter d’en conserver le contrôle ou l’exclusivité en imposant des évolutions régulières, voire en ne respectant pas les spécifications dans les logiciels qu’elle publie et qui génèrent des documents dans ce format.

Certains formats fermés et propriétaires peuvent aussi devenir de facto des standards lorsqu’ils sont largement répandus et adoptés par le plus grand nombre. On pourrait penser que de tels formats, par exemple ceux utilisés par des suites bureautiques non libres, sont valides pour l’archivage de documents car ils peuvent être facilement exploités par les utilisateurs.

C’est une erreur !

D’abord la nature non libre du logiciel implique des restrictions sur l’accès à l’information contenue, car l’utilisateur doit en acquérir les droits d’utilisation. Ensuite, comme on l’a vu l’éditeur des logiciels peut décider de modifier le standard sans préavis, rendant obsolètes les versions précédentes uniquement exploitables par un logiciel assurant une forme de rétrocompatibilité. Enfin, le logiciel peut simplement ne plus être maintenu, parce que la stratégie de l’éditeur a changé ou qu’il a lui-même disparu du marché.

Pour être pérenne, un format de contenu numérique doit être soit ouvert, soit normalisé, et il doit être interopérable.

Le CINES (Centre Informatique National de l’Enseignement Supérieur) fournit sur son site internet une liste des formats de document numériques qu’il accepte pour l’archivage des documents en lien avec l’enseignement supérieur et la recherche. (cf facile.cines.fr)