Cours 4 Flashcards
STRATÉGIES DE PRÉSERVATION : ENTREPOSAGE; MIGRATION; ÉMULATION
Quelles sont les bonnes pratiques pour la préservation numérique?
- Faire l’inventaire
- Documenter les bits (organiser)
- Faire des sauvegardes multiples : Maximiser la diversité pour la gestion des risque - soit un incendie, crash de disque dur, etc.
- Gérer le contenu sur le long terme : Le plus difficile de ces 4, cependant ça dépend de la formation de chacun.
Quels sont les principes de bases de la préservation numérique? (rappel)
- Identité
- Intégrité
- Authenticité
Qu’est-ce que l’identité?
Identité : « L’identité d’un document fait référence aux caractéristiques qui le rendent unique et distinct des autres documents. » (Duranti et al., 2022 – trad.)
- Mécanismes (Identifiants pérennes PID) : ISBN ; DOI ; ARK ; URN …
- Passe par la gestion des identifiants pérennes.
Qu’est-ce que l’intégrité?
Intégrité : « […] la qualité d’être complet et non-corrompu dans toutes ses propriétés essentielles. » (Duranti et al., 2022 – trad.).
- L’intégrité se passe à deux niveaux
o Physique (la préservation des bits) et
o Logique (la préservation des contenus eux-mêmes)
- Capacité à avoir un document intègre.
Qu’est-ce que l’authenticité?
Authenticité : « désigne le fait qu’un document est bien ce qu’il prétend être et qu’il n’a été ni corrompu ni altéré. On peut maintenir et vérifier l’authenticité d’un document en maintenant son identité et son intégrité. » (Banat_Berger, Borgeaud et Nougaret, 2016) basé sur Interpares (voir MacNeil et al., 2005).
- Maintenance de l’identité et de l’intégrité.
Quels sont les différents niveaux de l’objet numérique et le type de préservation associé ?
- Préservation des bits : niveau physique - e.g. réplication, vérification d’intégrité (fixité).
o Intégrité physique appelé aussi Fixité (Fixity en anglais) - Préservation du contenu : niveau logique - e.g. identifiant persistants, conversion de format.
o Intégrité logique liée au propriétés significatives (propriétés essentielles)
o La question est : est-ce qu’il y a des situations ou la préservation d’un n’est pas compatible avec la préservation de l’autre.
Quelle est la stratégie de réservation au niveau physique?
Entreposage/Stockage
Quel est le but de la stratégie d’entreposage?
Le but de l’entreposage physique est de n’avoir jamais de changement dans le bitstream. Il y a toujours un entreposage à un moment donné. Les documents sont toujours entreposés quelque part.
Quelles sont des actions associées à l’entreposage?
Réplication : plusieurs copies (Le 3-2-1)
Rafraichissement : copie régulière sur support de même type (éviter le bit rot notamment mais aussi la dégradation inéluctable des supports) - Tout les supports se dégradent avec le temps donc il faut remplacer les systèmes d’entreposage.
Transfert de support : plus fiable, plus pérenne…
Vérification de l’intégrité physique (i.e. fixité) par la somme de contrôle (checksum) : plusieurs algorithmes MD5, SHA1, etc. Une somme de contrôle d’un fichier change si un seul bit du fichier est corrompu.
Les changements au niveau du contenu affectent l’intégrité du fichier.
Tout système de stockage informatique professionnel gère l’intégrité physique.
Les sciences de l’information la traite comme une métadonnée…
À quelles composantes de la préservation numérique touche l’entreposage?
OBJET NUMÉRIQUE – LOGICIEL – SYSTÈME D’OPÉRATION – MATÉRIEL
Comment peut-on savoir si un fichier a été corrompu?
Le contrôle de l’intégrité physique: des valeurs somme. On peut savoir si un fichier a été corrompu en recalculant la somme de contrôle. Un des plus simple pour calculer la somme de contrôle est l’algorithme MD5. La taille de la chaîne de contrôle reste toujours la même.
Quels sont les 4 types de supports qu’on retrouve pour l’entreposage?
- Optiques : CD, DVD, Blu-Ray
- Magnétiques : Bande (e.g. DAT), Disques durs, Disquettes (Floppy disks)
- Semi-conducteur (solide state media) : clé USB, CompactFlash, Carte mémoire SD, etc.
- « Éxotiques » : ADN, Protéines variées, Céramique, etc.
Quels sont les avantages/inconvénients à considérer quand on choisi le type de support?
- Coûts/capacité
- Pérennité
- Vitesse d’accès
- Besoins énergétiques
Quel stockage coute le moins cher pour la capacité offerte?
Le stockage sur bande est ce qui coute le moins cher pour la capacité offerte - c’est ce qu’on utilise principalement pour les audiovisuels.
Quel stockage ne faut-il PAS utiliser si on veut un stockage pérenne?
Si on veut un support pérenne, on n’ira PAS pour les supports optiques
Quel stockage ne faut-il PAS utiliser si on veut une bonne vitesse d’accès?
Si on veut une bonne vitesse d’accès, on n’ira PAS pour les exotiques.
Quelles sont les meilleurs supports pour combler les besoins énergétiques?
Les meilleurs supports pour combler les besoins énergétiques sont : les exotiques (molécules stables, besoin d’aucune ressource énergétique.
Vrai ou faux: le document numérique n’est pas un objet physique.
Faux. Le document numérique est un objet physique !
Quelles sont des règles d’entreposages?
- Environnement sans contaminants;
- Conditions environnementales stables;
- Entreposage avec prise à la terre;
- Entreposage des médias à la verticale;
- Manipulation adéquate;
- Accès limité;
- Exposition minimum au rayon du soleil et UV.
Quels sont les 7 principes de sélection?
- Longévité: au moins 10 ans ?
- Capacité: pertinente pour la quantité de données
- Viabilité: méthode robuste de détection d’erreur en lecture et écriture
- Obsolescence: basé sur des technologies éprouvées, communément disponibles
- Cout: comparaisons du rapport volume/prix
- Sensibilité: aux dommages physiques
- Tolérance: à un large éventail de conditions environnementales
Quels sont les 3 solutions d’entreposage?
- Entreposage à l’interne;
- Entreposage hébergé (infonuagique…). E.g. Duracloud ou les grands services commerciaux;
- Entreposage hybride.
Quelle est la stratégie de préservation au niveau logique?
Migration
Quelle est la définition de migration?
Un moyen de surmonter l’obsolescence technique en transférant des ressources numériques d’une génération matérielle/logicielle à l’autre. L’objectif de la migration est de préserver le contenu intellectuel des objets numériques et de conserver la possibilité pour les clients de les récupérer, de les afficher et de les utiliser d’une autre manière face à une technologie en constante évolution.
À quelles composantes de la préservation numérique touche la migration?
LOGICIEL – SYSTÈME D’OPÉRATION – MATÉRIEL