Cours 4 Flashcards

STRATÉGIES DE PRÉSERVATION : ENTREPOSAGE; MIGRATION; ÉMULATION

1
Q

Quelles sont les bonnes pratiques pour la préservation numérique?

A
  1. Faire l’inventaire
  2. Documenter les bits (organiser)
  3. Faire des sauvegardes multiples : Maximiser la diversité pour la gestion des risque - soit un incendie, crash de disque dur, etc.
  4. Gérer le contenu sur le long terme : Le plus difficile de ces 4, cependant ça dépend de la formation de chacun.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quels sont les principes de bases de la préservation numérique? (rappel)

A
  1. Identité
  2. Intégrité
  3. Authenticité
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qu’est-ce que l’identité?

A

Identité : « L’identité d’un document fait référence aux caractéristiques qui le rendent unique et distinct des autres documents. » (Duranti et al., 2022 – trad.)
- Mécanismes (Identifiants pérennes PID) : ISBN ; DOI ; ARK ; URN …
- Passe par la gestion des identifiants pérennes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est-ce que l’intégrité?

A

Intégrité : « […] la qualité d’être complet et non-corrompu dans toutes ses propriétés essentielles. » (Duranti et al., 2022 – trad.).
- L’intégrité se passe à deux niveaux
o Physique (la préservation des bits) et
o Logique (la préservation des contenus eux-mêmes)
- Capacité à avoir un document intègre.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Qu’est-ce que l’authenticité?

A

Authenticité : « désigne le fait qu’un document est bien ce qu’il prétend être et qu’il n’a été ni corrompu ni altéré. On peut maintenir et vérifier l’authenticité d’un document en maintenant son identité et son intégrité. » (Banat_Berger, Borgeaud et Nougaret, 2016) basé sur Interpares (voir MacNeil et al., 2005).

  • Maintenance de l’identité et de l’intégrité.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quels sont les différents niveaux de l’objet numérique et le type de préservation associé ?

A
  • Préservation des bits : niveau physique - e.g. réplication, vérification d’intégrité (fixité).
    o Intégrité physique appelé aussi Fixité (Fixity en anglais)
  • Préservation du contenu : niveau logique - e.g. identifiant persistants, conversion de format.
    o Intégrité logique liée au propriétés significatives (propriétés essentielles)
    o La question est : est-ce qu’il y a des situations ou la préservation d’un n’est pas compatible avec la préservation de l’autre.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quelle est la stratégie de réservation au niveau physique?

A

Entreposage/Stockage

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quel est le but de la stratégie d’entreposage?

A

Le but de l’entreposage physique est de n’avoir jamais de changement dans le bitstream. Il y a toujours un entreposage à un moment donné. Les documents sont toujours entreposés quelque part.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quelles sont des actions associées à l’entreposage?

A

 Réplication : plusieurs copies (Le 3-2-1)
 Rafraichissement : copie régulière sur support de même type (éviter le bit rot notamment mais aussi la dégradation inéluctable des supports) - Tout les supports se dégradent avec le temps donc il faut remplacer les systèmes d’entreposage.
 Transfert de support : plus fiable, plus pérenne…

 Vérification de l’intégrité physique (i.e. fixité) par la somme de contrôle (checksum) : plusieurs algorithmes MD5, SHA1, etc. Une somme de contrôle d’un fichier change si un seul bit du fichier est corrompu.
 Les changements au niveau du contenu affectent l’intégrité du fichier.
 Tout système de stockage informatique professionnel gère l’intégrité physique.
 Les sciences de l’information la traite comme une métadonnée…

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

À quelles composantes de la préservation numérique touche l’entreposage?

A

OBJET NUMÉRIQUE – LOGICIEL – SYSTÈME D’OPÉRATION – MATÉRIEL

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Comment peut-on savoir si un fichier a été corrompu?

A

Le contrôle de l’intégrité physique: des valeurs somme. On peut savoir si un fichier a été corrompu en recalculant la somme de contrôle. Un des plus simple pour calculer la somme de contrôle est l’algorithme MD5. La taille de la chaîne de contrôle reste toujours la même.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quels sont les 4 types de supports qu’on retrouve pour l’entreposage?

A
  • Optiques : CD, DVD, Blu-Ray
  • Magnétiques : Bande (e.g. DAT), Disques durs, Disquettes (Floppy disks)
  • Semi-conducteur (solide state media) : clé USB, CompactFlash, Carte mémoire SD, etc.
  • « Éxotiques » : ADN, Protéines variées, Céramique, etc.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quels sont les avantages/inconvénients à considérer quand on choisi le type de support?

A
  • Coûts/capacité
  • Pérennité
  • Vitesse d’accès
  • Besoins énergétiques
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Quel stockage coute le moins cher pour la capacité offerte?

A

Le stockage sur bande est ce qui coute le moins cher pour la capacité offerte - c’est ce qu’on utilise principalement pour les audiovisuels.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Quel stockage ne faut-il PAS utiliser si on veut un stockage pérenne?

A

Si on veut un support pérenne, on n’ira PAS pour les supports optiques

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quel stockage ne faut-il PAS utiliser si on veut une bonne vitesse d’accès?

A

Si on veut une bonne vitesse d’accès, on n’ira PAS pour les exotiques.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Quelles sont les meilleurs supports pour combler les besoins énergétiques?

A

Les meilleurs supports pour combler les besoins énergétiques sont : les exotiques (molécules stables, besoin d’aucune ressource énergétique.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Vrai ou faux: le document numérique n’est pas un objet physique.

A

Faux. Le document numérique est un objet physique !

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Quelles sont des règles d’entreposages?

A
  • Environnement sans contaminants;
  • Conditions environnementales stables;
  • Entreposage avec prise à la terre;
  • Entreposage des médias à la verticale;
  • Manipulation adéquate;
  • Accès limité;
  • Exposition minimum au rayon du soleil et UV.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Quels sont les 7 principes de sélection?

A
  • Longévité: au moins 10 ans ?
  • Capacité: pertinente pour la quantité de données
  • Viabilité: méthode robuste de détection d’erreur en lecture et écriture
  • Obsolescence: basé sur des technologies éprouvées, communément disponibles
  • Cout: comparaisons du rapport volume/prix
  • Sensibilité: aux dommages physiques
  • Tolérance: à un large éventail de conditions environnementales
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Quels sont les 3 solutions d’entreposage?

A
  • Entreposage à l’interne;
  • Entreposage hébergé (infonuagique…). E.g. Duracloud ou les grands services commerciaux;
  • Entreposage hybride.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Quelle est la stratégie de préservation au niveau logique?

A

Migration

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Quelle est la définition de migration?

A

Un moyen de surmonter l’obsolescence technique en transférant des ressources numériques d’une génération matérielle/logicielle à l’autre. L’objectif de la migration est de préserver le contenu intellectuel des objets numériques et de conserver la possibilité pour les clients de les récupérer, de les afficher et de les utiliser d’une autre manière face à une technologie en constante évolution.

24
Q

À quelles composantes de la préservation numérique touche la migration?

A

LOGICIEL – SYSTÈME D’OPÉRATION – MATÉRIEL

25
Parle-t-on de migration pour les fichiers (logiciel) ou supports (matériel)?
Nous parlerons toujours de migration pour les fichiers (logiciel) dans ce cours et pas pour les supports (matériel). Dans ce cours on parle de migration de format de fichier - prendre un fichier dans une technologie (dans un format) et le migrer dans une nouvelle technologie - exporter ou changer le format.
26
Est-ce que la migration change le bitstream?
Oui, la migration change le bitstream : perte d’intégrité physique !
26
Qu'est-ce qui change quand le format est migré?
Quand le format est changé (Word vers PDF), la somme de contrôle change. La migration est une atteinte à l’intégration physique. Le nombre de bits change et la taille du format aussi.
27
Que veut préserver la migration?
La migration en préservation veut préserver l’intégrité logique !
28
À quoi équivaut la préservation du contenu intellectuel?
Les propriétés significatives (propriétés essentielles)
29
La migration est rarement réversible: version ou format - vrai ou faux?
Vrai
30
Qu'est-ce que la question de la migration va établir?
À partir du moment où il y a un changement de technologie, il y a une perte d’intégrité physique. La question de la migration va être d’établir la gestion des pertes acceptables.
31
Comment garder l'authenticité malgré la perte d'intégrité physique durant la migration?
- Focus sur l’intégrité logique; - Les propriétés significatives sont ces aspects de l’objet numérique qui doivent être préservés afin d’assurer qu’il reste accessible et porteur de sens tout en changeant de technologie au fil du temps; - Établir les pertes acceptables.
32
Quelles sont quelques propositions de types de propriétés significatives?
- Contenu (texte, image) - Contexte (métadonnées) - Apparence (e.g. mise en page, niveaux de couleur, polices de caractère) - Comportement (e.g. Interaction, déclenchements, fonctionnalités) - Structure (e.g. pagination, sections, attachement dans un courriel)
33
Est-ce que la propriété significative est respectée durant la numérisation?
Propriété significative n’est pas respectée durant la numérisation.
34
Quelles sont les 4 types de migrations?
Migration 1: normalisation Migration 2: Migrer vers de nouvelles versions ou des standards à l’obsolescence (just in time) Migration 3: migration sur requète Migration 4: Pas de migration
35
Qu'est-ce que la Migration 1: normalisation?
* Migration vers des formats standard à l’arrivée dans le dépôt numérique
36
Que sont les avantages et limitations de la migration 1: normalisation?
AVANTAGE * contrôle de la complexité et du coût en supportant un nombre limité de formats LIMITATION * Beaucoup de traitement. * Veille technologique toujours nécessaire (formats évoluent; nouveaux formats) * Formats non supportés
37
Qu'est-ce que la migration 2: Migrer vers de nouvelles versions ou des standards à l’obsolescence (just in time)?
Repose sur la veille technologique de formats.
38
Que sont les avantages et limitations de la migration 2: Migrer vers de nouvelles versions ou des standards à l’obsolescence (just in time)?
AVANTAGE * Gestion de traitement * Pas de restrictions de formats (à l’entrée) LIMITATION * Repousser des limitations de capacité de traitement
39
Quelle est la différence entre migration 1 et migration 2?
On peut tout récupérer. Cependant, on se retrouve avec des problèmes au moment du traitement. Stratégie quand même utilisée, car plus économique que Migration 1.
40
Qu'est-ce que la migration 3: migration sur requête?
Préserver juste les bits (niveau physique) jusqu’à ce que des usagers demandent l’accès au fichier, ce qui déclenchera la migration au format prévu.
41
Que sont les avantages et limitations de la migration 3: migration sur requête?
AVANTAGE * Le plus économique LIMITATION * Danger de perte important
42
Comment comparer la migration 3 à la migration 1 et 2?
Migration la plus économique - on a aucune historique des versions. Un grand problème est que les contenus les moins demandés vont être perdus sur le long terme.
43
Qu'est-ce que la migration 4?
4ème migration: pas faire de migration - c’est la plus dangereuse.
44
Quelle est la stratégie de préservation au niveau logie + physique?
Émulation
45
En quoi porte l'émulation?
Un moyen de surmonter l’obsolescence technologique du matériel et des logiciels en développant des techniques d’imitation des systèmes obsolètes sur les futures générations d’ordinateurs. (Digital Preservation Coalition, 2015, trad.)
46
Qu'est-ce que l'émulation?
Couche simulant ce qui est sensé se trouver en dessous : OBJET NUMÉRIQUE – LOGICIEL – SYSTÈME D’OPÉRATION – MATÉRIEL : Une interface qui permet de simuler ce qu’il y a en dessous. Ça peut être l’installation d’un système d’opération sur simulation qu’il est dans le bon opérateur.
47
Qu'est-ce que l'émulation fournit?
Fournir un environnement technique qui permet d’accéder au document comme à l’époque de sa création.
48
Qu'est-ce que le niveau physique dans la préservation numérique?
Niveau physique : garder le document dans son état technologique d’origine – OBJET NUMÉRIQUE.
49
Qu'est-ce que le niveau logique dans la préservation numérique?
Niveau logique : propriétés significatives importantes pour l’émulation (artéfacts créés). - Exemple : vitesse de défilement dans les premiers émulateurs de jeux vidéo.
50
Est-ce que l'émulation a toujours été fiable pour la préservation de l'information numérique?
Non, Il y a 10 ans, l’émulation n’était pas fiable pour la préservation de l’information numérique.
51
Quels sont les 4 critères pour la sélection d'une stratégie?
1. Faisabilité 2. Pérennité 3. Applicabilité 4. Adéquation
52
En quoi consiste la faisabilité dans les critères de sélection?
Faisabilité : possession du matériel et des logiciels permettant l’application de la stratégie.
53
En quoi consiste la pérennité dans les critères de sélection?
Pérennité : la méthode devrait être applicable indéfiniment; ou il devrait y avoir une méthode envisagée pour prendre le relai si la première n’est plus viable.
54
En quoi consiste l'applicabilité dans les critères de sélection?
Applicabilité : l’implémentation devrait être dans des limites raisonnables de cout et de difficulté.
55
En quoi consiste l'adéquation dans les critères de sélection?
Adéquation : l’approche choisie doit être pertinente pour les objets spécifiques à préserver et les objectifs de leur préservation.