Cours 2 Flashcards

Les formats

1
Q

Pourquoi la préservation numérique s’avère plus complexe que la préservation analogue?

A

Il y a une couche de complexité qui se rajoute pour la préservation, car on peut remarquer que chaque composante devient de plus en plus nombreuse. C’est-à-dire: 1 matériel, 3 systèmes d’opération, plusieurs logiciels, beaucoup plus d’objets numériques. etc.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quelles sont les composantes de l’environnement numérique?

A

OBJET NUMÉRIQUE (fichiers) – LOGICIEL (Word) – SYSTÈME D’OPÉRATION (Apple) – MATÉRIEL (postes, ordis, disques durs, etc.).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quelle est la plus petite unité de stockage : 0 et 1?

A

Le Bit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quelle est la plus petite unité de manipulation pour l’ordinateur ?

A

Le Byte

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Combien de bits y-a-t’il dans un byte?

A

Une succession de 8 bits - appelé aussi un ‘mot’.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Combien y-a-t’il de possibilité dans une succession de 8 bits?

A

256 possibilités de mots différents.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Tous les documents enregistrés sont une succession de 1 et 0. Qu’est-ce qui fait la différence?

A

Les formats

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qu’est-ce que les formats?

A

Les formats sont des spécifications de la structure des données dans un fichier numérique : la macrostructure dans le document.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quels sont des exemples de formats?

A

DOC (Word), PDF, MGP, MOV, AVI, WAV (audio), HTML (site Web).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Qu’est-ce que l’encodage?

A

L’encodage est la manière computationnelle de transformer un contenu (texte, image, etc.) en un code numérique (suite de 0 et 1 = bitstream) le représentant.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quels sont des exemples de l’encodage?

A

Exemples : ASCII, H.264 (encodage pour les MP4).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

La microstructure est l’encodage (vrai ou faux)

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

À quoi rapporte l’acronyme de l’encodage ASCII?

A

American Standard Code for Information Interchange

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Quels sont les caractères disponibles dans ASCII?

A
  • Minuscules : a à z
  • Majuscules : A à Z
  • Numéro : 0 à 9
  • Ponctuation
  • Codes de contrôles des téléscripteurs. Ex : retour chariot
  • Espace
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est-ce qui définit un format?

A

Ces spécifications de structures!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Est-ce que l’extension est un moyen fiable d’identification?

A

Non

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Qu’est-ce qui permet d’identifier un format?

A

Le Magic Number

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Le magic number est dépendant du format et c’est unique. (Vrai ou Faux)

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Qu’est-ce qu’un format propriétaire?

A
  • Documentation complète pas toujours disponible
  • Brevets et licences peuvent s’appliquer
  • Restrictions pour utilisation et modifications possibles
  • Contrats de licence susceptibles de changer
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Qu’est-ce qu’un format ouvert?

A
  • Usage illimité
  • Pas de frais de licence
  • Pas de titulaire de brevet
  • Documentation complète disponible
  • Ouvert aux modifications
21
Q

On retrouve 7 critères de sélection pour les formats. Quels sont-ils?

A
  1. Divulgation
  2. Adoption
  3. Transparence
  4. Auto-documentation
  5. Dépendances externes
  6. Impact des brevets
  7. Mécanismes de protection techniques
22
Q

En quoi consiste la divulgation?

A

(disclosure): degré d’accès aux spécifications et aux outils permettant de valider l’intégrité des documents.

  • e.g. tous les formats ouvert (open source)
23
Q

En quoi consiste l’adoption?

A

Le degré d’utilisation du format.

  • e.g. Apple ProRes, format propriétaire pourtant utilisé quelquefois pour des archives audiovisuelles.
24
Q

En quoi consiste la transparence?

A

Facilité d’accès aux contenus.

  • e.g. : si un fichier texte utilise un encodage standard (utilisation de UTF-8 dans un fichier HTML).
25
En quoi consiste l'auto-documentation?
Capacité à faciliter la gestion par l’inclusion de métadonnées (descriptives, techniques et administratives). * e.g. BWF ou MXF ou DPX
26
En quoi consiste les dépendances externes?
Degré de dépendance au matériel, système d’opération et logiciel pour sa diffusion. * e.g. PDF contre PDF/A
27
En quoi consiste l'impact des brevets?
Problématique de contrainte sur la diffusion et utilisation par des brevet. * e.g. HEVC (évolution du mp4 encombrée de brevets)
28
En quoi consiste les mécanismes de protection techniques?
Présence de mécanisme de protection comme l’encryptage qui peuvent exercer une influence sur la préservation. * e.g. DPC (format standard pour l’industrie cinématographique)
29
Quel est le format recommandé pour le PDF qui n'est pas un bon format de préservation?
PDF/A
30
Quelles sont les différences entre PDF et PDF/A?
PDF À l’origine un format propriétaire (Adobe Systems Incorporated) - Standard ISO - Documentation complète Peut contenir texte, mais aussi images, graphiques, vidéo, et audio. PDF/A Maximiser : - Indépendance à la plateforme - Auto-documentation (métadonnées) - Autonomie (pas de dépendances externes) Exemples de contraintes possibles : - Contenu audio et vidéo interdits - Police de caractères incluses et incorporées légalement pour une utilisation non-limitée et universelle - Pas d’encryptage
31
Quel sont les formats acceptés pour le DOC qui n'est pas un bon format de préservation?
ODF et DOCX
32
Quelles sont les différences entre DOC et ODF/DOCX?
DOC Format propriétaire Microsoft Word de 1997 à 2003 - Les spécifications sont disponibles depuis 2007 - Cryptage possible. ODF Open Document Format : Format ouvert dans le style Microsoft Office. - Standard international (ISO/IEC 26300-1 :2015). DOCX Open Document Format : Format Microsoft Office (ISO 29500:2008-2016). - C’est un ensemble de fichiers dans une structure basée sur ZIP.
33
Qu'est-ce que XML?
Créé pour écrire des métadonnées. Extensible Markup Language Fichier texte : un fichier XML (un .xml) est un fichier TXT dont le contenu respecte le langage XML (et dont l’encodage est normalement spécifié en début de contenu). Langage à balises pour métadonnées.
34
Qu'est-ce que HTML?
HyperText Markup Language - Fichier texte également, même principe pour les .html et les .xml. - Langage à balises pour le web.
35
Est-ce que XML et HTML sont des formats?
HTML et XML ne sont pas des formats de fichier au sens stricte du terme, ce sont des langages de programmation.
36
Quel sont les formats acceptés pour le JPG qui n'est pas un bon format de préservation?
TIFF (Non-compressé ou compressé sans perte) Format souvent recommandé pour la préservation des documents de type image. JPEG2000 - 2004 ISO standard 154444-1 - libre de droit (accord avec ayant-droit) malgré l’utilisation de technologies brevetées - Version sans perte pour la préservation - La partie codec est aussi utilisée en vidéo
37
Quel sont les formats recommandés pour le AAC et MP3 qui ne sont pas des bons formats de préservation?
BWF (audio – sans pertes) Inclusion possible de métadonnées. BWF est un WAV avec des métadonnées en plus. Le codec est pour les deux LPCM, il est non compressé! Le codec le plus simple (le ASCII de l’audiovisuel). FLAC FLAC est à la fois format (ouvert) et codec. Il est compressé sans pertes!
38
Quel sont les formats acceptés pour le AAC et MP3 qui ne sont pas des bons formats de préservation?
AIFF et WAV
39
Quel sont les formats recommandés pour le MP4 qui n'est pas un bon format de préservation?
MKV et MXF Vidéo (formats = conteneur) Attention au codec ! Plusieurs codecs possibles sont compatibles avec les spécifications de ces formats. JPEG2000 et FFVI Vidéo (codecs = contenant)
40
Quel sont les formats acceptés pour le MP4 qui n'est pas un bon format de préservation?
MOV et AVI Attention au codec ! Plusieurs codecs possibles sont compatibles avec les spécifications de ces formats.
41
Quelle est la différence entre format et encodage dans les documents textuels ?
Le TXT n’est pas un format au sens strict : Dans le fichier rtf - il n’y a pas de magic number.
42
Dans l'audiovisuel, quelle distinction faire entre format et codec (encodage) importante?
« Un format de fichier pour un enregistrement audio ou vidéo, appelé aussi conteneur ou enveloppe, sert à rassembler l’information encodée et les métadonnées qui lui sont associées (données structurées concernant des données) dans un format de fichier déterminé. » * Les formats peuvent limiter les codecs qu’ils acceptent (au minimum 1) * Un fichier aura un conteneur (un format) qui peut contenir plusieurs contenus encodés (des flux audio et/ou vidéo, appelé aussi essences) * Attention : Certaines spécifications fournissent les deux parties Format et Codec, par exemple le JPG. Il reste important de penser les deux séparément ! Le codec est l’algorithme permettant d’encoder le contenu audio et/ou vidéo. Similaire dans le principe à ASCII ou UFT-8 pour le texte mais beaucoup plus complexe. « Le codec est le format de fichier sont deux composantes distinctes d’un fichier audio ou vidéo; ces termes sont souvent utilisés incorrectement. Par exemple, le fait de définir un fichier vidéo .MOV simplement comme un fichier QuickTime ne décrit pas bien de quelle manière il peut être interprété adéquatement, car le fichier .MOV est un fichier conteneur qui pourrait encapsuler l’essence d’un enregistrement audio ou vidéo, lequel pourrait être encodé à l’aide de dizaines de codecs différents. » (BAC, 2018)
43
Que permet le Codec?
Le Codec permet la compression des flux (réduction de la taille des fichiers).
44
Qu'est-ce que la compression des flux?
« La compression des données est le processus par lequel un codec réduit la taille d’un fichier, afin qu’il exige moins d’espace de stockage et un débit binaire plus faible. Le débit binaire est la quantité de données traitées par unité de temps durant leur lecture et leur transmission. » (BAC, 2018)
45
Quelles sont les deux grands types de compression?
- Compression avec perte implique une baisse de qualité avec une perte d’information. - Compression sans perte réduit la taille tout en préservant toute l’information originelle et sans dégrader la qualité
46
Vrai ou Faux: La compression sans perte est reversible, la compression avec perte ne l'est pas.
Vrai
47
Quelles sont les étapes de la création d'un fichier audiovisuel?
1. Video Stream, Audio stream, Metadata, etc. 2. Compression 3. Encapsulation 4. .mp4, mov, .avi, etc...
48
Quelles sont les bases de connaissances sur les formats numériques?
- Des fonctions de veille technologique (e.g. obsolescence); - Une aide pour identifier et valider les formats reçus lors d’un versement; - Des informations sur les caractéristiques de chaque format, comme aide à la planification de la préservation