Traitement des gros fichiers Flashcards

1
Q

Que signifie CSV?

A

« CSV » est en fait l’acronyme de « Comma-Separated Values ».
Ce qui signifie en français « Valeurs séparées par des virgules ».
Un fichier CSV est un fichier texte. Chaque ligne du texte correspond à une ligne du tableau
et les virgules correspondent aux séparations entre les colonnes.
De ce fait, une portion entre 2 virgules correspondent aux contenus d’une cellule du tableau.
Une ligne est terminée par un caractère de fin de ligne (LF ou CRLF).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quelle est la problématique des caractères de fin de ligne?

A

En passant des systèmes de transmission aux systèmes d’exploitation, la plupart des
caractères de contrôle de transfert ont perdu leur sens. Par exemple, pour finir une ligne, un
fichier va à la ligne et c’est tout.
Pour une imprimante, elle doit ramener le chariot en début de ligne (CR = Carriage Return) et
passe à la ligne suivante (LF = Line Feed) et donc à l’époque on devait lui communiquer les
deux informations.
La suite de caractères CRLF, pour désigner la fin de ligne, est depuis restée en standard dans
certains protocoles réseaux (SMTP, HTTP, FTP…).
Par ailleurs, des systèmes comme DOS et Windows ont également conservé cet usage pour
les fichiers.
Depuis Multics (1964) jusqu’à toutes les variantes Unix (et donc Linux), cette suite a été
simplifiée en LF.
Apple a également simplifié la convention de fin de ligne, mais en gardant CR, en tous cas
jusqu’à OS 9. OS X choisit nativement le format Unix, mais reconnait l’ancien format Mac.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly