03. Fájlformátumok Flashcards
1
Q
Mely két fő csoportba oszthatók a Big Data fájlformátumok?
A
- oszlop-orientált
- sor-orientált
2
Q
Melyek a tipikus sor- és oszlop-orientált fájlformátumok?
A
Sor - JSON, CSV, AVRO
Oszlop - Parquet, ORC
3
Q
Melyek az oszlop-orientált adatformátumok előnyei?
A
- Hatékonyabb olvasás
- Könyebb tömöríthetőség
4
Q
Melyek az oszlop-orientált adatformátumok hátrányai?
A
- rekord kiolvasása lassabb
- erőforrás igényesebb írás
5
Q
Melyek a sor-orientált adatformátumok előnyei?
A
- rekord kiolvasása gyors
- adatok írása hatékonyabb
6
Q
Melyek a sor-orientált adatformátumok hátrányai?
A
- olvasás lassabb
- tömöríthetőség nehezebb
7
Q
Milyen típusai vannak a tömörítésnek?
A
- fájltömörítés
- blokktömörítés
- hálózati tömörítés
8
Q
Melyik 3 fő tömörítési technikát használják a Big Data világban?
A
- Snappy
- Gzip
- Zstd
9
Q
Mik a Snappy jellemzői?
A
- veszteségmentes
- nem felbontható
- 2x-es kompressziós ráta
- adatbázis tömörítés
10
Q
Mik a Gzip jellemzői?
A
- veszteségmentes
- nem felbontható
- 2.7-3x-os kompressziós ráta
- HTTP tömörítés
11
Q
Mik a Zstd jellemzői?
A
- veszteségmentes
- felbontható
- 2.8x-os kompressziós ráta
- valós idejű tömörítés
12
Q
Melyek a főbb Big Data fájlformátumok?
A
- CSV
- JSON
- SEQ
- Avro
- RC
- ORC
- Parquet
- Delta Lake
- IceBerg
- Arrow
13
Q
Melyek a CSV előnyei?
A
- könnyű olvashatóság
- könnyű kezelhetőség
- felbontható
14
Q
Melyek a CSV hátrányai?
A
- nem támogatja az oszlopos tárolást
- problémás a speciális karakterek tárolása
- nincs univerzális standardja
15
Q
Melyek a JSON előnyei?
A
- legtöbb alkalmazás támogatja
- támogatja a hierarchikus struktúrát