01. Bevezetés Flashcards
1
Q
Mi jellemző a Big Data-ra?
A
Az 5 V írja le:
1. volume
2. variety
3. velocity
4. value
5. veracity
2
Q
Mi a Hadoop?
A
Egy keretrendszer adatok elosztott tárolására és feldolgozására.
3
Q
Miért nem jók az adattárházak Big Data feladatokhoz?
A
- extrém sok adathoz nehezen skálázható
- nagy adatmennyiségnél magas költségek
- relációs mivolta miatt performancia gondok
- minden adatnak sémával kell rendelkeznie
- nem struktúrát adatokat nem képes kezelni
4
Q
Mi a különbség az adattárház és a Big Data ingestion között?
A
Adattárház: ETL
Big Data: ELT (Data Lake)
5
Q
Milyen komponensekből áll a Big Data architektúra?
A
- tároló
- adatbetöltő
- batch feldolgozó
- stream feldolgozó
- orkesztrátor
- adatvizualizációs
- menedzsment
6
Q
Milyen részekre osztható fel a Hadoop?
A
- Hadoop alap
1.1. HDFS
1.2. Hadoop common (könyvtárak)
1.3. MapReduce
1.4. YARN (erőforráskezelő) - Hadoop-ra épülő szoftverek