01. Bevezetés Flashcards

1
Q

Mi jellemző a Big Data-ra?

A

Az 5 V írja le:
1. volume
2. variety
3. velocity
4. value
5. veracity

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Mi a Hadoop?

A

Egy keretrendszer adatok elosztott tárolására és feldolgozására.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Miért nem jók az adattárházak Big Data feladatokhoz?

A
  1. extrém sok adathoz nehezen skálázható
  2. nagy adatmennyiségnél magas költségek
  3. relációs mivolta miatt performancia gondok
  4. minden adatnak sémával kell rendelkeznie
  5. nem struktúrát adatokat nem képes kezelni
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Mi a különbség az adattárház és a Big Data ingestion között?

A

Adattárház: ETL
Big Data: ELT (Data Lake)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Milyen komponensekből áll a Big Data architektúra?

A
  1. tároló
  2. adatbetöltő
  3. batch feldolgozó
  4. stream feldolgozó
  5. orkesztrátor
  6. adatvizualizációs
  7. menedzsment
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Milyen részekre osztható fel a Hadoop?

A
  1. Hadoop alap
    1.1. HDFS
    1.2. Hadoop common (könyvtárak)
    1.3. MapReduce
    1.4. YARN (erőforráskezelő)
  2. Hadoop-ra épülő szoftverek
How well did you know this?
1
Not at all
2
3
4
5
Perfectly