04. Kötegelt adatfeldolgozás Flashcards

1
Q

Mi a Pig?

A
  • HADOOP-ra épülő big data platform
  • MApReduce-ra épül rá
  • bármilyen adatot képes kezelni
  • nyelve a Pig Latin
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hogyan hajtódik végre a Pig-ben megírt lekérdezés?

A
  1. Pig Latin Program
  2. Logical plan
  3. Physical plan
  4. MapReduce plan
  5. Hadoop execution
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Mi a HIVE?

A

A Hadoop ökoszisztéma adattárház megoldása.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Mi az Apache Spark?

A

Nyílt forráskódú in-memory feldolgozó keretrendszer kötegelt és folyamat alapú adatfeldolgozáshoz.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Mi az RDD?

A
  • Resilient Distributed Dataset
  • Apache Spark használja
  • nem módosítható, hibatűrő, elosztott adathalmaz párhuzamos feldolgozáshoz
How well did you know this?
1
Not at all
2
3
4
5
Perfectly