05. Stream adatfeldolgozás Flashcards
1
Q
Hogyan dolgozza fel a Spark a stream adatokat?
A
- Spark Streaming fogadja az adatokat és RDD kötegeket készít belőle
- Spark Engine fogadja a kötegeket (DStream) és feldolgozza
2
Q
Mi a DStream?
A
- Discretized Stream
- Spark Streaming használja
- egy folyamatos adat streamet reprezentál
- szerkezetileg RDD-k sorát jelenti
3
Q
Mi a Windowed Computation?
A
A Spark Streaming lehetőséget add egy DStream több RDD-jének egyidejű transzformálására egy kimenet érdekében. Így egy DStream intervallumai tetszőleges módon dolgozhatók fel.
4
Q
Mik az accumulators?
A
Változók, amik trackelik a futó folyamatok állapotait.
5
Q
Mik a broadcast változók?
A
A Spark Streaming lehetővé teszi a csak olvasható változók eltárolását minden klaszter cache-ben, ahelyett, hogy minding másolatokat kellene elküldenie nekik.