7. HBase Flashcards
Logikai adatmodell
Táblák –> Column Familyk-ből állnak
-Logikailag összetartozó adatok
-ROW KEY –> ez alapján van azonositjuk a táblákat (PK)
-Dinamikus oszlopok
-Nem kell megadni létrehozáskor (ezért dinamikus)
-oszlop hozzáadható/kihagyható
-cella felépités: row key, column family, column, verzió
-Verzió –> beszúrás ideje/verziószám
Fizikai adatmodell
Column Family –> kiirjuk Memstore fájlba –> létrejönn HFile (ez tárolja Column Familyt és Régiók adatait)
-Adatok cellánként tárolódnak
Régió
Column Family horizontális particionálása Row Key alapján
-Régiók –> Régió Szerverekbe rendezhetők –> Ebből van shrading
HMaster
-Admin feladatokat lát el
-Adatok felosztását végzi –> elrendezi régiókat szerverekben
-Koordinálja régió szervereket
Zookeeper
Ellenőrzi a régió szerverek elérhetők-e (Heartbeat jelekkel)
-Ha nincs válasz –> gondoskodik szerver cseréről
Olvasás
Régió szerverekben – > ellenőrzi adat megvan-e cacheben
-Ha nincs –> HFile-ban nézi
Irás
WAL (Write Ahead Log)-ba bekerül aztán – > Memstore-ba
Meta table szerepe
Tartalmazza régió szerverek elhelyezkedését
WAL
Write Ahead Log
-Hiba esetén visszaállitást csinál
-Diszken van
-Kliens által kért módositás először itt tárolja
Memstore
Memória struktúra
-Diszkre irás előtt rendezi adatokat
-Van fix mérete –> addig gyujti a modositási kéréseket
-Ha betelik –> HFile-ba menti
Block Cache
Memória struktúra
-Gyakran olvasott adatokat tárol
-Ha tele lesz –> törli legrégebbi adatokat