13. Multidimenziós modellezés II. Flashcards
SCD és 4 megvalósítás
SCD (Slowly Changing Dimension)
-Lassan változó dimenziók –> dimenzió tartalma idővel változik
Elkell dönteni, hogyan kezeljük ezeket.
4 típus (kimball)
Type 0
-AS OF –> (Eredetihez)
Ha elkezdek egy struktúra alapján riportolni, ugyanazon szeretném folytatni
Type 1
-AS IS –> (Aktuálishoz)
Ha változik valami akkor az aktuális struktúrához lássuk a mutatókat
Type 2
-AS POSTED –> (idő szerinti –> abban az időben aktuálist nézem)
Type 3
-AS OF + AS IS
-új oszlopok –> jelenlegi érték, másik hisztorikus érték
Többnyelvűség a dimenziókban
Feliratok, címkék, attribútumok riportban –> több nyelvű megjelenítés
Minden dimenzió táblát új oszlop –> language code
-Szükség van minden nyelvi kulcs mellé üzleti kulcsra –> összetett kulcs
Megfelelő nyelv kiválasztása BI eszközben –> language setting
-language kódra szűrünk lekérdezésnél
Nyomon követhetőség (traceability)
Visszatudjuk követni –> Mikor és Honnan került be egy rekord
pld. Milyen betöltési folyamat illesztette be a rekordot –> nyomon követhetőség
DWH-ban megvalósítás
-Load_Timestamp –> dokumentálja mikor lett beillesztve rekord
-Load_Process –> melyik betöltéssel
Source_System –> melyik forrásból
+Hiba analízis
+Adatminőségi probléma elemzésnél
Hiba protokol
Integráció során egyes rekordok –> elutasításra kerülhetnek
Ennek több oka is lehet
pld. adatípus nem egyezik, érvénytelen érték stb.
Ezeket hiba táblázatokban tároljuk –> mi, miért lett elutasítva, melyik forrásból stb.
Előaggregációk
Riportok teljesítményének optimalizálására –> előre elvégzett számításokkal
+komplex dolgokat előre elvégezzük
+Gyorsabb lekérdezés
+kevesbb terhelés
-Ezeket is tárolni kell valahol
-Nem mindig legfrissebb adatok