12. Multidimenzionális modellezés I. Flashcards

1
Q

Multidimenzionális modellezés 4 komponense

A

Cél: Több szempontból adatok megismerése
Adatkocka –> 3 dimenzió, 3 élen

Fő komponensek:
-Tények
-Dimenziók
-Hierarchia
-Aggregációk

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Tények

A

Adat típus:
-numerikus: pld. nyereség
-enumerikus: konstansok halmaza

Származás:
-forrásból
-ETL-ben számolt
-On The Fly –> riportban számoljuk ki

Kimball konszolidációs szabályai:
-additív –> minden dimenzió fele lehet aggregálni
-féladditív –> pld. idő dimenziónál nem lehet
-nem additív –> pld. százalékok

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Dimenziók

A

Felhasználó szemszögéből vett nézet egy üzleti mutató számra
-Bármennyi oszlop
-Elsődleges kulcsa –> FK a ténytáblában
-adatok denormalizáltak (ismétlődések)
-véges számú hierarchiai kapcsolat (pld termék –> altermék)
-Tartalmaz legalább 1db Hierarchia objektumot (Level of Graduality Node) és virtuális All-Node-t
-Dimenzió modellezésnek egységesnek kell lennie (kimball)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hierarchiák

A
  1. Lapos struktúra
  2. Lapos + All Node
  3. Kiegyensúlyozott fa
  4. Kiegyensúlyozattlan fa
  5. Párhuzamos struktúra
  6. Heterarchia (több-többhöz)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Aggregációs szabályok

A

additív –> összeadható
féladditív –> csak bizonyos dimenziók mentén lehet összeadni
nem additív –> nem összeadható, más aggregáló műveletek esetleg (avg, min, max)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Csillagséma

A

Klasszikus séma
1db ténytábla, több dimenzió
Denormalizált adatok

+Átlátható,Egyszerű
+Kevés join-t kell használni –> gyors olvasás

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Galaxis és Hópehely séma

A

Galaxis séma:
-csillag séma kibővítése (kimball)
-2db/több ténytábla –> 1/több közös dimenzió –> galaxis
-dimenzión keresztül egyik tényből átmehetünk másikba

Hópehely:
-csillagséma normalizálása (3NF) –> (leíró adatokat nem akarjuk ismétlődően tárolni)

+Költséges join műveletek elkerülése a cél –> dimenziók normalizálása

How well did you know this?
1
Not at all
2
3
4
5
Perfectly