Adattárházak Flashcards

1
Q

Adattárház

A

Tárgyorientált, integrált, az adatok történetiségét tároló, nem illékony adatrendszer, amelynek fő célja az adatokból történő hatékony információkinyerés biztosítása, elsősorban a döntéshozatali folyamatok támogatása céljából.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Tárgyorientált, tematikus

A

• Az adattárház a döntéshozók elemzési követelményeire fókuszál a döntéshozatal különböző szintjein, azaz különböző témákra, mint eladás, ügyfélviselkedés.

• Hagyományos adatbázis ezzel szemben az alkalmazások által végrehajtandó funkciókra fókuszál, azaz funkció-orientált. Például egy eladás regisztrálása.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Adattárház célja

A

• Adat olvasás
• Nagy mennyiségű adat gyors elérése
• Historikus adatok alapuló információval ellátás
• Döntéshozás támogatása

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Integrált

A

Az adattárház heterogén adatforrásokból dolgozik, de ahhoz, hogy az adatokat át tudja venni, egy szabványos formára kell alakítania, egységbe rendezve egy helyre kell gyűjtenie. Az egységes megközelítés konkrétan egyetlen kulcsstruktúrát és egyetlen adatmegjelenítési módot jelent.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Nem illékony, tartós

A

Az adattárházba bevitt adatok csak akkor tűnnek el, ha explicit módon töröljük őket. A bekerült adatok tehát tartósan meg is maradnak (akár 5-10 évig).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Idő függő

A

Az adattárház adatai történeti adatokat (historical data), több éves tevékenységeket fognak át. Az adatokat az időpontok és időintervallumok szerint tárolják és kezelik, a forrásrendszerek változását nyomon követve.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Adattárházak által támogatott alkalmazások

A

• OLAP -> adat elemzés
• DSS -> döntés támogatás
• Data Mining -> tudásfeltárás

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Adatpiac

A

Az adattárház része, mely a kiválasztott tárgyakra fókuszál. Hatóköre osztályszintű, míg az adattárházé szervezeti szintű.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Adattárházak koncepcionális felépítése

A

• ETL -> adat tisztítás és formázás
• OLAP, DSS, Data Mining -> új infó generálása

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

ETL részei

A

• Extract
• Transform
• Load

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Extract

A

Adatokat gyűjt több, heterogén adatforrásból. Az adatforrások lehetnek hagyományos adatbázisok vagy különböző formátumú állományok.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Transform

A

Az adatforrás formátumában lévő adatot átalakítja adattárház formátumúvá.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Load

A

Betölti az átalakított adatot az adattárházba. Az adattárház frissítését is magában foglalja (propagating updates). A frissítési frekvencia változó, havitól a napi többszöriig.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Adattisztítás lépései

A
  1. Elemekre bontás
  2. Szabványosítás
  3. Verifikálás
  4. Illesztés
  5. Dokumentálás
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Elemekre bontás

A

Az adatok atomi részekre bontását jelenti.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Szabványozás

A

Egységes jelölés bevezetése.

17
Q

Verifikálás

A

A szabványosított elemek konzisztenciájának ellenőrzése.

18
Q

Illesztés

A

Az aktuálisan vizsgált rekord (vagy néhány mezője) szerepel-e más helyen a céladatbázisban és tartalmában ugyanazon adatokat tartalmazza-e.

A rendszer itt a tárolt adatok alapján bizonyos belső korrelációkat tár fel, és figyeli, hogy a bejövő adatok mennyire felelnek meg a feltárt szabályszerűségeknek.

Ha egy adott nevű ügyfél már szerepel az adattárházban és egy rekordban újra találkozunk a nevével, leellenőrizhetjük, hogy a megfelelő lakcím, telefonszám, tartozik-e hozzá.

19
Q

Dokumentálás

A

Ha sikerült megtisztítanunk egy adatot, akkor ezt a folyamatot megfelelően dokumentálni kell, általában a metaadatok értelemszerű módosításával.

20
Q

Végfelhasználói eszközök

A

• OLAP eszközök -> ad hoc lekérdezések
• Riportoló eszközök -> előre definiált lekérdezések
• Statisztikai eszközök -> adatelemzés
• Adatbányászati eszközök -> tudás feltárás

21
Q

Adattárházak osztályozása

A

Adattárházak nagyságrendekkel nagyobbak, mint a forrás adatbázisok.

• Vállalatszintű
• Virtuális
• Logikai
• Adatpiac

22
Q

Vállalatszintű adattárház

A

Nagy projektek, masszív idő és erőforrás beruházással.

23
Q

Virtuális adattárházak

A

A forrásadatbázisokon (a hatékony elérés miatt) materializált nézeteket valósít meg.

24
Q

Logikai adattárházak

A

Adategyesítést, terjesztést és virtualizációt használnak.

25
Adattárházak építése
Az adattárház építőjének látnia kell, hogy az adattárházat előre láthatólag mire fogják használni. • A tervnek támogatnia kell az ad-hoc lekérdezéseket. • A megfelelő sémát kell választani az előre látható használathoz pl. marketing orientált, termék-fogyasztóra fókuszáló cég vagy non-profit jótékonysági, adományokra fókuszáló cég.
26
Adattárház tervezés lépései
• Az adatok begyűjtése az adattárház számára. • Annak biztosítása, hogy az adattárolás hatékonyan megfeleljen a lekérdezési követelményeknek. • Az adattárházat tartalmazó teljes környezet kialakítása.
27
Adat begyűjtés lépései
1. Az adatokat több, heterogén forrásból kell kinyerni. 2. Az adatokat következetesen kell formázni az adattárházban. A független forrásokból származó adatok neveit, jelentését és tartományait egyeztetni kell. 3. Az adatokat meg kell tisztítani, hogy érvényesek legyenek. 4. Az adatoknak illeszkedniük kell az adattárház adatmodelljébe. 5. Az adatokat be kell tölteni az adattárházba. A frissítési elvekhez megfelelő terv készítése.
28
Adattárolás folyamatai
• Az adatok tárolása az adattárház adatmodelljének megfelelően • A szükséges adatstruktúra létrehozása és fenntartása • Megfelelő elérési utak létrehozása és karbantartása • Időfüggő adatok biztosítása, amikor új adat érkezik • Az adattárházbeli adatok módosításának támogatása • Az adatok frissítése • Az adatok tisztítása
29
Tervezéskor figyelembe kell venni
• A használat tervezése (ki fogja használni az adattárházat és hogyan fogja használni) • Az adatmodell illeszkedése • Az elérhető források jellemzői • A metaadat komponensek tervezése • Moduláris komponensek tervezése • A kezelhetőség és a változások tervezése • Az elosztott és a párhuzamos architektúrák megfontolása • Elosztott és szövetséges (autonóm) adattárházak
30
Implementálás nehézségei
• Sok időbe telik adattárházat építeni. • A minőség és a konzisztencia fontos kérdés. • A használati igények felülvizsgálata, hogy megfeleljen az aktuális igényeknek. • Az adattárházak adminisztrációja szélesebb körű ismereteket igényel, mint a hagyományos adatbázisoké.
31
Üzleti Intelligencia
Azon technikák és eszközök halmaza, amelyek segítségével a nyers adatokat üzleti elemzési célokra alkalmas értelmes és hasznos információvá transzformálhatjuk.
32
Üzleti Intelligencia alkalmazások
• Közvetlen lekérdezés és riportoló eszköz (a felhasználók közvetlenül kérhetik le az adatokat) • Adatbányászat • Standard riportok (előredefiniáltak, formázottak) • Elemző alkalmazások • Dashboardok és scoreboardok (riportok és diagramok) • Működési (Operational) BI alkalmazások (a történetiség a fontos, az egyszerű felhasználók használják, akik az alapfeladataikat végzi, pl. ügyfélszolgálatos visszakeresi a régi címet)