L2. Skladište podataka, poslovna inteligencija Flashcards
Što je inteligencija?
sposobnost snalaženja u novim prilikama, u rješavanju problema i iznalaženju rješenja
Na čemu počiva inteligentno ponašanje poduzeća?
na podacima, informacijama i znanju - poslovna inteligencija
Čemu su potpora BI sustavi?
odlučivanju i upravljanju - sustavi za potporu upravljanju
Što podrazumijeva poslovna inteligencija i na koji način doprinosi odlučivanju?
- koncepte, metode i tehnologije unaprjeđenja procesa odlučivanja
- unutarnje i vanjske podatke transformira u informacije prikladne za odlučivanje
Navedi tehnologije poslovne inteligencije.
najčešće korištene: skladište podataka, analitičke obrade, rudarenje podataka
ostale: područna skladišta, alati za ekstrakciju, transformaciju i učitavanje podataka (ETL), informacijski portali, modeliranje poslovanja
Koji su razlozi pojave skladišta podataka?
- različitost (heterogenost)
- rast količine podataka
- neodgovarajući sadržaj i oblik podataka
- neodgovarajući pristup podacima
Objasni pojam različitosti zbog kojega se počinje koristiti skladište podataka.
- različite aplikacije i sustavi za upravljanje bazama podataka
- rast broja različitih korisnika koji pristupaju podacima
- različiti izvori podataka
Što sve mogu biti izvori podataka?
unutarnji:
- sustav za obradu transakcija
- sustav za potporu upravljanju
- sustav za potporu komunikaciji i suradnji
vanjski:
- podaci konkurentnosti
- ekonomski podaci
- strukovni podaci
- financijski podaci, robni podaci
- ekonometrijski podaci
- psihometrijski
- meteorološki, demografski, marketinški…
Koje dvije vrste zahtjeva postoje?
opći zahtjev - povezati i učinkovito koristiti raznorodne i razdijeljene podatke iz različitih izvora
menadžerski zahtjev - dostupni i konzistentni podaci
Što utječe na rast količine podataka?
- rast broja slogova u bazi (prijelaz s hijerarhijske na relacijsku bazu)
- rast poslovnih događaja –> rast količine podataka (složenost poslovanja)
Što podrazumijeva neodgovarajući sadržaj i oblik podataka?
- podaci tekućeg karaktera - nedovoljni za kvalitetne analize -> obuhvatiti duže razdoblje
- razina vizualizacije ne zadovoljava potrebe korisnika
- izvještaji u 2D obliku na puno stranica
Što podrazumijeva neodgovarajući pristup informaciji?
- transakcija upit na operativnu bazu dugo traje (NEPRETRAŽIVOST u stvarnom vremenu) i usporava transakcijsku obradu
Što je skladište podataka?
izdvojeni, veliki skup podataka koji je oblikom i sadržajem pripremljen za zahtjevne analize, kako bi se iz njega izvukle informacije i znanje za potrebe odlučivanja
- specifično strukturirana kopija transakcijskih podataka za izvještavanje i analizu podataka
Koje postupke obuhvaća skladište podataka?
postupke pripreme i obrade podataka te dobivanja informacija potrebnih u procesu odlučivanja
Koja su obilježja skladišta podataka?
- usmjereno području - pokriva čitavo poslovno područje
- integrirano - podaci iz različitih izvora jednom se definiraju i spremaju (konzistentni)
- vremenski određeno - omogućuje vremensku perspektivu, podaci u vremenskim serijama
- nepromjenjivo - bez operativnog ažuriranja podataka (samo osvježivanje)
Na koji se način puni skladište podataka?
podaci iz transakcijskog sustava i vanjskih izvora prolaze kroz sljedeće korake:
1. ekstrakcija
2. transformacija
3. punjenje
Koja je razlika između transakcijskog sustava i skladišta podataka (analitičkog sustava) s obzirom na predvidivost?
transakcijski sustav je predvidljiv, a SP je varijabilno i nepredvidivo
Što čini podatkovni dio u strukturi sustava skladištenja podataka?
- osnovni podaci
- agregirani višedimenzijski podaci (dimenzijski model podataka)
Koji su mehanizmi manipulacije podacima?
- postupci ekstrakcije i transformacije
- sustav upravljanja podacima
- postupci analitičke obrade i prezentacija
Navedi probleme s operativnim podacima.
- “dirty data” - npr. 213 za godine
- vrijednosti koje nedostaju
- različita imena za isti entitet
- nekonzistentni podaci - npr. br. telefona
- neintegrirani podaci - npr. podaci iz više izvora koji se trebaju kombinirati
- neispravan format
- previše podataka
Navedi dvije vrste ETL-a.
- integracija podataka
- integracija aplikacija
Što je integracija podataka?
postupak u kojem podaci iz mnogih izvora odlaze na jedno centralizirano mjesto
Što je integracija aplikacija?
premještanje podataka između pojedinih aplikacija kako bi se sinkronizirale
Gdje se najčešće koristi ETL?
u domeni skladišta podataka kako bi se opisao postupak kojim se podaci iz izvora prebacuju, uz odgovarajuće transformacije, u skladište podataka
Koji su koraci ETL-a?
- ekstrakcija
- čišćenje, transformacija
- učitavanje u dimenzijski model podataka
Objasni prvi korak ETL-a.
prvi je korak dohvaćanje i izdvajanje podataka
- ponekad je teško odrediti koje podatke trebamo dohvatiti
- izvorišni sustav mora ostati nepromijenjen
Objasni drugi korak ETL-a.
podaci se moraju očistiti, transformirati i agregirati kako bi bili pogodni za analizu
- klasičan način: dohvaćanje podataka i stavljanja u PRIPREMNO SP, transformacije, učitavanje u SP
- novi način: dohvaćanje i učitavanje podataka u SP, provođenje transformacija kada dođe zahtjev za analizu (kod Velikih podataka)
Objasni treći korak ETL-a.
postoje dvije metode: potpuno i postepeno (periodički)
- problemi: redoslijed, promjena sheme, kontrola (nadzor)
Koji su izazovi ETL procedura?
- prilagođavanje opsega podataka
- neusklađenost podataka
- optimizacija upita
- neadekvatni resursi i sustav podrške provedbi
- skalabilnost