Tehnologije poslovne inteligencije Flashcards
Na kojim tehnologijama se temelji sustav za potporu upravljanju?
Na tehnologijama poslovne inteligencije.
- Što je inteligencija?
- Na čemu počiva inteligentno ponašanje tvrtke?
- Što su BI sustavi?
- sposobnost snalaženja u novim prilikama, u rješavanju problema i iznalaženju rješenja
- na podacima, informacijama i
znanju – poslovna inteligencija - potpora odlučivanju i upravljanju – sustavi za potporu upravljanju
Što je poslovna inteligencija? Što ona čini? Što treba osigurati?
To su koncepti, metode i tehnologije unapređenja procesa odlučivanja. Unutarnje i vanjske podatke transformira u informacije prikladne za odlučivanje. Treba osigurati optimalno poslovanje u različitim uvjetima.
Nabroji tehnologije poslovne inteligencije.
- Skladišta podataka
- Područna skladišta (engl. data mart)
- Analitičke obrade
- Alati za ekstrakciju, transformaciju i učitavanje podataka (engl. ETL tools)
- Rudarenje podataka (engl. data mining)
- Informacijski portali
- Modeliranje poslovanja…
Koje su najčešće korištene tehnologije poslovne inteligencije?
- skladište podataka
- analitičke obrade
- rudarenje podataka
Nabroji razloge pojave skladišta podataka.
- Različitost (heterogenost)
- Rast količine podataka
- Neodgovarajući sadržaj i oblik podataka
- Neodgovarajući pristup podacima
Objasni različitost kao jedan od razloga pojave skladišta podataka.
- Pojava osobnih računala i alata krajnjih korisnika dovela je do rasta broja različitih aplikacija i različitih sustava za upravljanje bazama podataka.
- Razvoj računarskih komunikacija doveo je do rasta broja različitih korisnika koji pristupaju tim podacima
- različiti izvori podataka
Nabroji unutarnje izvore podataka (različitost).
- Sustav za obradu transakcija (financijski i logistički podsustavi, podsustavi prodaje, proizvodnje, ljudskih resursa)
- Sustav za potporu upravljanju (planovi, odluke, pravilnici…)
- Sustav za potporu komunikaciji i suradnji (mail…)
Nabroji vanjske izvore podataka (različitost).
Podaci konkurentnosti, ekonomski, strukovni, financijski, ekonometrijski, psihometrijski, meteorološki, demografski, marketinški podaci.
U kontekstu različitosti, kakvi zahtjevi postoje?
- opći zahtjev - povezati i učinkovito koristiti raznorodne i
razdijeljene podatke iz različitih izvora - menadžerski zahtjev - dostupni i konzistentni podatci - precizno i sažeto opisuju tvrtku i njeno okruženje
Objasni rast količine podataka kao razlog pojave skladišta podataka.
- prijelaz s hijerarhijske na relacijsku BP - usmjerenost na ubrzanje rada relacijskih baza podataka 80ih – rast broja slogova u bazi
- Složenost uvjeta poslovanja – rast broja poslovnih događaja u tvrtci i okruženju - rast količine podataka
Objasni neodgovarajući sadržaj i oblik podataka kao razlog pojave skladišta podataka.
- Podaci tekućeg karaktera – nedovoljni za kvalitetne analize -
obuhvatiti duže razdoblje – baze podataka još VEĆE - Oblik odgovora na upit, tj. razina vizualizacije ne zadovoljava potrebe korisnika
- Izvještaji u dvodimenzionalnom obliku na više desetaka stranica
Objasni neodgovarajući pristup podacima kao razlog pojave skladišta podataka.
Transakcija upit na operativnu bazu dugo traje («NEPRETRAŽIVOST» u stvarnom vremenu) i usporava transakacijsku obradu.
Što je skladište podataka?
- Izdvojeni, veliki skup podataka koji je oblikom i sadržajem
pripremljen za zahtjevne analize, kako bi se iz njega «izvukle» informacije i znanje za potrebe odlučivanja. - Usmjeren području, integriran, vremenski određen i nepromjenjiv niz podataka.
- Specifično strukturirana kopija transakcijskih podataka za izvještavanje i analizu podataka
- Centralni repozitorij svih bitnih podataka koje jedna organizacija vodi o svom poslovanju. To je baza podataka iz koje se crpe informacije za upravljačke zadatke (odlučivanje).
Što je skladištenje podataka?
Ono obuhvaća postupke pripreme i obrade podataka te dobivanja informacija potrebnih u procesu upravljanja (odlučivanja).
Obilježja skladišta podataka?
- usmjeren području
- integriran (konzistentan)
- nepromjenjiv
- vremenski određen
Što podrazumijeva usmjerenost području kao obilježje skladišta podataka?
Pokriva čitavo poslovno područje
Što podrazumijeva integriranost kao obilježje skladišta podataka?
Konzistentnost, podaci (različitih izvora) se jednom definiraju i spremaju.
Što podrazumijeva nepromjenjivost kao obilježje skladišta podataka?
Nema operativnog ažuriranja podataka (umetanja, promjena i brisanja, može samo čitanje).
Što podrazumijeva vremenska određenost kao obilježje skladišta podataka?
Omogućuje vremensku perspektivu, a podaci se spremaju kao vremenske serije.
Koji su koraci punjenja skladišta podataka?
- ekstrakcija podataka
- transformacija
- punjenje
Za operativnu bazu podataka navedi:
1. vrijeme odziva
2. operacije
3. prirodu podataka
4. organizaciju podataka
5. veličinu
6. izvore podataka
7. aktivnosti.
- sekunde
- DML
- 30-60 dana
- aplikacija
- male do velike
- operativni, unutarnji
- procesi
Za skladište podataka navedi:
1. vrijeme odziva
2. operacije
3. prirodu podataka
4. organizaciju podataka
5. veličinu
6. izvore podataka
7. aktivnosti.
- sekunde do sati
- uglavnom čitanje
- vremenske serije
- područje, vrijeme
- velike do izrazito velike
- operativni, analitički, unutarnji, vanjski
- analize
Objasni krivulje korištenja za transakcijski i analitički (SP) sustav.
Transakcijski je sustav predvidljiv, a analitički varijabilan i nepredvidljiv.
Glavna obilježja skladišta podataka (2)?
- podaci su organizirani i orijentirani na određeno područje i potpora su odlučivanju i upravljanju
- podaci su konzistentni (integrirani iz raznih izvora)
- Podaci obuhvaćaju višegodišnje razdoblje i mogu se koristi se za trend analize, predviđanje i usporedbe u vremenu (vremenske serije)
- Istovremeno podupire pojedina područja i poduzeće u cjelini
- Jednom uneseni podaci se ne mijenjaju već nadopunjuju
(nepromjenjivost podataka)
U kontekstu strukture sustava skladištenja podataka, što obuhvaća podatkovni dio?
- osnovne podatke
- agregirane višedimenzijske podatke (dimenzijski model podataka)
U kontekstu strukture sustava skladištenja podataka, što obuhvaćaju mehanizmi manipulacije podacima.
- postupci ekstrakcije i transformacije
- sustav upravljanja podacima
- postupci analitičke obrade i prezentacija
Navedi probleme se operativnim podacima.
- dirty data - s za spol, 213 za godine
- vrijednosti koje nedostaju
- različita imena za isti entitet - kupac, mušterija, klijent
- nekonzistentni podaci - promjena u podacima, npr. broj telefona klijenta
- neintegrirani podaci - podaci iz više izvora koji se trebaju kombinirati
- neispravan format - podaci o vremenu u satima, a trebamo u minutama
- previše podataka - preveliki broj stupaca
Što je ETL?
Extract, transform, load - proces transformacija podataka za korištenje u skladištu podataka. Koristi se ponajviše u domeni skladišta podataka da bi se
opisao postupak kojim se podaci iz (raznih) izvorišta prebacuju uz odgovarajuće transformacije u skladište podataka (prikaz spola može biti M/Ž, M/F, 0/1 - potrebna je transformacija samo u jedan oblik).
Koja je razlika između integracije podataka i aplikacija i ETL-a?
- Integracija podataka - postupak je u kojem podaci iz mnogih izvora
odlaze na jedno centralizirano mjesto, koje je često skladište
podataka - Integracija aplikacija je premještanje podataka između pojedinih aplikacija kako bi se one sinkronizirale (npr. sustav korisničke podrške ima iste evidencije kupaca kao i računovodstveni sustav)
- ETL - integracija podataka i integracija aplikacija dvije su vrste ETL-a.
Koraci u ETL-u?
- ekstrakcija
- čišćenje
- transformiranje (konformiranje - raznorodni izvori)
- učitavanje u dimenzijski model podataka (isporuka - deliver)
Objasni dohvaćanje i ekstrakciju podataka kao dio ETL-a.
To je prvi i vremenski najzahtjevniji korak ETL-a. Izvorišni sustavi mogu biti vrlo složeni i slabo dokumentirani - teško odrediti koje podatke trebamo dohvatiti. Prilikom dohvata podataka ne bi se smjelo mijenjati izvorišni sustav
(njegove performanse ili dostupnost).
Objasni transformaciju podataka kao dio ETL-a.
To je drugi korak ETL-a. Radi se čišćenje, transformacija i agregacija podataka tako da budu pogodni za analizu.
1. Klasičan način - nakon što se podaci dohvate i stave u pripremno
spremište podataka, na njima se naprave potrebne transformacije
pa se nakon toga učitaju u skladište podataka
2. Novi ELT pristup - podaci se dohvate i učitaju u skladište podataka pa se onda tamo provode transformacije kada dođe zahtjev za
analizu (kod Velikih podataka)
Objasni učitavanje podataka kao dio ETL-a.
To je treći korak ETL-a. Postoje dvije metode, potupno i postupno (periodički) - stvarno vremensko skladište podataka. Problemi su redoslijed, promjena sheme, kontrola (nadzor).
Koji su izazovi ETL procedura?
- Prilagođavanje opsega podataka
- Neusklađenost podataka
- Optimizacija upita
- Neadekvatni resursi i sustav podrške provedbi
- Skalabilnost