266-280 Flashcards

1
Q

Šta su sistemi za podršku odlučivanju?

A

Sistemi za podršku odlučivanju su sistemi koji služe za pružanje informacija od strateškog značaja.
Osnovne teme u okviru podrške odlučivanju su: prikupljanje i održavanje velikih kolekcija
podataka, i analiziranje tih kolekcija podataka.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Šta su skladišta podataka? Po čemu se razlikuju od uobičajenih
baza podataka za obradu transakcija?

A

POGLEDAJ PITANJA
Skladišta podataka su baze podataka koje su projektovane specifično za podršku odlučivanju i ne
koriste se za transakcionu upotrebu. Osnovna namena je analitička obrada podataka, nad podacima
koji nisu „sasvim“ ažurni. Prilagođene su čitanju i analizi podataka. Nisu pogodne za redovno
ažuriranje.
Skladište podataka je prostor za prikupljanje istorijskih podataka, koji se integrisano upotrebljavaju
radi pružanja podrške odlučivanju.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Navesti i objasniti specifične zahteve pri projektovanju skladišta
podataka.

A
  • Podaci se organizuju tematski – teme odgovaraju grupama i vrstama podataka. Teme su
    obično međusobno nezavisne u odnosu na transakcije. Svaka tematska oblast se posebno
    projektuje i implementira u SP. Za svaku temu se definiše: cilj prikupljanja informacija;
    specifikacija vrsta i granularnosti podataka koji se prikupljaju; način i period prikupljanja i
    ažuriranja podataka; struktura dela baze podataka koji se odnosi na temu.
  • Mogućnost integrisanja podataka – iako se svaka tematska celina projektuje i implementira
    nezavisno, korisno je da postoji mogućnost integrisanja. Integrisanje tema radi izvođenja
    složenijih uporednih analiza. Integrisanje izvora – podaci se sakupljaju iz više izvora i
    integrišu u celinu.
  • Podaci su nepromenljivi (tokom obrade) – podaci se ažuriraju periodično i masovno.
  • Ažuriranje se odvija periodično, u masovnim paketima - obično se svodi na dodavanje
    novih pripremljenih podataka. Podaci se prečišćavaju da bi se izbacili nepouzdani i
    nerelevantni podaci. Transformišu se da bi se čuvali u odgovarajućem obliku. SP se puni
    tako pripremljenim podacima. Mehanizmi za osvežavanje prate izmene i po potrebi iniciraju
    novi ciklus ažuriranja.
  • Podaci su često potrebni na različitim nivoima granularnosti – analize su efikasnije ako
    podaci već postoje pripremljeni na svim tim različitim nivoima. Svi viši nivoi se mogu
    izvesti iz nižih, ali to zahteva dodatnu obradu.
  • Fleksibilnost u odnosu na zahteve i ciljeve – poslovno okruženje je veoma dinamično. SP
    mora da bude dovoljno fleksibilno da omogući što jednostavnije proširivanje skupa
    posmatranih podataka.
  • Mogućnost „menjanja istorije“ i „buduće istorije“ radi analiza tipa „šta ako“ – za ovakve
    namene može da se iskoristi horizontalno particionisanje
  • Specifične korisničke aplikacije sa odgovarajućim korisničkim interfejsom
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Opisati i objasniti životni ciklus skladišta podataka.

A
  1. Prikupljanje i analiza zahteva – analiza krajnjih zahteva i ciljeva; pravljenje specifikacija
    zahteva; definisanje arhitekture i okvirno planiranje kapaciteta, uređaja i alata. U osnovi
    odgovara konceptualnom projektovanju.
  2. Logičko projektovanje – projektovanje tabela i pogleda skladišta podataka. Kao osnova se
    koristi „dimenziono modeliranje“ – osnovni oblik je zvezdasta shema; koristi se i shema
    pahuljice.
  3. Fizičko projektovanje - projektovanje indeksa (indeksi spajanja, indeksi pretraživanja, često
    se pravi mnogo indeksa); projektovanje materijalizovanih pogleda; projektovanje particija
    (horizontalno, vertikalno).
  4. Distribuiranje podataka – obično se teži da SP budu centralizovana, ako je neophodno onda
    se distribuiraju na više računara u jednom centru, samo zbog performansi. Projektuju se
    particionisanje, replikacija i raspoređivanje podataka.
  5. Implementacija, praćenje i menjanje – pravljenje tabela, pogleda, skriptova i drugih
    metapodataka.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Šta je zvezdasta shema? Kada se, zašto i kako koristi?

A

U centru pažnje je jedna velika tabela činjenica. Sve dodatne informacije se zapisuju u
dimenzionim tabelama. Na sve podatke u dimenzionim tabelama se referiše neposredno iz tabela
činjenica.
Jednoj temi odgovara jedna velika tabela činjenica. Veoma retko ima potrebe i smisla da se za jednu
temu pravi više tabela činjenica. Tabela činjenica je u centru pažnje. Sadrži sve podatke ili bar
reference na sve podatke koji su od značaja za konkretnu temu. Praktično svi analitički upiti se
postavljaju nad tabelom činjenica. Osnovni podaci u tabeli činjenica su denormalizovani.
Dimenzione tabele opisuju pojedinosti dimenzija koje se navode u tabeli činjenica. Jednoj temi
obično odgovara veći broj dimenzionih tabela. One su obično manje tabele sa svega par kolona.
Povezuju se sa tabelom činjenica radi pravljenja „čitljivijih“ izveštaja. Nisu normalizovane.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Šta je shema pahuljice? Kada se, zašto i kako koristi?

A

Slično kao zvezdasta shema. Razlika je u tome što su i dimenzione tabele normalizovane (ne moraju
sve da budu normalizovane)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Objasniti specifičnosti fizičkog modeliranja skladišta podataka.

A

Projektovanje indeksa:
* indeksi spajanja – namenjeni su za efikasno povezivanje tabele činjenica i dimenzionih
tabela. Prave se na dimenzionim tabelama. Obično heš illi b-stabla.
* indeksi pretraživanja – za efikasno pretraživanje tabele činjenica. Prave se na tabeli
činjenica. Obično bit-mapirani indeksi.
* često se pravi mnogo indeksa – ubrzavaju se upiti. Ne postoje transakcije kojima bi to
smetalo. Paketno ažuriranje se obično izvodi sa odloženim/naknadnim osvežavanjem
indeksa.
Projektovanje materijalizovanih pogleda – logički odgovaraju pogledima, a fizički tabelama.
Nakon prvog izračunavanja rezultati se čuvaju sve dok se podaci ne promene. Efikasnija alternativa
pravljenju više tabela činjenica za različite nivoe granularnosti ili navođenju redundantnih nivoa
granularnosti u jednoj tabeli činjenica.
Projektovanje particija:
* horizontalno – po grupama redoma
* vertikalno – po grupama kolona

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Šta je onlajn analitička obrada? Objasniti specifičnosti.

A

U širem smislu – svaka analitička obrada podataka. Obično se počinje od opštijih upita i čitanja pa
se nastavlja postepenim fokusiranjem na određene grupe podataka i profinjivanjem upita.
U užem smislu – analitička obrada koja se izvodi nad „živim“ podacima.
U elemente OLAP-a spadaju i odgovarajući elementi upitnih jezika i tehnike njihove upotrebe. Iako
je osnovna priroda upita veoma slična, njihova implementacija može da se veoma razlikuje u
zavisnosti od vrste baze podataka.Kod OLTP/OLAP baza podataka analitička obrada se odvija
istovremeno sa transakcionom obradom. Kod skladišta podataka se obrada odvija uz pretpostavku
nepromenljivosti podataka.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Šta su „automatske zbirne tabele“? Objasniti namenu i način
funkcionisanja.

A

Automatske zbirne tabele – jedna od prepoznatljivih karakteristika baza podataka za podršku
odlučivanju. Implementiraju se kao vrsta materijalizovanih pogleda. Osnovna namena je da
predstavljaju alternativne „tabele“ činjenica za grublje nivoe granularnosti. Najčešće se
izračunavaju grupisanjem redova tabela činjenica i sumiranjem vrednosnih podataka. Koriste se za
ubrzavanje izračunavanja često upotrebljavanih statistika.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Objasniti eksploziju broja pogleda kod OLAP sistema.

A

Agregirani materijalizovani pogledi grade hijerarhije u odnosu na dimenzije i nivoe granularnosti.
Ako neka dimenzija ima samo jedan nivo agregiranja, onda osnovni nivo podataka predstavlja nivo
0, a agregacija po svim vrednostima dimenzije je nivo 1.
Ako dve dimenzije imaju m i n nivoa, onda postoji mxn pogleda koji pokrivaju sve kombinacije za
ove dimenzije. Ako imamo veći broj dimenzija: d je broj dimenzija, hi su brojevi nivoa po
dimenzijama, onda je ukupan broj mogućih pogleda: N=∏i=1
d
hi . Ako je g geometrijska sredina
broja nivoa po dimenzijama, onda je ukupan broj mogućih pogleda reda: N=gd. Često je nemoguće
napraviti i održavati sve ove poglede nad velikim tabelama činjenica.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Algoritam PGA odabira materijalizovanih pogleda.

A

Takođe bira po jedan pogled u koraku, ali uz manje računanja. Deli se svaki korak na fazu
nominacije (traži „dobre“ kandidate; nominuje se najmanji pogled koji je jedan nivo ispod tabele
činjenica, zatim najmanji koji je jedan nivo ispod nominovanog, i tako do pune agregacije) i fazu
izbora (izračunava dobit samo za dobre kandidate; odabire se onaj koji daje najveću dobit). U
narednom ciklusu se ponavlja postupak, ali se nominuju samo kandidati koji nisu bili prethodno
nominovani.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly