Lecture 1 Flashcards
Podaci
Definicija
Osnovni opisi stvari, događaja, aktivnosti i transakcija; interni i eksterni.
Informacija
Definicija
Organizovani podaci koji imaju značanje i vrednost.
Znanje
Definicija
Procesirani podaci ili informacije koje predstavljaju razumevanje ili učenje primenljivo na problem ili aktivnost.
Šta čini informacije?
Podaci koji su obrađeni da imaju konteskt, relevantnost i svrhu.
Interpretacija informacija -> Znanje
Šta čini podatke?
Sirove informacije, opažanja ili percepcije.
Analiza podataka -> Informacije
Šta čini znanje?
Opravdana verovanja o vezama bitnim za donošenje odluka.
Primena znanja -> Donošenje informisane odluke
Nacrtaj:
Ciklus odluke-akcije
- Korisnik
- Primenjuje inteligenciju na podatke
- Da dobije informacije
- Formira se osnova znanja
- Znanje se koristi za donošenje odluka
- Odluke aktiviraju akcije
- Akcije generišu podatke
Za šta kompanije koriste podatke?
Za razumevanje operacija, klijenata, konkurencije, partnera, zaposlenih, stockholder-a.
Šta kompanije treba da urade?
- Nauče šta se dešava u biznisu
- Analiziraju svoje operacije
- Reaguju na interne i eksterne pritiske
- Donesu odluke koje će im pomoći da kontrolišu trošak, povećaju prihod, prodaju i profit.
Objasni:
4 V velikih podataka
- Volume (obim): veličina skupova podataka od MB do PB
- Velocity (brzina): brzina prikupljanja podataka (vremenski osetljivi podaci)
- Variety (raznolikost): prikupljanje podataka iz različitih izvora; nestrukturisani podaci se obrađuju drugačije
- Veracity (tačnost): bias, buka i abnormalnosti u podacima; da li su podaci koji se koriste značajni za problem koji se analizira
Transakcijska vs. analitička obrada
- Transakcijska se fokusira na obradu pojedinačnih podataka (unos, modifikacija, brisanje i transmisija)
- Analitička se fokusira na izveštavanje, analizu, transformaciju i podršku pri odlučivanju
Delovi transakcijske obrade
- Sakupljanje i organizacija podataka
- Sumiranje informacija
Delovi analitičke obrade
- Analiza i sinteza znanja
- Donošenje odluka (mudrost)
Objasni:
5 C podataka
- Clean (čisti): čišćenje podataka od nedostajućih, pogrešnih, nepravilnih vrednosti ili duplikata
- Consistent (konzistentnost): postoje samo jedni tačni podaci
- Conformed (usklađenost): svi koriste iste podatke za donošenje odluka
- Current (trenutnost): donošenje odluka na osnovu potrebnosti
- Comprehensive (sveobuhvatnost): potrebno je imati sve podatke koji su potrebni
Integracija podataka
Kombinovanje podataka iz različitih izvora u jedinstveni skup.