L11 Flashcards
Šta predstavlja Data Science?
Data Science je multidisciplinarno polje nauke koje se zasniva nanaučnim metodama, procesima, algoritmima i sistemima da izvuče znanje iz strukturiranih i nestrukturiranih podataka. Može se reći da je data science studijski domen koji obrađuje velike količine podataka kroisteći savremene tehnologije i tehnike.
Šta predstavlja biznis inteligencija? Koja je razlika između Data Science i biznis inteligencije?
Biznih inteligencija je proces analiziranja i izveštavanja o istorijskim biznis podacima radi donošenja strateškoh odluka, a data science je okrenut ka budućnosti i budućim događajima
Koje su faze jednog Data Science projekta? Opisati korake u fazi
- Pribavljanje podataka - kako se podaci prikupljaju: skupljanje, unos, prijem signala, izvlačenje podataka
- Održavanje podataka - šta se dešava sa pribavljenim podacima: skladištenje, čišćenje, priprema, pre-procesiranje, arhitektura
- Procesuiranje podataka - šta treba raditi sa ošišćenim podacima: pretraga, klasifikacija, modelovanje, sumiranje
- analiza podataka - kako analizirati podatke: istraživanje, prediktivna analiza, regresija, pretraga
- Prikaz podataka - kako prikazati rezultate: izvešravanje, vizuelizacija, biznis inteligencija, odlučivanje
Koje su dužnosti pozicije Data Analyst / Data Scientist / Data Engineer?
Data Analyst - početna pozicija, pregleda podatke i izvlači odgovore na pitanja iz poslovanja
Data Scientist - pravi modele i daje smernice za buduća poslovanja, ne samo pregled ranijih podataka
Data Engineer - zadužen za održavanje infrastrukture podataka organizacije
Šta je aritmetička srenja vrednost / modus / medijana / varijansa ? Napisati program za ručno računanje ako je ulay lista.
Aritmetička vrednost je aritmetička sredina (zbir članova podeljen brojem članova) nekog niza np.mean().
Modus je najčešća vrednost u nizu stats.mode().
Medijana je broj koji razdvaja gornju i donju polovinu uzoraka niza np.median().
Varijansa je odstupanje od srednje vrednosti np.var().