L11 Flashcards

1
Q

Šta predstavlja Data Science?

A

Data Science je multidisciplinarno polje nauke koje se zasniva nanaučnim metodama, procesima, algoritmima i sistemima da izvuče znanje iz strukturiranih i nestrukturiranih podataka. Može se reći da je data science studijski domen koji obrađuje velike količine podataka kroisteći savremene tehnologije i tehnike.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Šta predstavlja biznis inteligencija? Koja je razlika između Data Science i biznis inteligencije?

A

Biznih inteligencija je proces analiziranja i izveštavanja o istorijskim biznis podacima radi donošenja strateškoh odluka, a data science je okrenut ka budućnosti i budućim događajima

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Koje su faze jednog Data Science projekta? Opisati korake u fazi

A
  1. Pribavljanje podataka - kako se podaci prikupljaju: skupljanje, unos, prijem signala, izvlačenje podataka
  2. Održavanje podataka - šta se dešava sa pribavljenim podacima: skladištenje, čišćenje, priprema, pre-procesiranje, arhitektura
  3. Procesuiranje podataka - šta treba raditi sa ošišćenim podacima: pretraga, klasifikacija, modelovanje, sumiranje
  4. analiza podataka - kako analizirati podatke: istraživanje, prediktivna analiza, regresija, pretraga
  5. Prikaz podataka - kako prikazati rezultate: izvešravanje, vizuelizacija, biznis inteligencija, odlučivanje
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Koje su dužnosti pozicije Data Analyst / Data Scientist / Data Engineer?

A

Data Analyst - početna pozicija, pregleda podatke i izvlači odgovore na pitanja iz poslovanja
Data Scientist - pravi modele i daje smernice za buduća poslovanja, ne samo pregled ranijih podataka
Data Engineer - zadužen za održavanje infrastrukture podataka organizacije

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Šta je aritmetička srenja vrednost / modus / medijana / varijansa ? Napisati program za ručno računanje ako je ulay lista.

A

Aritmetička vrednost je aritmetička sredina (zbir članova podeljen brojem članova) nekog niza np.mean().
Modus je najčešća vrednost u nizu stats.mode().
Medijana je broj koji razdvaja gornju i donju polovinu uzoraka niza np.median().
Varijansa je odstupanje od srednje vrednosti np.var().

How well did you know this?
1
Not at all
2
3
4
5
Perfectly