uvod Flashcards
kaj je statistika?
je veda, ki proučuje zakonitosti množičnih pojavov na poseben način.
kaj je namen statistike
- razumevanje pojava/procesa
- napovedovanje pojava
- posredna pomoč pri upravljanju in vodenju procesov
naštej faze statističnega raziskovanja
Statistično raziskovanje ima tri faze:
1. zbiranje, urejanje in prikazovanje podatkov
2. redukcija podatkov v rezultate - uporaba STATISTIČNIH METOD (= statistiki lastna metodologija)
- interpretacija rezultatov
drugi pomeni besede statistika
- zbiranje, prikazovanje in urejanje podatkov (statistika vpisa študentov, statistika pojavnosti bolezni, . . . )
- FUNKCIJA VZORČNIH VREDNOSTI (t-statistika, z-statistika, …)
Kratko opiši zgodovino statistike - prve civilizacije
Prve civilizacije
* grafični prikazi števila oseb, pridelka (babilonska glinena
plošča, 3800 pr. n. št. Louvre)
* Egipčani, Kitajci, Grki, Rimljani izvajali popise prebivalstva za
potrebe države. Rimljani zbirali podatke o osvojenih ozemljih, popisi vsakih 5 let
statistika v srednjem veku
Srednji vek
* popisi cerkvenih zemljišč (Pipin Mali, Karel Veliki, 8. stol), prva zemljiška knjiga (Viljem Osvajalec, 11. stoletje)
* začetek študija ekonomskih in demografskih pojavov (širjenje kuge, . . . )
* pojavi se beseda STATISTIKA status (lat.) = stanje, pravni,
državni položaj
statistika v novem veku
Novi vek
* 17. in 18. stoletje: začetek verjetnostnega računa, ki je temelj statistike (Pascal, Fermat, Bernoulli, Poisson, de Moivre, Laplace, Gauss . . . )
* normalna porazdelitev (de Moivre, Laplace, Gauss)
statistika v 20. stoletju
- začetek 20. stoletja: osnove korelacijske in regresijske analize (Galton, Karl Pearson)
- okoli 1920: začetek statističnega sklepanja (Fisher, E. Pearson, Neymann)
- po 1960: računalniška tehnologija pospeši razvoj in uporabo statistike
- 1972: posplošeni linearni modeli (Generalized Linear Models, GLM)
- 1980: metode za raziskovanje podatkov (Exploratory Data
Analysis, Tukey) - nova področja, ki povezujejo računalništvo, statistiko in
matematiko: odkrivanje znanja v podatkih (data mining),
nevronske mreže, teorija omrežij, strojno učenje, . . .
del katerih naravoslovnih in družboslovnih ved je statistika?
- Ekonomija: ekonometrika, zavarovalništvo, teorija poslovnih odločitev
- Psihologija: psihometrika
- Biološke vede, medicina: biometrika, statistične metode v medicini
- Industrija: kontrola kakovosti, Taguchi metode (1985)
- Demografija: demografska statistika
matematična statistika
razvija statistične metode. Le te so neodvisne od področja uporabe
opisna statistika
prikaz podatkov v tabelarični in grafični obliki, izračuni t.i. opisnih statistik, matematično enostavna,
uporaba različnih računalniških programov
statistično sklepanje - inferenčna statistika
je sklepanje iz vzorca na populacijo. Preverjamo vnaprej postavljene domneve (confirmatory data analysis). Sklepi so vezani na verjetnost.
računalniška statistika
s simulacijami raziskuje statistične metode, statistične modele
uradna statistika
je statistika za potrebe države. SURS: Statistični Urad Republike Slovenije
statistična populacija
statistično populacijo opredeljujejo 3 opredelitve:
- stvarna opredelitev KOGA/KAJ preučujemo
- krajevna opredelitev KJE
- časovna opredelitev KDAJ
kakšne so lahko populacije
STVARNE: obstajajo v realnem svetu
HIPOTETIČNE: lahko si jih samo zamislimo
kaj sestavlja populacijo
ENOTE
N je število enot v populaciji, navadno veliko število (znano,
približno znano, neznano)
kako imenujemo del populacije
VZOREC
n je število enot v vzorcu, n < N
kaj je STATISTIČNA SPREMENLJIVKA
Zanimajo nas lastnosti enot. V statistiki opisuje lastnost enote t. i. statistična spremenljivka. Spremenljivka ima VREDNOSTI: npr. spol, datum, kraj rojstva, smer, izobrazba, telesna višina, ..
kako delimo spremenljivke
OPISNE: njihove vrednosti se izražajo z opisi. Posebne vrste opisnih spremenljivk so dvojiške (binarne) spremenljivke: imajo samo dve možni vrednosti (spol, štipendist)
ŠTEVILSKE: njihove vrednosti se izražajo s števili, s katerimi
lahko računamo (vsaj +, -). Številske spremenljivke delimo na DISKRETNE (npr. število otrok v družini, število opravljenih izpitov) in NEDISKRETNE med katerimi so najbolj pomembne ZVEZNE (starost, masa in gostota).
v praksi so vse spremenljivke bolj ali manj diskretne.
Merska lestvica spremenljivke
- IMENSKA (NOMIMALNA) SPREMENLJIVKA: v vrednostih
spremenljivke ni nobene urejenosti.
(kraj rojstva, smer študija, barva oči, spol, štipendist) - UREJENOSTNA (ORDINALNA) SPREMENLJIVKA: vrednosti lahko uredimo glede na nekakšen naravni vrstni red.
(izobrazba, šolska ocena) - RAZMIČNA (INTERVALNA) SPREMENLJIVKA: se izraža številsko. Poljubni dve vrednosti spremenljivke lahko odštevamo, ne pa delimo.
(temperatura zraka, leto rojstva) - RAZMERNOSTNA SPREMENLJIVKA: je številska spremenljivka, pri kateri je razmerje poljubnih dveh njenih vrednosti smiselno.
(starost, višina štipendije, letna količina padavin)
najvišji možni klin lestvice
? poglej si zadnje slajde
populacija vzorcev velikosti n
Vsi vzorci velikosti n, ki jih lahko dobimo iz osnovne populacije velikosti N, tvorijo populacijo vzorcev velikosti n.
Enota te populacije je vzorec velikosti n, ki ga dobimo iz populacije velikosti N.
To je HIPOTETIČNA POPULACIJA, ki je izjemno pomembna za
matematično statistiko.