Inferenčna statistika Flashcards
Kaj nam omogoča inferenčna statistika?
Inferenčna statistika nam omogoča dvoje:
1. ocenjevanje parametrov; na osnovi statistik poskušamo oceniti, akkšna bo vrednost parametra v populaciji. To je lahko v obliki točkovne ali intervalne ocene (npr. poznamo aritmetično sredino v vzorcu in želimo oceniti, kakšna bo v populaciji)
2. Preizkušanje domnev (hipotez): preizkušanje, ali neke vnaprej postavljenje trdive o stanju v populaciji (npr. povezanost 2 spremenljivk, različnost 2 spremenljivk) držijo ali ne
Kaj je ideja za vzorčenjem/teorija vzorčenja?
Če poznamo popualcijo, lahko določimo verjetnost, da bomo iz nje potegnili vzorec s specifično statistiko. Obratno delamo pri statističnem sklepanju (izmerimo statistike v vzorcu in na osnovi tega napovedujemo in preizkušamo domneve)
Kaj je vzorčenje? Kakšne opredelitve zahteva?
Vzorčenje je postopek izbora enot v vzorec. Postopek zahteva opredelitev:
* populacije (in morebitno delne populacije)
* enote vzorčenja (lahko gre za posameznika, skupine ljudi, organizacije, časovne točke, …)
* načine vzorčenja enot
* potrebne velikosti vzorca, da bodo ugotovitve reprezentativne
Ločitev med manjšimi in večjimi vzorci je bila včaish pomembnejša kot danes, ker se nekateri testi v velikih vzorcih obnašajo bolj predvidljivo, je bilo možno nekatere statistične formule poenostaviti, kar je omogočilo hitrejše ročno računanje. Pomembno je, da ločimo med odvisnimi in neodvisnimi vzorci. O neodvisnih vzorcih govorimo, kadar med seboj primerjamo dve ali več različnih skupin.
* Pri neodvisnih se udeleženci iz enega vzorca ne pojavljajo v drugih vzrocih in med seboj niso povezani (npr. šestošolci vs. osmošolci).
* Odvisni vzorci pa so takrat, kadar med seboj npr. primerjamo isti vzorec skozi čas, kadar so osebe povezane (starš-otrok)
Naštej in opiši načine verjetnostnega vzorčenja
Verjetnostno vzorčenje je vsako vzročenje, ki vsebuje slučajen ali psevdo-slučajen izbor. Prednost tega je kontrola sistematičnih motečih dejavnikov; nepristranskost.
* Slučajno vzorčenje: naključno izberemo enote iz velike populacije. Slabosti so težja izvedljivost pri veliki populaciji, reprezentativnost ni zagotovljena, …Kljub redki uporabi v praksi je slučajno vzorčenje predpostavka večine standardnih statističnih enot (pri ostalih rabimo prilagojeno analizo!)
* Stratificirano vzorčenje v svoji strukturi upošteva raznolikost enot v populaciji, ki je običajno heterogena. Pri stratificiranem vzorčenju heterogeno populacijo najprej razdelimo na homogene podskupine, nato pa tvorimo enostavne slučajne ali sistematične vzorce znotraj skupin. Stratumi so opredeljeni običajno z nekimi relevnatnimi, neodvisnimi spremenljivkami (npr. regija bivanja, starostna skupina, izobrazba, …)
* Sistematično vzorčenje poteka tako, da vnaprej določimo ‘korak’ po katerem bomo vzorčili. Iz urejenega seznama enot nato na naključnem mestu začnemo izbirati enote v razmaku koraka. Če je korak 5, potem izberemo vsako peto naslednjo enoto, dokler ne dosežemo želene velikosti
* Vzorčenje skupin, klastrov poteka tako, da skupine vnaprej določino glede na lastnosti neke populacije. Skupine so lahko tudi nekateri stratumi. Priemri skupin so lahko denimo mestna okrožja, fakultete, izdelki nekega tipa, …nato naključno izberemo skupino, naš vzorec pa predstavljajo vsi člani te skupine
* večstopenjsko vzorčenje: podobno vzorčenju skupin, le da iz izbranih skupin izbiramo le nekatere enote; reicmo iz izbranih šol določene oddelke ali učitelje, izmed jogurtov pakirane v lončkih, gospodinjstva v pritličju okrožji. V tem primeru govorimo o dvo ali več stopenjskemu vzorčenju, saj iz osnovnih skupin (okrožja) tvorimo še podskupine (gospodinjstva v pritličju). Zahteva večnivojsko modeliranje!
Opiši in naštej načine ne-verjetnostnega vzorčenja
- Priložnostno vzorčenje v vzorec vključi tiste enote, ki so navzoče ob priložnosti, ki se izvaja raziskava (npr. avtomobili na izbrani cesti, mimoidoči na ulici, obiskovalci spletne strani, …). Večina običajnega anketiranja se izvede na priložnostnih vzorcih. Zaradi zelo subjektivnega načina izbiranja enot so taki vzorci manj primerni za sklepanje o parametrih saj je vprašljivo, ali je izbor enot morda povezan z lastnostjo, ki jo proučujemo. Priložnostni vzorci so lahko ustrezn pri preučevanju bolj splošnih značilnosti populacije in služijo kot izhodišča za nadaljno raziskovanje.
- Namensko vzorčenje pomeni zbiranje udeležencev glede na določene lastnosti kot npr. vzorčenje pogostih primerov/ekstremnih primerov/ekspertov/kvotni vzorec (razdelimo populacijo na homogene skupine in potem izbiramo udeležence znotraj skupin, da dosežemo enake proporce kot se pojavljajo v populaciji)/princip snežne kepe (preizkušance prosimo, da vabilo posredujejo znancem).
Kaj je osnovna predpostavka neodvisnosti vzorčenja?
Neodvisnost opazovanj je zelo pogosto rabljen pogoj pri linearni regresiji in različnih statističnih testih, ki jih bomo podrobneje spoznali v nadaljevanju. Predpostavka zahteva, da mora biti vsak udeleženec vzorčno neodvisen od drugih (izbor ene enote ne vpliva na izbor drugih enot), Kršitev te predpostavke povzroči neveljavnost testov statistične značilnosti. Spodaj je navedenih nekaj običajnih primerov merskih situacij, ki vodijo v kršitev te predpostavke:
* V neki raziskavi smo vse udeležence večkrat izmerili na obravnavanih spremenljivkah in vse meritve obravnavali kot
neodvisne oz. kot zbrane na povsem različnih osebah. Npr. zanimala nas je korelacija med enostavnimi (RČE) in
izbirnimi (RČI) reakcijskimi časi. Meritve smo izvedli na 50 udeležencih, vendar smo pri vseh zbrali 10 meritev RČE in
RČI in te ponovljene meritve obravnavali, kot da bi jih pridobili na neodvisnih/drugih osebah. Podatki znotraj osebe
med seboj niso neodvisni. Ustrezen postopek bi vključeval izračun povprečnih RČE in RČI znotraj oseb in nato vnos teh
povprečnih vrednosti v podatkovno bazo (vsak udeleženec bi v bazo prispeval po eno vrednost na spremenljivko).
* Med merjenjem znanja dovolimo/spregledamo “sodelovanje” med nekaterimi učenci. Čeprav smo na vsaki osebi
izvedli le eno meritev, dosežki teh učencev med seboj ne bodo neodvisni.
* Preizkušance vzorčimo iz različnih enot, kot so npr. šole, podjetja, študijski programi ipd. (takšnemu vzorčenju rečemo
gnezdeno vzorčenje). Primer: v neki raziskavi smo zbrali po 30 študentov iz treh študijskih programov. Tako zbranih
podatkov ne moremo obravnavati kot neodvisnih, saj so si študenti znotraj določenega programa po mnogih
spremenljivkah med seboj bolj podobni, kot so si podobni s študenti iz drugih programov. Za razrešitev tega problema
uporabimo bodisi hierarhično linearno modeliranje ali pa podatke znotraj posameznih enot povprečimo in to
povprečno vrednost znotraj enote obravnavamo kot podatek “ene osebe”.
Kaj je porazdelitev vzorčnih ocen? Opiši in razloži
Zamislimo si, da iz populacije naključno izbiramo različne vzorce velikosti n (vsi enako veliki). Nato za vsak vzorec izračunamo statistiko (npr. M za neko spremenljivko). Ker so vzorci med seboj različni, bodo različne tudi statistike (nekje bo M višja, drugje nižja). Če bomo izračunali statistike za veliko število vzorcev, lahko oblikujemo porazdelitev statistik oziroma porazdelitev vzorčnih ocen (npr. porazdelitev aritmetičnih sredin v različnih vzorcih znotraj populacije). Porazdelitev vzorčnih ocen je porazdelitev
statistike v neskončnem številu vzorcev. Katere porazdelitve katerih ocen nas še posebej zanimajo? Pogosto so to porazdelitve opisnih
statistik vzorca (npr. M, VAR) ali pa drugih izrazov (npr. t-vrednost ipd.).
Vsako porazdelitev vzorčnih ocen lahko opišemo z dvema vrednostma:
* μstatistike : povprečje vzorčnih ocen oziroma statistik v populaciji (ne smemo zamešati z vrednostjo parametra!)
* σstatistike = SEstatistike :standardni odklon vzorčnih ocen/statistik → imenujemo tudi standardna napaka (več v nadaljevanju)
**Standardna napaka **nam poda informacijo o razpršenosti vzorčnih ocen. Manjša ko je standardna napaka, manj se vzorci ločijo
med sabo (kar pomeni, da lahko izbranemu vzorcu bolj zaupamo).
Kaj je standardna napaka v inferenčni statistiki?
Standardna napaka (SEstatistike) je opredeljena kot standardni odklon vzorčnih ocen. Pove nam, v kolikšni meri se med seboj
razlikujejo ocene (statistike) med vzorci.
Standardna napaka se za različne statistike izračuna po različnih formulah:
𝑺𝒕𝒂𝒏𝒅𝒂𝒓𝒅𝒏𝒂 𝒏𝒂𝒑𝒂𝒌𝒂 𝒂𝒓𝒊𝒕𝒎𝒆𝒕𝒊č𝒏𝒆 𝒔𝒓𝒆𝒅𝒊𝒏𝒆: 𝑆𝐸𝑀 =
𝑆𝐷
√𝑛
𝑺𝒕𝒂𝒏𝒅𝒂𝒓𝒅𝒏𝒂 𝒏𝒂𝒑𝒂𝒌𝒂 𝒅𝒆𝒍𝒆ž𝒂: 𝑆𝐸𝑝 = √
𝑝(1 − 𝑝)
𝑛
𝑺𝒕𝒂𝒏𝒅𝒂𝒓𝒅𝒏𝒂 𝒏𝒂𝒑𝒂𝒌𝒂 𝒔𝒕𝒂𝒏𝒅𝒂𝒓𝒅𝒏𝒆𝒈𝒂 𝒐𝒅𝒌𝒍𝒐𝒏𝒂: 𝑆𝐸𝑆𝐷 =
𝑆𝐷
√2𝑛
𝑺𝒕𝒂𝒏𝒅𝒂𝒓𝒅𝒏𝒂 𝒏𝒂𝒑𝒂𝒌𝒂 𝒓𝒂𝒛𝒍𝒊𝒌𝒆 𝒂𝒓𝒊𝒕𝒎𝒆𝒕𝒊č𝒏𝒊𝒉 𝒔𝒓𝒆𝒅𝒊𝒏: 𝑆𝐸𝑀1−𝑀2 = √𝑆𝐸𝑀1
2 + 𝑆𝐸𝑀2
2
(𝑧𝑎 𝑒𝑛𝑎𝑘𝑒 𝑛
Kaj je centralni limitni izrek?
Za katerokoli populacijo s sredino μ in standardno deviacijo σ velja, da se z večanjem vzorca (n gre proti neskončnosti)
porazdelitev vzorčnih sredin približuje normalni porazdelitvi s sredino μ in varianco σ2/n.
Centralni limitni izrek velja, ne glede na to, kakšna je porazdelitev spremenljivke v populaciji (tudi če ni normalna), dokler imamo dovolj velike vzorce (vsaj 30 udeležencev). V majhnih vzorcih pa je porazdelitev vzorčnih ocen bolj odvisna od populacijske spremenljivke. Obstajajo pa tudi statistike, ki zaradi svoje narave ne sledijo centralnemu limitnemu izreku. Primera sta npr.
varianca, ki je asimetrična, saj ne more biti manjša od 0, in koeficient korelacije, ki je asimetričen, ker lahko zavzema vrednosti med -1 in 1. Centralni limitni izrek nam pove dvoje:
* večji vzorec ko imamo, bolj bo porazdelitev vzorčnih ocen spominjala na normalno porazdelitev,
* večji vzorec ko imamo, bolj se bo μM vzorcev približevala μ populacije, razpršenost oziroma standardna napaka pa bo
manjša.
Katera dva pristopa uporabljamo a ocenjevanje vrednosti parametra v populaciji?
- **frekvenčni pristop: **parameter je neznana fiksna vrednost (če bi izmerili celotno populacijo, bi lahko to količino natančno določili)
- Bayesovski pristop: parameter je slučajna spremenljivka (ni nekaj, kar bi bilo fiksno).
Pravilo oz. formula, ki jo uporabljamo imenujemo cenilka. Cenilka je torej postopek, po katerem iz izbranega vzorca izračunamo oceno parametra. Vrednost cenilke (vrednost, ki jo dobimo z izračunom) je torej ocena. Oceno lahko podamo točkovno (ena sama, najboljša vrednost) ali intervalno (razpon vrednosti, ki jih štejemo kot možne vrednosti parametra.
Kakšne lastnosti so zaželjene pri cenilkah (formula za ocenjevanje oz. izračun parametra populacije)
- nepristranskost: ocena ne podcenjuje in ne precenjuje dejanske vrednosti parametra
- učinkovitost: če velikost vzorca narašča, se bo tudi ocena približevala vrednosti parametra
- zadostnost: cenilka izkoristi vso informacijo, ki je na voljo
- robustnost: majhen vpliv osamelcev in/ali kršitve predpostavk (majhna sprememba v podatkih povzroči majhno spremembo v vrednosti statistike).
Kako sta vrednost vzročne statistike in ocena parametra povezani?
Pri večini statistik, ki smo jih obravnavali, je vrednost vzročne statistike tudi ocena parametra (M je cenilka μ, p je cenilka
π, r je cenilka ρ in tako naprej). Obstajajo tudi izjeme npr. varianca in standardni odklon.
Kaj je interval zaupanja?
Interval zaupanja je območje, ki z določeno verjetnostjo vsebuje nek populacijski parameter.
Primer:
n=100. Vemo, da M vzorca ne bo nujno enaka M populacije, zato smo za vsak slučaj izračunali interval zaupanja, na katerem predpostavljamo, da se nahaja M populacije. Ker smo uporabili 95% interval zaupanja, predpostavljamo, da naš interval v 95% vzorcev vsebuje vrednost parametra. Intervale zaupanja smo nato primerjali z dejansko aritmetično sredino populacije (μ=50). Vidimo lahko, da je bila vrednost parametra zunaj intervala zaupanja le v 1 izmed 20 primerov.
Pri 95% intervalu pričakujemo, da bo v 95% vzorcev interval zaupanja vseboval dejansko vrednost parametra
Pazi! Napačna interpretacije je, da obstjaa 95% verjetnost, da bo populacijski parameter padel v interval zaupanja. Populacijski parameter je namreč konstanta, ki se ne spreminja. Vejretnost, da parameter pade na interval zaupanja je torej vedno 0 ali 1.
Kaj označujeta meji intervala zaupanja?
To sta vrednosti, ki to območje omejujeta. Sta slučajni spremenljivki (torej, pri vsakem vzrocu imata drugo vrednost). Pri intervalu zaupanja je ključna verjetnost pri kateri interval vsebuje parameter, kar imenujemo tudi zaupanje.
Kaj je raven tveganja?
Zaupanju nasprotna je raven tveganja ali stopnja značilnosti (označimo s simbolom α), ki označuje verjetnost, pri kateri interval ne vsebuje parametra. Stopnja značilnsoit ni nekaj, kar bi izračunali temveč jo določimo vnaprej. Standardne vrednosti, ki jih uporabljamo za verjetnost α so 0,05; 0,01 ali 0,001. Standardne vrednsoti za zaupanje (izračunamo po formuli 1-α) torej so: 9,95; 0,99 oz. 0,999. Običajno izražamo zaupanje v odstotkih, govorimo o 95% intervalu zaupanja.
Na katera dva načina lahko izračunamo interval zaupanja? Kaj je predpogoj vsake? Kdaj je primerna ena ali druga metoda?
Izračunamo ga lahko na dva načina. Predpostavka obeh postopkov je, da je vzorec reprezentativen.
* analitiično ocenjevanje intervala zaupanja: predpogoj za analitično ocenjevanje je, da poznamo obliko porazdelitve vzorčnih ocen, saj lahko ta postopek uporabimo le v primeru, ko je porazdelitev vzorčnih ocen simetrična. Kadar je porazdelitev asimetrična, moramo uporabiti postopek prevzročenja.
* prevzročenje (zankanje, bootstrap): to nam pride prav, kadar želimo izračunati interval zaupanja za statistike, pri katerih porazdelitev vzorčnih ocen ni simetrična. Tipični primeri so varianca, delež, korelacija. Pri prevzročenju iz osnovnega vzorca generiramo več novih vzorcev in v vskaem izračunamo želeno statistiko. Interval zaupanja določimo na osnovi porazdelitve spremenljivke v novo generiranih vzorcih.
Opiši postopek analitičnega ocenjevanja intervala zaupanja
Analitično ocenjevanje poteka po naslednjih korakih:
1. Preverimo, ali je porazdelitev vzorčnih ocen simetrična. To lahko predpostavimo če:
a) imamo dovolj velik vzoerec, da velja centralni limitni izrek (30+ udeležencev) in/ali,
b) je porazdelitev spremenljivke normalna
2. Določimo vrsto statistike za katero želimo izračunati interval zaupanja (npr. M, varianca, strukturni delež). Glede na vrsto statistike predpostavimo, po kateri porazdelitvi se bodo porazdeljevale vzročne ocene (pri M in deležih bo to t-porazdelitev, pri varianci in SD pa Hi-kvadrat porazdelitev)
3. Izberemo verjetnost oz. stopnjo značilnosti (α=0,05/0,01/0,001)
4. Izračunamo meji intervala
Natančno opiši analitično ocenjevanje intervala zaupanja (kaj konkretno računaš)
Podrobneje analitično ocenjevanje intervala zaupanja poteka po korakih:
1. Izberemo verjetnost oziroma stopnjo značilnosti (α = 0,05; 0,01 ali 0,001).
2. Izračunamo standardno napako (SE), tako da delimo standardni odklon s korenom numerusa.
3. V naslednjem koraku poiščemo kritično vrednost. Najprej po formuli (p=1-α/2) izračunamo p-vrednost. Nato po formuli
(df=n-1) izračunamo stopinje prostosti. V **t-tabeli poiščemo kritično vrednost, ki ustreza stopinjam prostosti in pvrednosti.
4. Izračunamo standardni odmik, tako da zmnožimo kritično vrednost in standardno napako.
5. Izračunamo meji intervala, tako da izhodiščni statistiki prištejemo ali odštejemo standardni odmik.
6. Zapišemo interval v obliki: IZ = [sp. meja; zg. meja]**
PRIMER: Imamo vzorec 400 udeležencev, ki so dosegli povprečni rezultat M = 40, s = 8. Zaradi velikega vzorca oblika porazdelitve
vzorčnih ocen (skoraj) ni pomembna, zato želimo analitično oceniti 95 % IZ za aritmetično sredino.
Za 95 % interval bo stopnja značilnosti α = 0,05.
Izračunamo **standardno napako: **
SEm = SD / √n = 8 / √400 = 8 / 20 = 0,4
Za vrednosti p in df v t-tabeli poiščemo kritično vrednost.
p = 1 – (α/2) = 1 – (0,025) = 0,975
df = n – 1 = 399
t(399)0,975 = 1,990
Zapišemo interval zaupanja:
IZ = M ± t(df)m * SEM = 40 ± 1,99 * 0,4 = [39,20; 40,80]
Opiši postopek za intervalno oceno strukturnega deleža dvojiške spremenljivke
Ni idealnega postopka, saj ej delež diskreten (Zaseda lahko le določene vrednosti) in odvisen od velikosti vzorca (npr. če je N=10, ne bo nikoli možen delež 0,25 ampak samo 0,2 ali 0,3). Strukturni delež je povprečje dvojiške spremenljivke, zato lahko včasih uporabimo postopek za M:
𝐼𝑍 = 𝑝 ±𝑡𝑛−1⋅ 𝑆𝐸𝑝 ; 𝑆𝐸𝑝 = √𝑝 ⋅ (1 − 𝑝)/𝑛
; 𝑝 ⋅ (1 − 𝑝) = 𝑑𝑒𝑙𝑒ž 𝑒𝑛𝑒 ⋅ 𝑑𝑒𝑙𝑒ž 𝑑𝑟𝑢𝑔𝑒 𝑘𝑎𝑡𝑒𝑔𝑜𝑟𝑖𝑗𝑒
V programu R lahko uporabimo dve boljši alternativi zgornjemu postopku:
Wilsonov postopek (popravljen postopek za normalno PVO)(PVO- porazdelitev vzorčnih ocen)
Clopper-Preasonov postopek (temelji na binomski porazdelitvi; konzervativen)
Kdaj je PVO (porazdelitev vzorčnih ocen) sturkturnih deležev simetrična?
Samo, če je vzorec velik in delež ni blizu 0 ali 1.
Kako na porazdelitev vpliva dejstvo, da varianca ne more biti manjša od 0?
Ker varianca ne more biti manjša od nič, je v zgornjem delu porazdelitve variranje bolj verjetno kot variranje v spodnjem. Porazdelitev vzorčnih ocen (POV) je zato nekoliko desno simetrična