Kap 10 Flashcards
Uafhængige versus afhængige stikprøver
Uafhængige stikprøver:
Observationerne i den ene stikprøve er uafhængige af observationerne i den anden stikprøve
Eksempelvis en stikprøve, hvor vi efterfølgende opdeler stikprøven efter en forklarende variabel (Køn)
Afhængige stikprøver:
Eksempelvis ægtepar, hvor vi opdeler i stikprøven vi eksempelvis kigger på stemme på rød/blå blok eller BMI for mand og kvinde
Hvis vi undersøger de samme respondenter – under uddannelse og efter færdiggjort uddannelse (præ/post)
Uafhængige stikprøver for andel og middelværdi
Andel:
Konfidensinterval for forskellen mellem to populationsandele: p1 - p2
Hypotesetest for Ho: p1 = p2
Middelværdi:
Konfidensinterval for forskellen i middelværdien for to stikprøver: µ1 - µ2
Hypotesetest for Ho: µ1 = µ2
Andel (kategori) + uafhængighed
For en kategorisk responsvariabel ønsker vi at sammenligne populationsandelen i de to grupper. Denne kan udtrykkes som forskellen (p1 – p2), som estimeres ved forskellen i stikprøveandelene
Eksempel: I Meningsmålingen ønsker vi at sammenligne om andelen, der stemmer på rød og blå blok er den samme for de to køn
Køn er den forklarende variabel
Rød/blå blok er respons-variabel
Andel (kategori) + uafhængighed: Stikprøvefordeling for forskellen mellem to andele
Stikprøvefordelingen for forskellen mellem to andele er normalfordelt
Hvor n1 og n2 er stikprøvestørrelsen for hhv. gruppe 1 og gruppe 2
Hvad skal gælde for at p^1 - p^2 er normalfordelt:
Responsvariablen skal være kategorivariabel for begge grupper
Data fra begge stikprøver skal være randomiseret. Dvs. genereret på baggrund af en tilfældig stikprøve
Stikprøvestørrelsen for begge grupper skal indeholde mindst 10 successer og 10 fiaskoer
Andel (kategori) + uafhængighed: Formel for konfidensinterval
Når vi ved at p^1 – p^2 er normalfordelt kan vi på baggrund af Z-scoren og standardfejlen for teststørrelsen opstille en formel for konfidensintervallet
TRE MULIGHEDER for konfidensintervallet for (p1-p2)
A) 0 er indeholdt i konfidensintervallet
Hvis 0 er indeholdt i konfidensintervallet er det plausibelt at p1 og p2 er lige store
B) p1-p2 > 0
Både nedre og øvre grænse i konfidensintervallet er større end 0, så er p1 > p2
Konfidensintervallet fortæller os hvor meget større p1 er end p2
C) p1-p2 < 0
Både nedre og øvre grænse i konfidensintervallet er mindre end 0, så er p1 < p2
Konfidensintervallet fortæller os hvor meget større p2 er end p1
Hypotesetest for om p1 ≠ p2 med de fem trin, se fra slide 13 kap. 10
Middelværdi (kvantitativ) + uafhængighed
For en numerisk (kvantitativ) responsvariabel ønsker vi at sammenligne middelværdien i de to grupper. Denne kan udtrykkes som forskellen (µ1 - µ2), som estimeres ved forskellen i stikprøvemiddelværdierne
Eksempel: I stikprøven over BMI for en gruppe tilfældigt udvalgte danskere. Vi ønsker at sammenligne om det gennemsnitlige BMI er forskelligt for mænd og kvinder
Køn er den forklarende variabel
BMI er respons-variabel
For at kunne lave konfidensintervaller/hypotesetest (statistisk inteferens) skal vi kende stikprøvefordelingen for teststørrerelsen.
Stikprøvefordelingen for forskellen mellem to middelværdier er normalfordelt
Hvad skal gælde for at x_1 – x_2 er normalfordelt
Responsvariablen skal være numerisk (kvantitativ) variabel for begge grupper
Data fra begge stikprøver skal være randomiseret. Dvs genereret på baggrund af en tilfældig stikprøve
Stikprøvestørrelsen n1 og n2 skal begge være større end 30 (jvnf centrale grænseværdisætning)
Middelværdi (kvantitativ) + uafhængighed: Formel for konfidensintervallet
Når vi ved at x_1 – x_2 er normalfordelt kan vi på baggrund af Z-scoren og standardfejlen for teststørrelsen opstille en formel for konfidensintervallet
MEN da vi ikke kender standardafvigelserne i de to populationer benytter vi i stedet s1 og s2 (standardafvigelserne fra stikprøven)
Dette medfører ekstra usikkerhed, som vi håndterer ved at benytte t-fordelingen frem for normalfordelingen
TRE MULIGHEDER for konfidensintervallet for (µ1 - µ2)
A) 0 er indeholdt i konfidensintervallet
Hvis 0 er indeholdt i konfidensintervallet er det plausibelt at µ1 og µ2 er ens
B) µ1 - µ2 > 0
Både nedre og øvre grænse i konfidensintervallet er større end 0, så vi udleder at µ1 > µ2
Konfidensintervallet fortæller os hvor meget større µ1 er end µ2
C) µ1 - µ2 < 0
Både nedre og øvre grænse i konfidensintervallet er mindre end 0, så vi udleder at µ1 < µ2
Konfidensintervallet fortæller os hvor meget større µ2 er end - µ1
Størrelsen af konfidensintervallet fortæller os hvor stor den sande forskel er mellem µ1 og µ2. Er både den nedre og øvre grænse i konfidensintervallet tæt på 0 er forskellen mellem µ1 og µ2 i praksis ikke særlig stor
Hypotesetest for om µ1 ≠ µ2 med de fem trin, se fra slide 29 kap. 10