Forelesning 3: Kap 6 Statistikk og hypotesetesting Flashcards
Hva er forskjellen på deskriptiv statisitkk og slutningsstatisikk?
Deskriptiv oppsumerer datasettet (sentraltendens og sprendning)
Slutningsstatitikk estimerer egenskaper til popluasjonen og tester hypoteser (t-tester, korrealsjon, kji-kvadtrat og ANOVA)
Hva er sentraltendens og hvordan kan det måles)? Fordeler/ulemper med de forskjellige metodene
enkeltskåre som definerer sentrum for en fordeling
gjennomsnitt - ekstrem verdier kan forskyve resultatet
median - ikke sensitivt for ekstreme verdier, men tar ikke hensyn til alle verdier
modus (typetall) - blir ikke på virket av ekstreme verdier, basser ikke for små utvalg eller verdier som ovserberes kun en gang
Hvordan kan vi måle spredning?
Indikasjon på hvor mye variasjon det i skårene
Range: avstand på laveste til høyeste (påvirkes av ekstreme uteliggere)
Varians: Summen av de kvadrerte avvikene
Standaravvik: roten av variansen
Sier noe om den mest typiske verdien og ligge unna snittet
Hva kjennetegner en normalfordeling?
Median, mode, og gjennomsnitt er samme verdien
Symentisk rundt midtpunkt
Asympotisk
Ved perfekt normalfordeling
34% et standaravvik unna på hver side
13% mellom 1-2 SD
2% mellom 2-3 SD unna
0.1% 3 SD unna
Hva er en Z-skåre og Z-fordeling?
Z-skåre er antall standardavvik fra gjennomsnittet
Z-fordeling sier noe om hvor sannsynelig det er å havne en gitt verdi fra gjennomsnittet
Hvor mye av arealet under kurven som befinner seg over, under, elle rmellom gitte z-verdier
z-fordeling er alltid gjennomsnittet 0 og standaravvik 1
Hva er utvalgsfordeling og standarfeil?
Utvalgsfordeling er tenkt fordeling over gjennomsnittsskårer
Standarfeil er estimat / mål på variasjon i utvalgsfordelingen
Et mål på hvor mye usikkerhet som er knyttet til resultatene når vi estimerer gjennomsnittet
Hva er nullhypotese?
Nullhypotesen hveder at det ikke er noen sammenheng eller forskjell, den tester vi statistisk og kan forkastes om det er svært lite sannsynlig at resultatene skyldes tilfeldigheter
Hva er signifikansnivå?
Signifikansnivå handler om hvor mye tilfeldigheter vi kan akseptere
signifikansnivå .05 tilsier 5% sjanse at resultatene skyldes tilfeldigheter
Hva er p-verdi?
P-verdi sier noe om hvor sannsynlig det er å få resultatene vi fikk hvis nullhypotesen er sann
rapporteres sm p<.001
Hva er type 1 og type 2 feil i hypotesetesting?
Type 1: forsker finner bevis for signifikant resultat når det ikke finnes, skyldes ekstreme utvalg, lavt signifikansnivå eller kondunderende variabler
Type 2: utvlagsdata viser ingen signifikant sammenheng når det egentlig er det. For strengt signifikansnivå, små effekter, lite statistisk stykre eller andre variabler