Learning statistics with jamovi: a tutorial for psychology students and other beginners (9 hypotesetesting) Flashcards
Hva er de to “store ideene” i konklusjonsstatistikk?
Det er estimering og det dette kapittelet handler om, altså hypotesetesting
Hva er forskjellen mellom Forskningshypoteser kontra statistiske hypoteser?
Forskningshypoteser:
Studiens overordnede vitenskapelige mål er å demonstrere at klarsyn eksisterer. I denne situasjonen har jeg et klart forskningsmål: Jeg håper å finne bevis for noe .
I andre situasjoner kan jeg faktisk være mye mer nøytral enn det, så jeg kan si at forskningsmålet mitt er å finne ut om klarsyn eksisterer eller ikke. Uansett hvordan jeg ønsker å fremstille meg selv, er det grunnleggende poenget som jeg prøver å formidle her at en forskningshypotese innebærer å fremsette en substansiell, testbar vitenskapelig påstand.
Andre EKS:
Å lytte til musikk reduserer evnen til å ta hensyn til andre ting . Dette er en påstand om årsakssammenhengen mellom to psykologisk meningsfulle konsepter (lytting til musikk og ta hensyn til ting), så det er en helt rimelig forskningshypotese.
Intelligens er relatert til personlighet . Som den siste er dette en relasjonell påstand om to psykologiske konstruksjoner (intelligens og personlighet), men påstanden er svakere: korrelasjon ikke kausal.
Statistisk hypoteser:
Statistiske hypoteser må være matematisk presise og de må samsvare med spesifikke påstander om egenskapene til datagenereringsmekanismen (dvs. “populasjonen”). Det er en statistisk hypotese fordi utsagn om en populasjonsparameter er og skal være meningsfullt relatert til eksperimentet.
EKS:
Hvis ESP ikke eksisterer og hvis eksperimentet mitt er godt utformet, så gjetter deltakerne mine bare. Så jeg bør forvente at de får det riktig halvparten av tiden, og derfor er min statistiske hypotese at den sanne sannsynligheten for å velge riktig: =50%
LETTERE FORKLART:
Først har han eller hun en forskningshypotese (en påstand om psykologi), og denne tilsvarer deretter en statistisk hypotese (en påstand om den datagenererende befolkningen).
Forklar null hypotesen og den alternative hypotesen
Nullhypotese H0: Hypotesen vi vil undersøke om vi har grunnlag fra data til å forkaste.
Alternativ hypotese H1: Reflekterer spørsmålet vi stiller eller påstanden vi kommer med.
Med tanke på hypotesetesting, hva betyr type 1 feil og type 2 feil?
Hvis vi forkaster en nullhypotese som faktisk er sann, har vi gjort en type I feil . På den annen side, hvis vi beholder nullhypotesen når den faktisk er usann, har vi gjort en type II feil .
Hva vil si det kritiske området når det er snakk om hypotesetesting
Det kritiske området av testen tilsvarer disse verdiene for X
som ville føre oss til å avvise nullhypotesen (det er grunnen til at den kritiske regionen også noen ganger kalles avvisningsregionen).
Hva betyr denne setningen “resultatet er statistisk signifikant”?
Alt som “statistisk signifikant” betyr er at dataene tillot oss å avvise en nullhypotese.
Hva er forskjell på en ensidig og en tosidig test?
En ensidig test er når det kritiske området dekker bare den ene delen av prøvefordelingen.
EKS:
dersom det bare er 0.05 % Alfa i en ensidig test, så ville vi bare forkaste nullhypotesen for bare store eller bare lave verdier av X
En tosidig test da dekker den begge sider. Hvis Alfa er 0.05 da vil det være 0.025 på begge sider
Hva er p-verdien og forklar litt rundt det (Neymans versjon og Fishers versjon).
Neymans:
Et problem med hypotesetestingsprosedyren som jeg har beskrevet, er at den ikke skiller i det hele tatt mellom et resultat som er “knapt signifikant” og de som er “svært signifikant”. Her kommer p-verdi inn.
p-verdien er definert til å være den minste type I feilrate (alfa) som du må være villig til å tolerere hvis du vil forkaste nullhypotesen. Det handler om å tilfeller der man ville kunne forkaste nullhypotesen med mye mer selvtillit, fordi man finner ut hvor signifikant forskjellen er i testen, ved å finne p-verdi
Fishers:
Han mente det måtte være en et tall/prosent man måtte ta hensyn til. En verdi. Dette er altså Alfa=0.05%. Det er denne som er mest brukt i lærebøker, men er ikke like god på å vurdere hva som er veldig, og akkurat signifikant.
Eksempel Tabell 9.5
Hva vil det si dersom du har en p-verdi på p=0.062%?
Det betyr det at du må være villig til å tolerere en type I feilrate på
6,2% for å rettferdiggjøre å avvise null.
Hva kan være et problem med Neymans sin metode?
Dersom forskere kan velge selv og vurdere selv hva som er en høy eller lav alfa verdi, kan man velge den verdien som underbygger det som forskes på.
FEKS:
eksperimentet mitt har mislyktes. Så for å unngå å se ut som om jeg nettopp har funnet på det i ettertid, sier jeg nå at min alfa er 0.1, med argumentet at en |0% type I feilrate ikke er så ille, og på det nivået er testen min betydelig! Jeg vinner.
Hva er de tre vanlige alfa verdiene som forskere stoler på?
Alfa verdi:
0.05% *
0.01% **
0.001% ***
Hva vil det si å ha stor effektstørrelse og liten effektstørrelse
stor effektstørrelse
forskjellen er reell og av praktisk betydning
liten effektstørrelse
Forskjellen er reell, men er kanskje ikke interessant
eks
Jada, nullhypotesen er feil, men det er slett ikke klart at vi faktisk bryr oss fordi effektstørrelsen er så liten.
Hvordan kan man øke kraften i studiet ditt?
For eksempel, i min ESP-studie kan jeg tro at psykiske krefter fungerer best i et stille, mørklagt rom med færre distraksjoner som kan skygge sinnet. Derfor ville jeg prøve å gjennomføre mine eksperimenter i akkurat et slikt miljø. Hvis jeg kan styrke folks ESP-evner på en eller annen måte så den sanne verdien
Kraften øker også dersom du har flere N. For da betyr testen mer
Kort sagt, smart eksperimentell design er en måte å øke kraften på, fordi den kan endre effektstørrelsen.
Hva er en kritisk regionen i teststatistikk?
Det kritiske området i testen tilsvarer verdiene på
Det ville føre til at vi forkastet nullhypotesen (som er grunnen til at den kritiske regionen også noen ganger kalles avvisningsregionen).
Det kritiske området tilsvarer verdiene på X
som vi ville forkaste nullhypotesen for, og den aktuelle utvalgsfordelingen beskriver sannsynligheten for at vi ville oppnå en bestemt verdi av X
hvis nullhypotesen faktisk var sann. La oss nå anta at vi valgte et kritisk område som dekker 20%
av utvalgsfordelingen, og anta at nullhypotesen faktisk er sann.
Og derfor ville vi ha bygget en test som hadde en
alfa på 0,2 nivå på
. Hvis vi vil 0,05
, har den kritiske regionen bare lov til å dekke 5 % av utvalgsfordelingen i teststatistikken vår.