5 - T-tester Flashcards
Hva er en hypotese, og hvilke to hypoteser bruker man i et NHST-rammeverk?
I nullhypotese signifikans testingsrammeverk (NHST), jobber man ut ifra en hypotese. Dette er en begrunnet gjetning man har før man gjennomfører et forskningsprosjekt. Denne er gjerne avledet av tidligere teori eller forskning. I et NHST-rammeverk jobber man ut ifra to hypoteser: nullhypotesen og den alternative hypotesen.
Hva er nullhypotesen?
Nullhypotesen (H0) påstår at det ikke er noe som skjer, at det ikke er en effekt. I en t-test kan nullhypotesen være at det ikke noe forskjell på gruppene. I en korrelasjons analyse kan nullhypotesen være at det ikke er en korrelasjon mellom variablene. Dette er eksempler på ikke-retningsbestemte hypoteser, altså der man ikke har noen tanker om hvilken retning korrelasjonen eller forskjellen mellom gruppene er. Er hypotesen retningsbestemt kan nullhypotesen påstå at det er en effekt, men ikke i den retningen vi antar, men i motsatt retning. Antar vi for eksempel at det er en positiv korrelasjon mellom to variabler, vil nullhypotesen være at det ikke er en positiv korrelasjon mellom variablene.
Hva er den alternative hypotesen?
Den alternative hypotesen vil påstå at det er effekt (H1). Den vil altså påstå det motsatte av nullhypotesen. I en t-test vil den påstå at det er en forskjell mellom gruppene eller at det er en korrelasjon mellom to variabler. Dette er da eksempler på ikke-retningsbestemte hypoteser. Er hypotesen retningsbestemt vil den alternative hypotesen si noe om hvilken retning en antar at hypotesen er i. For eksempel at korrelasjonen mellom variablene er positiv.
Hvorfor er de to hypotesene viktige for nullhypotesetesting?
H1 og H0 er nyttige verktøy når man gjennomfører statistiske tester. Når man gjennomfører statistiske tester jobber man ut ifra at nullhypotesen er sann. Får man en p-verdi < .05 forkaster man nullhypotesen og aksepterer den alternative hypotesen. H1 og H0 er gjensidig ekskluderende, som betyr at hvis vi forkaster H0, så betyr det automatisk at vi aksepterer H1.
Hva representerer p-verdien? Og når regner man resultatet som statsistisk signifkant?
P-verdien representerer sannsynligheten for å oppnå en verdi som er minst like ekstrem som vår teststatistikk, gitt at nullhypotesen er sann.
P-verdien kan variere mellom 0 og 1, og jo lavere p-verdien er, desto mindre sannsynlig er det å at vi vil få de samme resultatene hvis nullhypotesen er sann. Man kan si at P-verdien hjelper oss å se på i hvor stor grad vi kan stole på nullhypotesen og at statistikken vi står ovenfor ikke bare skyldes tilfeldigheter.
Det er vanlig å bruke et alfanivå på 0.05. Får men en på p-verdi mindre enn 0.05, forkaster man nullhypotesen, og den alternative hypotesen aksepteres. Da regner man resultatet som statistisk signifikant.
Kan man bruke p-verdien til å tolke effekt?
Nei, det er viktig å nevne at P-verdien gir ikke informasjon om hvor sterk effekten er, bare om hvor stor sannsynlighet det er at resultatet er signifikant. Selv om p-verdien er lav, betyr det ikke nødvendigvis at effekten er stor eller klinisk viktig.
Hva er en t-test?
En t-test er en statistikk analyse som hjelper oss å undersøke om det er en statistisk signifikant forskjell mellom gjennomsnittet fra to ulike målinger.
Hva er de tre typene t-tester? Hvordan er de forskjellige?
De tre typene t-test er independent t-test, paired-samples t-test og one-sample t-test.
I en «independent t-test» så kommer de to målene fra ulike grupper. For eksempel gutter og jenter, eller eksperiment- og kontrollgruppe.
I en «paired samples t-test” så kommer de to målene fra samme gruppe. For eksempel ved fødsel og ved 1-år, eller før og etter behandling hos samme pasient.
I «one-sample t-test” så sammneligner man data fra en gruppe mot en forhåndsdefinert verdi. For eksempel «Er korrelasjonen mellom to variabler forskjellig fra 0?».
Hva er Student’s t-distribusjoner? og hvordan er forskjellig?
Students t-distribusjon er en utvalgsfordeling av t-tester. Den representerer sannsynligheten for t-verdier fra mange hypotetiske eksperiment der vi vet at det ikke er noe gruppeforskjell, altså at nullhypotesen er sann. Dette vil gjøre at alle t-distribusjoner vil være sentrert rundt null, fordi hvis det ikke er forskjell i gruppegjennomsnittene, vil telleren være lik 0, og dermed vil også t-skåren bli null.
Hvordan er t-distribusjonene forskjellig?
Det er mange t-distribusjoner, og dette er avhengig av frihetsgradene. For independent t-test så er frihetsgradene df = n1+n2 - 2, og får paired-samples og one-samples så er frihetsgrader n -1.
Jo flere frihetsgrader det er, jo nærmere en standard normaldistribusjon vil t-distribusjonen være, og dette stemmer overens med sentralgrenseteoremet. Jo færre frihetsgrader man har, jo tykkere blir halene på distribusjonen (leptokurtisk). Dette kommer av at det er større sannsynlighet for å få en ekstremverdi når man har et mindre utvalg og dermed vil det være flere verdier i halene.
Hva kan man bruke students t-distribusjoner til?
Man kan bruke t-distribusjonen til å finne de kritiske t-skårene, hvis det er en ikke-retningsbestemt H0 eller den kritiske t-skåren hvis H0 er retningsbestemt, for p <.05. Og på denne måten kan man finne ut om det er en signifikant gruppeforskjell eller ikke.
Hva representerer en t-skår?
T-tester krever beregning av en teststatistikk, som er t-skåren.
T-skåren representerer forskjellen i gjennomsnittet av to målinger (teller), standardisert av den estimerte standardfeilen for denne forskjellen (nevneren).
T-skåren kan betraktes som et “signal-til-støy-forhold”, der “signal” er telleren, og “støy” er nevneren. Støy handler i denne sammenhengen hvor nøyaktig kan vi estimere signalet. Altså sier t-skåren noe om forholdet mellom forskjellen mellom gruppene og variasjon innad i hver gruppe.
Hvordan kan en t-skår bli brukt til nullhypotesetesting?
Man kan bruke t-distribusjonen til å finne de kritiske t-skårene, hvis det er en ikke-retningsbestemt H0, eller den kritiske t-skåren hvis H0 er retningsbestemt, for p <.05
Man kan så se om t-skåren man har fått er innenfor den eller de kritiske verdiene. Hvis den er det (p <.05) så kan vi forkaste H0, men hvis t-skåren ikke er det (p >.05) så må man beholde H0.
Hva er forskjellen mellom en enhalet og en tohalet t-test?
En enhalet t-test og en tohalet t-test er to t-tester som tester ulike hypoteser. Om en test er en eller tohalet er bestemt av hvorvidt hypotesen er retningsbestemt eller ikke.
Dersom forskningsspørsmålet er retningsbestemt, gjennomfører man en enhalet t-test. Her kan den alternative hypotesen for eksempel være: «Jenter er mer på sosiale medier en gutter», mens nullhypotesen vil være «jenter er ikke mer på sosiale medier enn gutter».
Dersom forskningsspørsmålet ikke er retningsbasert, gjennomfører man en tohalet t-test. Her kan den alternative hypotesen for eksempel være: «Det er en forskjell i gjennomsnittlig antall timer skjermtid hos gutter og jenter». Her sies det ikke noe om retningen forskjellen er i. Nullhypotesen vil da være «det er ingen gruppeforskjell i gjennomsnittlig antall timer skjermtid for gutter og jenter.
I en enhalet t-test vil området på t-distribusjonen som inneholder signifikante verdier være samlet på en side og tilsvarer 5%. Mens til en tohalet t-test, vil området på t-distribusjonen som inneholder signifikante verdier være fordelt på begge sider av halene, og tilsvare 2,5% hver.
Derfor kan den samme statistikken være signifikant i en enhalet test, men ikke signifikant i en tohalet test. Selv om signifikante resultater lettere kan oppnås med enhalede t-tester, bør disse generelt unngås, og kun brukes hvis bruken er godt begrunnet i forskningsspørsmålet. Dette er fordi enhalede tester også har større sjanser for å gi “falske positive” resultater, altså «type-1 feil».
Hvordan kan 95% konfidensintervall bli brukt til hypotesetesting? 2 måter:
- Se på om konfidensintervallene overlapper med hverandre
- Se om konfidensintervallet for gjennomsnittlig forskjell inneholder 0.