5 - T-tester Flashcards

1
Q

Hva er en hypotese, og hvilke to hypoteser bruker man i et NHST-rammeverk?

A

I nullhypotese signifikans testingsrammeverk (NHST), jobber man ut ifra en hypotese. Dette er en begrunnet gjetning man har før man gjennomfører et forskningsprosjekt. Denne er gjerne avledet av tidligere teori eller forskning. I et NHST-rammeverk jobber man ut ifra to hypoteser: nullhypotesen og den alternative hypotesen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hva er nullhypotesen?

A

Nullhypotesen (H0) påstår at det ikke er noe som skjer, at det ikke er en effekt. I en t-test kan nullhypotesen være at det ikke noe forskjell på gruppene. I en korrelasjons analyse kan nullhypotesen være at det ikke er en korrelasjon mellom variablene. Dette er eksempler på ikke-retningsbestemte hypoteser, altså der man ikke har noen tanker om hvilken retning korrelasjonen eller forskjellen mellom gruppene er. Er hypotesen retningsbestemt kan nullhypotesen påstå at det er en effekt, men ikke i den retningen vi antar, men i motsatt retning. Antar vi for eksempel at det er en positiv korrelasjon mellom to variabler, vil nullhypotesen være at det ikke er en positiv korrelasjon mellom variablene.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hva er den alternative hypotesen?

A

Den alternative hypotesen vil påstå at det er effekt (H1). Den vil altså påstå det motsatte av nullhypotesen. I en t-test vil den påstå at det er en forskjell mellom gruppene eller at det er en korrelasjon mellom to variabler. Dette er da eksempler på ikke-retningsbestemte hypoteser. Er hypotesen retningsbestemt vil den alternative hypotesen si noe om hvilken retning en antar at hypotesen er i. For eksempel at korrelasjonen mellom variablene er positiv.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hvorfor er de to hypotesene viktige for nullhypotesetesting?

A

H1 og H0 er nyttige verktøy når man gjennomfører statistiske tester. Når man gjennomfører statistiske tester jobber man ut ifra at nullhypotesen er sann. Får man en p-verdi < .05 forkaster man nullhypotesen og aksepterer den alternative hypotesen. H1 og H0 er gjensidig ekskluderende, som betyr at hvis vi forkaster H0, så betyr det automatisk at vi aksepterer H1.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hva representerer p-verdien? Og når regner man resultatet som statsistisk signifkant?

A

P-verdien representerer sannsynligheten for å oppnå en verdi som er minst like ekstrem som vår teststatistikk, gitt at nullhypotesen er sann.
P-verdien kan variere mellom 0 og 1, og jo lavere p-verdien er, desto mindre sannsynlig er det å at vi vil få de samme resultatene hvis nullhypotesen er sann. Man kan si at P-verdien hjelper oss å se på i hvor stor grad vi kan stole på nullhypotesen og at statistikken vi står ovenfor ikke bare skyldes tilfeldigheter.

Det er vanlig å bruke et alfanivå på 0.05. Får men en på p-verdi mindre enn 0.05, forkaster man nullhypotesen, og den alternative hypotesen aksepteres. Da regner man resultatet som statistisk signifikant.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Kan man bruke p-verdien til å tolke effekt?

A

Nei, det er viktig å nevne at P-verdien gir ikke informasjon om hvor sterk effekten er, bare om hvor stor sannsynlighet det er at resultatet er signifikant. Selv om p-verdien er lav, betyr det ikke nødvendigvis at effekten er stor eller klinisk viktig.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hva er en t-test?

A

En t-test er en statistikk analyse som hjelper oss å undersøke om det er en statistisk signifikant forskjell mellom gjennomsnittet fra to ulike målinger.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hva er de tre typene t-tester? Hvordan er de forskjellige?

A

De tre typene t-test er independent t-test, paired-samples t-test og one-sample t-test.

I en «independent t-test» så kommer de to målene fra ulike grupper. For eksempel gutter og jenter, eller eksperiment- og kontrollgruppe.

I en «paired samples t-test” så kommer de to målene fra samme gruppe. For eksempel ved fødsel og ved 1-år, eller før og etter behandling hos samme pasient.

I «one-sample t-test” så sammneligner man data fra en gruppe mot en forhåndsdefinert verdi. For eksempel «Er korrelasjonen mellom to variabler forskjellig fra 0?».

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hva er Student’s t-distribusjoner? og hvordan er forskjellig?

A

Students t-distribusjon er en utvalgsfordeling av t-tester. Den representerer sannsynligheten for t-verdier fra mange hypotetiske eksperiment der vi vet at det ikke er noe gruppeforskjell, altså at nullhypotesen er sann. Dette vil gjøre at alle t-distribusjoner vil være sentrert rundt null, fordi hvis det ikke er forskjell i gruppegjennomsnittene, vil telleren være lik 0, og dermed vil også t-skåren bli null.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hvordan er t-distribusjonene forskjellig?

A

Det er mange t-distribusjoner, og dette er avhengig av frihetsgradene. For independent t-test så er frihetsgradene df = n1+n2 - 2, og får paired-samples og one-samples så er frihetsgrader n -1.

Jo flere frihetsgrader det er, jo nærmere en standard normaldistribusjon vil t-distribusjonen være, og dette stemmer overens med sentralgrenseteoremet. Jo færre frihetsgrader man har, jo tykkere blir halene på distribusjonen (leptokurtisk). Dette kommer av at det er større sannsynlighet for å få en ekstremverdi når man har et mindre utvalg og dermed vil det være flere verdier i halene.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hva kan man bruke students t-distribusjoner til?

A

Man kan bruke t-distribusjonen til å finne de kritiske t-skårene, hvis det er en ikke-retningsbestemt H0 eller den kritiske t-skåren hvis H0 er retningsbestemt, for p <.05. Og på denne måten kan man finne ut om det er en signifikant gruppeforskjell eller ikke.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hva representerer en t-skår?

A

T-tester krever beregning av en teststatistikk, som er t-skåren.

T-skåren representerer forskjellen i gjennomsnittet av to målinger (teller), standardisert av den estimerte standardfeilen for denne forskjellen (nevneren).

T-skåren kan betraktes som et “signal-til-støy-forhold”, der “signal” er telleren, og “støy” er nevneren. Støy handler i denne sammenhengen hvor nøyaktig kan vi estimere signalet. Altså sier t-skåren noe om forholdet mellom forskjellen mellom gruppene og variasjon innad i hver gruppe.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hvordan kan en t-skår bli brukt til nullhypotesetesting?

A

Man kan bruke t-distribusjonen til å finne de kritiske t-skårene, hvis det er en ikke-retningsbestemt H0, eller den kritiske t-skåren hvis H0 er retningsbestemt, for p <.05
Man kan så se om t-skåren man har fått er innenfor den eller de kritiske verdiene. Hvis den er det (p <.05) så kan vi forkaste H0, men hvis t-skåren ikke er det (p >.05) så må man beholde H0.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hva er forskjellen mellom en enhalet og en tohalet t-test?

A

En enhalet t-test og en tohalet t-test er to t-tester som tester ulike hypoteser. Om en test er en eller tohalet er bestemt av hvorvidt hypotesen er retningsbestemt eller ikke.

Dersom forskningsspørsmålet er retningsbestemt, gjennomfører man en enhalet t-test. Her kan den alternative hypotesen for eksempel være: «Jenter er mer på sosiale medier en gutter», mens nullhypotesen vil være «jenter er ikke mer på sosiale medier enn gutter».

Dersom forskningsspørsmålet ikke er retningsbasert, gjennomfører man en tohalet t-test. Her kan den alternative hypotesen for eksempel være: «Det er en forskjell i gjennomsnittlig antall timer skjermtid hos gutter og jenter». Her sies det ikke noe om retningen forskjellen er i. Nullhypotesen vil da være «det er ingen gruppeforskjell i gjennomsnittlig antall timer skjermtid for gutter og jenter.

I en enhalet t-test vil området på t-distribusjonen som inneholder signifikante verdier være samlet på en side og tilsvarer 5%. Mens til en tohalet t-test, vil området på t-distribusjonen som inneholder signifikante verdier være fordelt på begge sider av halene, og tilsvare 2,5% hver.

Derfor kan den samme statistikken være signifikant i en enhalet test, men ikke signifikant i en tohalet test. Selv om signifikante resultater lettere kan oppnås med enhalede t-tester, bør disse generelt unngås, og kun brukes hvis bruken er godt begrunnet i forskningsspørsmålet. Dette er fordi enhalede tester også har større sjanser for å gi “falske positive” resultater, altså «type-1 feil».

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hvordan kan 95% konfidensintervall bli brukt til hypotesetesting? 2 måter:

A
  • Se på om konfidensintervallene overlapper med hverandre
  • Se om konfidensintervallet for gjennomsnittlig forskjell inneholder 0.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hvordan kan 95% konfidensintervall bli brukt til hypotesetesting: se på overlapping på to konfidensintervaller

A

Man kan også bruke konfidensintervallet til to grupper for å se om de overlapper og på den måten se om de er signifikant forskjellige. Hvis de er signifikant forskjellige kan vi forkaste H0.
Dersom gjennomsnittene fra begge utvalgene ikke overlapper med hverandres CI, kan vi si at de er signifikant forskjellige (p < .05). Dersom de overlapper må vi anta at det ikke er en signifikant forskjell (p > .05).

Hvis de er et moderat overlapp mellom konfidensintervallene så er det usikkert om det er en signifikant forskjell (p <.05). Da må vi gjennomføre en t-test for å være sikre.

17
Q

Hvordan kan 95% konfidensintervall bli brukt til hypotesetesting: se på om konfidensintervallet overlapper med 0

A

En annen måte man kan vurdere signifikans ved konfidensintervall mer preisist, er å se på om det 95% konfidensintervall for gjennomsnittlig forskjell mellom målingene (Mdiff) overlapper med 0. Hvis de ikke overlapper med 0, er det 95% sjanse for at den sanne parameteren er utenfor null, noe som betyr at gjennomsnittene faktisk er signifikant forskjellige.
Og derfor, hvis vi gjør denne konklusjonen, altså forkaster H0, er det en 5% sjanse for at vi gjør en feil konklusjon. Og dette er det samme som å si at for vår teststatistikk er p < 0,05.

18
Q

Hva er effektstørrelse? Hvorfor er effektstørrelse viktig i nullhypotesetesting?

A

Effektstørrelse er standardisert mål som hjelper oss å forstå hvor stor den observerte forskjellen er.

Selv om en effekt er statistisk signifikant, kan effekten være ubetydelig i det virkelige liv. Vi trenger ikke bare å vite om den observerte effekten er signifikant, men også om denne effekten er stor nok til at den er av praktisk interesse i det virkelige liv.

Det finnes flere mål for effektstørrelse, blant annet Cohens D og Pearsons R.

19
Q

Hva er Cohen´s D?

A

Cohens D er et standardisert mål som uttrykker størrelsen på forskjellen mellom målinger, når det gjelder variasjon i dataene.

20
Q

Hvordan regner man Cohens D?

A

Cohens d regnes ut ved å trekke gruppegjennomsnittene fra hverandre og dele dette på et samlet standardavvik for begge gruppene (pooled SD). Cohen’s d kan være positiv eller negativ, avhengig av hvilken gruppe som har høyere gjennomsnittsverdi. Den kan også være over 1.

21
Q

Hvordan tolkes Cohens d?

A

Tommelfinger regel for å tolke Cohens d er at verdier:
– En verdi rundt 0.2 indikerer en svak/liten effekt
– En verdi rundt 0.5 indikerer en moderat effekt
– En verdi rundt eller høyere enn 0.8 indikerer stor effekt.

22
Q

Hvilke kontroll av forutsetninger (assumtion checks) blir gjort før en t-test, og hvorfor?

A

Et av forutsetningene for t-testen er at det er homogenitet i variansen mellom gruppene, altså at variansen fra de to målingene burde være statistiske like. For å sjekke dette bruker man en Levenes test, og her skal p-verdien være lik eller mer enn .05, altså IKKE-signifikant.

En annen forutsetningen er at den avhnegige variabelen er normalfordelt og dette sjekker vi med Shapiro-Wilks test. Hvis p-verdien er lik eller over .05, er data normalfordelt. Om data ikke er nromalfordelt så kan vi ikke bruke students-t.test, men heller Welch.