t-test Flashcards

1
Q

Hvilke typer t-tester finnes?

A

– Ett utvalg t-test (One sample t-test)
– Uavhengig t-test (Independentsamples t-test)
– Avhengig t-test (Matched-sample t-test/Paired sample t-test)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

hvem har opphavet til t-test?

A

Guinness drev vitenskapelig med ølbrygging og ansatte de beste statistikk- og biokjemistudentene fra Oxford og Cambridge. *
William Sealy Gosset var en av dem. *
Gosset introduserte t-testen i 1908 for å teste og sortere stout opp mot hverandre (med lav utvalgsstørrelse)…
* Han måtte publisere under pseudonym (“Student”)
* t-testen kalles fortsatt “Student’s t-test” W

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hva er hensikten med en t-test

A

Man kan teste forskjellen mellom
1. gjennomsnittet i en gruppe og en antatt verdi
2. to grupper
3. mellom to målingstidspunkt

  • t-tester tester om forskjell i gjennomsnitt mellom to grupper er signifikante
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hva er ett utvalg t-test?

A

(One sample t-test)
* Ett utvalg som testes opp mot populasjonen, eller
* mellom gjennomsnittet i en gruppe og en antatt verdi

  • Does 1000 excess calorie intake per day over 8 weeks results in 16 pounds weight increase.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hva er uavhengig t-test?

A

(Independent samples ttest)
* to uavhengige utvalg som sammenlignes
* Har to grupper samme gjennomsnitt eller ikke?

  • Er det forskjell i aggresjonsskårer til en gruppe psykologistudenter og en gruppe matematikkstudenter?
  • Are invisible people more mischievous than visible people?
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hva er avhengig t-test?

A

Avhengig t-test (Matchedsample t-test/Paired sample t-test)

  • To sett data hvor observasjonene er avhengige av hverandre
  • Har samme person ulike gjennomsnitt i to ulike situasjoner?
  • Pre og post-test terapi for måling av de samme forsøkspersonene.
  • Er karakter for andre innlevering av arbeidskrav i PSY2017 høyere enn for den første?
  • Does the average number of disruptive behaviors among patients with dementia differ between spring and autumn?
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hva er forutsentingene for t-test?

A

Independence
* Verdiene i de to gruppene (independent t-test) må være uavhengige

  1. Normality of distribution
    * Den avhengige variabelen er normalfordelt i begge gruppene
  2. Equal variance across groups
    * De to gruppene har samme varians
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hvordan kan man teste for forutsetningene for t-test?

A

Data collection & study design

Histogram, Q-Q plot and tests of normality
det fins statistiske tester for normalfordelingen: * Shapiro-Wilk
Signifikant resultat (dvs. p < .05) betyr at de to gruppene ikke har samme varians

varians: Levene’stest Test of Equality of Variances (Levene’s)
Signifikant resultat (dvs. p < .05) betyr at de to gruppene ikke har samme varians

Welch test
Enten:
Sjekk om variansene er homogene (med Levene’s test).
Hvis den er signifikant, bruk Welch’s test, ellers bruk Student’s test.
Eller:
Alltid rapporter Welch’s test (siden den har en korrektur bygd inn).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hva er stegene i ett utvalg t-test?

A

Steg 1: forutsetningene
Steg 2: hypoteser
Steg 3: test statistikk => t
steg 4: p-verdi
steg 5: konklusjon
- se på stigningstall og signifikans ifht. hypoteser

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Gi eksempel på hvordan rapportere ett utvalgs t-test

A

On average, participants reported less weight gain (M = 10.41, SE = 0.96) than the population average of 16 pounds with a difference of -5.59, 95% CI [-7.64, -3.54], which was significant t(15) = -5.822 p < 0.001), representing an effect size d = 1.46, 95% CI [-2.16, -0.73].

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hvordan skjer testingen av avhengig t-test?

A

For each matched pair, construct a difference score.
d = (number of disruptive behaviors in spring) – (number of disruptive behaviors in autumn).

– Calculate the sample mean of these differences: gjennomsnittXd

Forskjellen (𝛍𝒕𝟏 − 𝛍𝒕𝟐) mellom utvalg gjennomsnitt er identisk med 𝛍𝒅,.
For å teste hypotesen H0: 𝜇𝑡1= 𝜇𝑡2 av samme gjennomsnitt, kan vi utføre ett utvalg t-test av H0: 𝜇𝑑 = 0 med forskjellsskårene.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

hva er formelen for t-testen som regresjon med 1 prediktor?

A

𝑂𝑢𝑡𝑐𝑜𝑚𝑒𝑖 = (model) +𝑒𝑟𝑟𝑜𝑟𝑖
𝑦𝑖 = (𝑏0+b1x1i)+Ei

der i er den i.ende individet
x1i er scoren av x for i

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hva er dummykoding?

A

Dummykoding
I noen sammenhenger er det praktisk å endre verdiene (i dette tilfellet hvilken gruppe de tilhørte) til «dummy variablene» 0 og 1.
Det kan være lettere å se på dette som «er du med i gruppe 1?», ja eller nei?
Dummykoding brukes også i variabler som kjønn. Det finnes ingen fasit på hvem man koder som 0 og hvem man koder som 1.

y=(b0+b1x1) + E

b0 skjæringspunktet blir på gjennomsnittet til den som er kodet 0.

b1 stigningstallet/slope er forventet/målt forskjell i gj.snitt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hva betyr Power analysis and sample size calculation should be done prior to the study?

A

Disse bestemmer statistisk styrke.

  1. see if the invisible cloak had adequate power
  2. Calculate the appropriate sample size with a desired power to detect at least the smallest effect

Area under the curve in the distribution of sampling means for
Ha overlapping the region of significance
for H0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hvordan kan du øke statistisk styrke?

A
  • øke sample size
  • økeeffektstr.
    => mindre overlapp?
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hva er begrensninger ved t-tests?

A

vi kan bare sammenlikne to grupper…
i mange studier har vi mange flere grupper…
men kan vi ikke bare kjøre mange t-tester da?

Hvis vi setter signifikansnivået til 5%… (dvs. p-verdier < 0.05 telles som signifikant)
dette betyr: vi har en 5% sjanse å finne en signifikant effekt selv om H0 stemmer (falsk positiv)!
dette kalles for Type-I feilrate

hver test har 5% feilrate, det betyr at hvis vi kjører mange tester, vi får en økt feilrate for å finne minst ett signifikant funn
Dette kalles for “family-wise error rate” og man bruker ofte Bonferroni-korreksjon for å motvirke…
Dette gjør t-testene får redusert statistisk styrke (det er vanskeligere å finne en ekte effekt).

17
Q

Hva er family-wise error rate?

A

Inflasjon av type 1 feil rate

Hvis vi setter signifikansnivået til 5%… (dvs. p-verdier < 0.05 telles som signifikant)
dette betyr: vi har en 5% sjanse å finne en signifikant effekt selv om H0 stemmer (falsk positiv)!
dette kalles for Type-I feilrate

hver test har 5% feilrate, det betyr at hvis vi kjører mange tester, vi får en økt feilrate for å finne minst ett signifikant funn
eks. hvis vi tester forskjeller i angst i mange land trenger vi kanskje 5 tester per land (pga. grupper?) og vanskelig
alfa man får fra bonferroni blir lav…

man bruker ofte Bonferroni-korreksjon for å motvirke…
da finner man et nytt signifikans-cutoff, men når den blir veldig lav øker vi sjansen for type ii feil

det blir lav statistisk styrke

og ANOVA!

18
Q

Hva er cohens d for de ulike t-testene

A

Ett utvalgs t-test og avhengig har samme pga.:
For å teste hypotesen H0: 𝜇𝑡1= 𝜇𝑡2 av samme gjennomsnitt, kan vi utføre ett utvalg t-test av H0: 𝜇𝑑 = 0 med forskjellsskårene.
d= t/sqrt(n)

uavhengig er
gjennomsnittx1-gj.snittsx2/s(pooled)

der s pooled er sammenslått varians