Statt Flashcards

1
Q

Vad används standardfelet för?

A

SE används för att beskriva spridningen i samplingfördelningen. Större SE ger en bredare samplingfördelning

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vad brukar vi anta om samplingfördelningen om vi har ett stort stickprov, varför gör vi detta antagande?

A

Om vi har ett stort antal observationer i stickprovet brukar vi anta att samplingfördelningen är normalfördelad pga centrala gränsvärdessatsen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Vad innebär det praktiskt ifall vi har ett 95%igt konfidensintervall?

A

Om man hade gjort 100 sådana intervall kring stickprovsvärden så hade 95 av dem innehållit det sanna populationsmedelvärdet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vad är regressionslinjen?

A

Den linje som bäst beskriver det linjära sambandet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Vilken datanivå vill vi ha när vi genomför en enkel regressionsanalys?

A

Intervall/kvot

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Vad är formeln för regressionsanalysen och vad innebär dess delar?

A

Y= b0 + b1 x

B0 = intercept
B1 = regressionskoeffecienten ”lutningen”

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hur estimeras b0 och b1?

A

Genom minsta kvadratmetoden

Går ut pp att hitta den linje som i genomsnitt ligger närmast alla punkter

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Vad har vi för antaganden när vi genomför en enkel regressionsanalys?

A
  1. Ett faktiskt samband mellan X och Y. Vi har fått en signifikant korrelation (r) mellan X och Y.
  2. Oberoende mätningar
  3. Normalfördelade residualer:
    Y-värdena för varje givet X-värde bör vara normalfördelade
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Vad är 2 viktiga saker att tänka på när du predicerar utifrån din regressionslinje?

A
  1. Alla bakomliggande antaganden ska vara uppfyllda.
  2. Extrapolera inte. Gå inte utifrån det du har mätt eller vad som är rimligt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

vad är ett typ 1 fel och hur kan man minska dessa?

A

av slumpen får vi ett signifikant resultat av slumpen och förkastar h0 trots att den stämmer. man kan minska genom att sänka alfanivån.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

vad är typ 2 fel och hur relaterar det till power?

A

vi behåller h0 felaktigt. vi hade inte tillräckligt hög power för att upptäcka den signifikanta effekten (pga brus), för att minska kan man höja alfa.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

vilka 4 faktorer påverkar power?

A
  1. alfanivån (höj för mer power)
  2. den sanna effekten (om den är större= lättare att upptäcka. därför är mått på effektstyrka ett användbart mått i powerberäkningar.
  3. större stickprov
  4. inomindividsdesign högre power än mellangruppsdesign
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

varför leder ett ökat stickprov till ökad power?

A

pga att SE minskar

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

vad handlar effektstyrka om?

A

vi vill ha en hög effektstyrka för att kunna ha hög power. men det är ej samma sak.

effektstyrka handlar om storleken på den observerade effekten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

varför vill vi ha reda på effektstyrkan?

A

pga ekonomiska själ vill vi räkna ut hur vi kan maximera power för ett så litet stickprov som möjligt. då vill vi ha mått på effektstyrkan.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

hur mäts effektstyrkan?

A

mäts i Cohens D = ett standardiserat mått på avståndet mellan de två populationsmedelvärdena.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

har kan vi få kunskap om d?

A

d=cohens d= vi vill ha kunskap om medelvärdet och standardavvikelsen i populationen.

  1. tidigare forskning
  2. eget beslut (hur stor effekten behöver vara i vår studie för att den ska ses som intressant)
  3. cohens kategorier
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

benämn cohens tre kategorier för att klassificera effektstorlekar:

A

d= 0.2 (liten effektstyrka) 85% överlapp
d = 0.5 (måttlig) 67% överlapp
d = 0.8 (stark) 53% överlapp

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

vad innebär överlapp i % enligt cohens kategorier?

A

hur stor andel av de två fördelningarna som överlappar med varandra.

liten andel = lite gemensamt = stor skillnad = stor effekt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

beräknas power alltid på samma sätt för alla studier?

A

nej. power beräknas på olika sätt för varje statistisk analys pga den varierar beroende på vilken design man har haft (mellan/individ) och därmed vilken hypotesprövning man genomför (beroende/oberoende t-test).

21
Q

ge en definition av power såsom du skulle skrivit på tentan

A

power är sannolikheten att få ett signifikant resultat givet att nollhypotesen faktiskt är falsk.

22
Q

vilka antaganden ligger bakom att vi väljer att göra en ickeparametrisk hypotesprövning? när gör vi det istället för en parametrisk?

A

icke- parametrisk:
1. nominal ordinal nivå
2. variabler ej antas normalfördelade
3. inget parameterintresse

parametrisk
1. intervall kvot skala
2. kan antas normalfördelade
3. parameterintresse

23
Q

när används chi två och vad innebär denna hypotesprövning?

A

chitvå används om vi har data på nominal ordinal nivå som ej kan antas normalfördelade.

vi jämnför frekvensfördelningen/fördelningsformen du har fått i ditt test med fördelningen som du hade fått av slumpen. är din fördelning tillräckligt osannolik förkastas nollhypotesen.

24
Q

vilka villkor ska vara uppfyllda för att man ska kunna använda chi-två?

A

oberoende observationer
slumpmässiga stickprov (fria från systematiska fel såsom mätfel)

25
Q

vad är ett oberoende t-test?

A

när vi vill hypotespröva en skillnad i två oberoende gruppers medelvärden (mellangruppsdesign)

26
Q

vad är ett beroende t-test?

A

när vi vill hypotespröva medelvärdeskillnaden mellan två beroende grupper (inomindividsdesign)

27
Q

vad är den ickeparametriska motsvarigheten till oberoende t-test?

A

mann-whitney u
testar om frekvensfördelnarnasna är lika eller skiljer sig åt.

  1. värden görs om till en gemensam rangskala
  2. beräkna rangsumman för stickprovet
  3. jämnför med h0
28
Q

vilka villkor ska vara uppfyllda för att vi ska kunna använda mann-whitney u för hypotesprövning?

A

slumpmässiga + oberoende stickprov.

29
Q

vad är den ickeparametriska motsvarigheten till beroende t-test?

A

wilcoxons teckenrangstest.

30
Q

vilket parametrisk och ickeparametriskt test använder man vid jämnförelse av tre eller fler oberoende variabler?

A

envägsoberoende anova

kruskal wallis test (krav oberoende + slumpmässiga stickprov)

31
Q

vilket parametrisk och ickeparametriskt test använder man vid jämnförelse av tre eller fler beroende variabler?

A

envägs beroende anova

friedmans test

32
Q

hur formuleras hypoteserna vid en ickeparametrisk hypotesprövning?

A

hypoteserna formuleras så att de handlar om likheter/skillnader mellan fördelningsformer eller medianer.

33
Q

ge en lista på statistiska fallgropar

A
  1. statistisk samband ingen garanti för kausalt samband
  2. extremvärden
  3. teori vs post hoc-fynd
  4. massignifikansproblemet
  5. regression mot medelvärdet
34
Q

förklara den statistiska fallgropen:
“statistiskt samband ingen garanti för kausalt samband”

A

statistiska samband är ingen garanti för ett kausalt samband. experiment är bättre på att etablera kausala relationer än kvasi eller icke-experiment

35
Q

förklara den statistiska fallgropen:
“extremvärden”

A

kan förvränga effekter. kan bli dåligt om du plockar bort dom, och om du behåller dom.

viktigt att: redovisa om man erhållit extremvärden och exakt hur man gått tillväga för att hantera dem.

36
Q

förklara den statistiska fallgropen:
“post hoc”

A

en teori är mer benägen att förkastas när den prövas med hjälp av en hypotes än när den upptäcks/prövas i efterhand, alltså ad hoc. man kan alltid hitta en rimlig teori eller förklaring som matchar sitt fynd i efterhand, men detta är inte samma som att genomföra en hypotesprövning

Harking = hypothesising after the results are known.

37
Q

förklara den statistiska fallgropen:
“massignifikansproblemet”

A

hur stor den totala risken för minst ett typ 1 fel är vid en alfanivå på 5% beror på antalet signifikansprövningar. risken ökar med fler signifikansprövningar.

lösningar:

  1. begränsa antalet hypotesprövningar
  2. påtala massignifikansproblemet, speciellt vid pos-hoc analyser.
  3. bonferroni korrigering av alfanivån
38
Q

vad är det man gör vid en bonferronikorrigering av alfanivån?

A

sänka alfanivån för vart och ett av testen så att den totala risken för minst 1 typ 1 del ändå inte blir större än 5%.

dock: risk för typ 2 fel ökar.

men om man har många signifikansprövningar är det lämpligt att göra en bonferronikorrigering, även fast det ökar risken för typ 2 fel.

39
Q

är större chans att få ett signifkant resultat beroende på hur många deltagare du har i ditt stickrpov?

A

nej. risken för signifikant resultat av slumpen (typ 1) är precis lika stor i små stickprov som stora.

40
Q

vad finns det för problem med signifikanta resultat som fåtts ur små stickprov?

A

ger troligen en överskattning av den sanna effektstyrkan

41
Q

vad finns det för problem med signifikanta resultat som fåtts ut stora stickprov?

A

alla effekter kan bli signifikanta med tillräckligt stora stickprov.

lösning: stirra dig ej blind på signifikans, utan kolla på styrkan i sambandet (hur hög korrelation osv).

42
Q

ökar risken för att få ett typ 1 eller typ 2 fel av ett litet stickprov?

A

risk för typ 1 fel påverkas inte av ett litet stickprov. men litet stickprov ökar risken för typ 2 fel pga låg power.

43
Q

vad innebär restriction of range?

A

vi behöver ha god varians för att kunna upptäcka samvariation. detta innebär att dålig spridning ökar risken för typ 2 fel.

44
Q

resultat på gruppnivå kan ej alltid generaliseras till individnivå.

A
45
Q

när är det motiverat att använda en bonferroni korrigering?

A

om flera signifikansprövningar testar och en samma övergripande hypotes, kan det vara motiverat att skydda sig mot massignifikansproblemet genom BF korrigering

46
Q

vad innebär regressionsfelslutet/regression mot medelvärdet?

A

en situation då man riskerar att begå regressionsfelslutet är då man väljer ut en extremgrupp, behandlar gruppen på något sätt, och sedan finner att gruppen blivit mindre extrem. och man kan tolkar detta som resultatet av sin intervention när det trots allt skulle kunna bero på att de man mätte först var extremvärden.

om vi vill predicera åsas X utifrån Y, bör vi också predicera att åsa är mer extrem på Y än på X

47
Q

vad används t-test för och villka antaganden ska vara uppfyllda?

A

för att beräkna om det finns en signifikant skillnad mellan 2 gruppers medelvärden

antaganden: intervall/kvotskala
antas normalfördelad

48
Q
A