Intro anova Flashcards

1
Q

Vilken typ av test / statistik kan man använda för att testa samband?

A
  1. korrelation
    –> om man har två variabler
  2. Regression
    –> om man har tre eller flera variabler
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vilket typ av test/ statistik kan man använda om man vill testa skillnad?

A
  1. t-test
    –> om man har två grupper
  2. Envägs-ANOVA (F-test)
    –> om man har tre eller flera grupper
  3. Flervägstest (F-test)
    –> om man har två eller fler OBEROENDE variabler
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Nämn de viktigaste måtten för beskrivande statistik

A
  1. centralmått
    –> medelvärde för population eller stickprov
    –> median
    –> mode (mest frekvent förekommande)
  2. spridningsmått
    –> standardavvikelse för population eller stickprov
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

vad beskriver egentligen medelvärdet?

A

Medelvärdet beskriver var tyngdpunkten i fördelningen ligger

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Vad är ett spridningsmått?

A

Spridningsmåttet beskriver hur stora felen är i vårt medelvärde

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

beskriv varians

A

Varians uttycker genomsnittlig avikelse från medelvärdet. Variansen är kvadrerad för att få med alla värden matematiskt (eftersom avvikelsen kan vara både positiv och negativ och kan ta ut varandra gör man alla värden positiva)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Beskriv standardavvikelse

A

standardavvikelsen är medelvärdet av avvikelser från medelvärdet. Standardavvikelse anges i samma skala som det vi mäter. (mäter vi t.ex. cm har vi standardavvikelse i cm tillskillnad från varians)

Standardavvikelsen beskriver hur mycket spridning vi har i vår data med utågngspunkt från medelvärdet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Vad är det vi vill veta när vi gör t.ex. variansanalys?

A

Vi vill veta vilken modell som beskriver vår data med så lite fel som möjligt.
–> Är det nollhypotesen eller alternativhypotesen som beskriver vår data med så lite fel som möjligt?

–> Enligt nollhypotesen beskriver vi vår data med så lite fel som möjligt med ett medelvärde. Inomgruppsvariansen > mellangruppsvariansen

–> Med alternativhypotesen beskriver vi vår data med så lite fel som möjligt med flera medelvärden. Dvs vi kan dela in vår data i två eller flera grupper. Mellangruppsvariansen> inomgruppsvariansen

Vi vill förstå om mellangruppsvariansen är mindre än inomgruppsvariansen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

vad är det vi vill veta när vi gör korrelationsanalys elelr regressionsanalys?

A

Vi vill veta vilken modell som beskriver vår data med så lite fel som möjligt –> nollhypotesen eller alternativhypotesen.

–> nollhypotesen, det finns inget samband mellan våra variabler
–> alternativhypotesen, det finns ett positivt eller negativt samband mellan våra variabler

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Vad menas med normalfördelning?

A
  1. En normalfördelad variabel antar ofta värden som ligger nära medelvärdet och mycket sällan värden som har en stor avvikelse.
  2. En normalfördelad kurva påminner om en kulle eller en klocka
  3. Enligt 68–95–99,7-regeln:
    –> 68% är inom en standardavvikelse från medelvärdet.
    –> Drygt 95% är inom två standardavvikelser från medelvärdet.
    –> Drygt 99,7% är inom tre standardavvikelser från medelvärdet.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Vad menas med negativt skev?

A

Att svansen är mer negativ och huvudsakliga utfallet är mer positivt.

Hur bra bilförare är du jämfört med andra förare? tenderar ofta att bli negativt skev eftesom folk tror att dom är bättre än medel

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Vad menas med positivt skev?

A

Att svansen är mer åt det positiva hållet och att huvudsakliga fördelningen är åt det negativa hållet

Hur stor risk är det att en specifik katastrof drabbar dig jämfört med andra? Folk tenderar att tro att det är större sannolikhet att en katastrof skall hända dom själva och är då vanligt att man ser en positiv skevhet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

vad menas med negativ toppighet?

A

Att kurvan är låg och tillplattad, det innebär att det finns stor spridning. Kanske för itet sample eller folk tolkar frågan olika

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

vad menas med positiv toppighet?

A

Kurvan är en hög spike. De flesta tycker lika dant, man håller bra precision.

Ju lägre standard error desto större precision i mätningarna, mindre osäkerhet och mindre fel.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

vad innebär inferentiell statistik?

A

När man går från att fokusera på vad som är karaktäristiskt för stickprovet som man kollar på i den beskrivande statistiken och istället kollar på karaktäristiska i populationen

Man kikar då t.ex. på p-värde och konfidensintervall

Dvs när man går från stickprov till population

För att kunna göra uttananden om en hypotetisk population utifrån vårt stickprov måste stickprovet vara normalfördelat

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

vad säger p-värdet?

A
  1. p-värdet anger sannolikheten att få resultatet eller mer extrema resultat givet att nollhypotesen är sann
  2. Givet att nollhypotesen är sann (vi har ingen effekt). Vad är sannolikheten för dessa eller mer extrema resultat?
  3. vad är sannolikheten för att resultatet beror av slumpen?
  4. Om p>0.05 så har vi större chans än 5% att resultatet vi fått fram endast beror på slumpen.
  5. p-värdet testar inte H1 utan förkastar endast H0
  6. p-värdet ACCEPTERAR inte H0, utan kan endast förkasta det.
  7. p-värdet är INGET mått på effektstyrka
  8. p-vädet påverkas av stickprovsstorleken
  9. Hur sannolika är dessa data om effekten inte finns?
17
Q

vad innebär effektstyrka/effektstorlek?

A
  1. Hur mycket grupperna faktiskt skiljer sig åt –> ( eller överlappar)
  2. mäts i cohens d
  3. Hur stor oc meningsfull är effekten?
18
Q

vad innebär konfidensintervall?

A

Om man har räknat fram t.ex. en effektstorlek för ett stickprov och vill veta hur stor skillnaden är för populationen kan man presentera det i ett konfidensintervall.

Konfidensintervallet säger att man med 95% säkerhet kommer att ha “det sanna” d-värdet för populationen någonstans mellan [X-Y]

Konfidensintervallet säger någonting om hur säkra vi är på vårt d-värde vi räknat fram