Statistik Flashcards

1
Q

Parameter

A

Värde som beskriver populationen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Estimat

A

Värde som vi mätt eller beräknat från stickprovet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Typvärde

A

Det vanligaste värdet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Median

A

Det mittersta värdet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Medelvärde

A

Det genomsnittliga värdet. Väntevärdesriktigt!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Väntevärdesriktigt

A

Stickprovsmedelvärdet förväntas motsvara populationsmedelvärdet i det långa loppet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Variationsbredd

A

Skillnaden mellan det högsta och lägsta värdet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Percentiler & Kvartiler

A

Värde under vilket en viss andel av fördelningen ligger

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Varians & Standardavvikelse

A

Genomsnittlig variation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Normalfördelningen

A

Beskrivning av hur data är fördelad. Standardavvikelserna sammanfaller med vissa specifika percentiler

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Z-värden

A

Sätt att skriva om data så att varje värde beskriver hur många standardavvikelser det är från medelvärdet. Standardisering av data, förenklar att jämföra variabler med varandra

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Pearsons korrelationskoefficient

A

Standardiserat mått på samvarians. Påvisar endast linjära korrelationer. Påverkas mycket av extremvärden. Kräver tillräcklig variation i båda variablerna

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Spearmans rangkorrelationskoefficient

A

Baserad på observationers rangordning istället för deras z-värden. Används t.ex. när data är ordinalskala, inte normalfördelad eller vid förekomst av extremväden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Regression

A

Används för att förutsäga värdet av en variabel baserat på värdet av en annan. Innefattar regressionskoefficient(er) och ett intercept. Viktigt att skilja på beroende och oberoende variabel

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Enkel linjär regressionsanalys

A

y=b0+b1x
b1 anger linjens lutning. b0 säger var linjen skär y-axeln, och kan ses som “basnivå” och b1 som ett mått på hur mycket den beroende variabeln “beror” på den oberoende variabeln

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Samplingsfördelningen

A

Uppskattning av hur mycket stickprov av en viss storlek från en viss population varierar. Variationen i samplingsfördelningen kan uppskattas m h a variationen i vårt stickprov. Ju mindre standardfel, desto närmare befinner sig stickproven populations medelvärde

17
Q

Standardfelet (SE)

A

Standardavvikelsen i samplingsfördelningen. Mått på hur mycket våra stickprov varierar

18
Q

Konfidensintervall

A

Avgränsar ett intervall inom vilket vi kan vara “ganska säkra” på att populationens medelvärde ligger (Oftast 95%). Om vi skapade 100 KI från samma population skulle ungefär 95 stycken innefatta populationens medelvärde

19
Q

Nollhypotestestning

A

Baserat på att beräkna sannolikheten att våra resultat skulle uppstå givet att nollhypotesen gäller. Ett sätt att avgöra om resultaten från ett statistiskt test är rimligt att generalisera till populationen eller inte

20
Q

T-test

A

Sätt att avgöra om medelvärdet skiljer sig från ett visst värde. Används ofta för att avgöra om två variabler skiljer sig från varandra. Statistiskt signifikant t-test betyder att observationerna vore osannolika utifall att det egentligen inte finns någon skillnad

21
Q

Oberoende t-test

A

Används för att jämföra olika grupper

22
Q

Beroende t-test

A

Används för att jämföra olika mätningar inom samma grupp. Slipper en del brus pga individuella variationer och blir därför mer kraftfulla än oberoende t-test

23
Q

Parametriska test

A

Förutsätter att data är på antingen intervall- eller kvotskala

24
Q

Antaganden - Normalfördelning

A

Många test antar att populationens värden är normalfördelade. Ofta vet vi ej säkert om populationen är normalfördelad, tillräckligt stort stickprov ger ofta en bra uppskattning

25
Q

Antaganden - Homogen populationsvarians

A

Värden i alla de variabler man jämför varierar lika mycket. Tumregel att variansen får vara max tre gånger så stor

26
Q

Icke-parametriska test

A

Går ut på att räkna på datavärdenas inbördes rank. Pga detta går det att använda icke-parametriska test när data inte uppfyller kraven på intervall-/kvotskala, normalfördelning och homogen varians

27
Q

Effektstorlek

A

Standardiserade mått på effekters storlek. Användbart då man har variabler vars tolkning inte är uppenbar. Som effektstorlek för skillnader kan vi använda Cohens d. För oberoende mätningar baseras s på den “poolade variansen”

28
Q

Statistisk power

A

Power kan tolkas som sannolikheten att få ett statistiskt signifikant resultat givet att nollhypotesen är falsk. Alfanivån, faktiska effektstorleken, stickprovets storlek, sd i populationen, och experimentell design påverkar power

29
Q

Powerberäkningar

A

Ta reda på hur stort stickprov man behöver för att nå en viss power. Använder sig av hjälpvariabeln delta.

30
Q

Extremvärden

A

Kan ofta ha en oproportionerligt stor påverkan på statistiska test. Vanlig tumregel: tre sd från medelvärdet. Möjliga lösningar - Ta bort värdena. Använda icke-parametriska test

31
Q

Massignifikans

A

Viss sannolikhet att typ-I fel är inbyggd i nollhypotestestning. Utför man många tester i samma undersökning blir sannolikheten för Typ-I fel högre. Kan kompenseras med bonferronikorrigering (proportionerligt sänka alfanivån)

32
Q

Små stickprov

A

Bara väldigt stora effekter blir statistiskt signifikanta. Kan leda till överskattning av effektstorlek

33
Q

Stora stickprov

A

Även väldigt små effekter blir statistiskt signifikanta. Innebär att man måste vara noga med att kontrollera praktisk signifikans

34
Q

Ensidig prövning

A

Vi vill veta om det finns en effekt i en viss riktning. Finns positivt/inte positivt samband mellan studietid och tentaresultat

35
Q

Tvåsidig prövning

A

Vi vill veta om det finns en effekt eller inte. Finns samband/inget samband mellan studietid och tentaresultat

36
Q

Typ I-fel

A

Att förkasta nollhypotesen trots att den gäller. Sannolikheten är lika med alfanivån. Sänkning av alfanivån gör typ I-fel mindre sannolika men Typ-II fel mer sannolika

37
Q

Typ II-fel

A

Att behålla nollhypotesen trots att alternativhypotesen gäller. Sannolikheten påverkas av stickprovsstorlek, effektstorlek, felvarians och beroende mätningar