Statistik Flashcards

1
Q

Vad är deskriptiv statistik?

A

Kallas även beskrivande statistik. Beskriver hur verkligheten ser ut, och att beräkna mått som medelvärde, median, minimum och maximum.
Det handlar om korrelation/samvariation.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vad är effektstorlek, och vilket typ av statistik ingår den i?

A

Ingår i deskriptiv statistik. Ett mått på hur stor skillnaden är mellan två grupper, hur mycket de skiljer sig och överlappar.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Vad är analytisk statistik?

A

Även kallad inferentiell statistik. Handlar om att beräkna sannolikheten av att resultat är verkligt eller en slump. Signifikansvärde, p-värde och konfidensintervall ingår i denna typ.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vad är statistisk felmarginal?

A

Ett resultat kan tänkas vara ett medelvärde på 25,5 % +/- 5,5 %. Detta betyder att man med 95 % säkerhet kan säga att resultatet bör vara inom ramen av 11 %. (5,5 * 2). Så resultatet i slutändan kan antingen vara 20 % eller 31 %.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hur minimerar man mätfel?

A

Genom att göra en powerberäkning. Ett eventuellt mätfel minskar ju fler deltagare man har i en studie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Vad är en kvotskala?

A

Den högsta skalnivån, kvantitativ.
Kännetecknas av en nollpunkt, och alla skalsteg har samma avstånd.
T.ex. kan man mäta stämbandslängd i millimeter, och man kan säga att någon har dubbelt så långa stämband.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Vad är en intervallskala?

A

Nästhögsta skalnivån, kvantitativ.
Man mäter lika avstånd. Alla skalsteg har samma avstånd, men nollpunkten är godtycklig. T.ex. celsius-skalan.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Vad är en ordinalskala?

A

Nästägsta skalnivån, kvalitativ.
Man kan ordna upp i en ordning, men det är oklart om det är lika långt avstånd mellan varje skalsteg.
Kan t.ex. användas i skattningsskalor.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Vad är en nominalskala?

A

Lägsta skalnivån, kvalitativ, kategoriskala. Egentligen ingen riktig skala.
T.ex. kön, språk, yrken

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Vilka skalor är kvalitativa eller behandlar kategorisk data?

A

Nominal- och ordinalskalorna.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Vilka skalor är kvantitativa?

A

Intervall- och kvotskalorna.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hur kan binära variabler se ut?

A

0 / 1
Ja / Nej
Positiv / Negativ
Behandling / Ej behandling
Frisk / Sjuk

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Vad ingår i genomsnittsmått?

A

Median, medelvärde och typvärde.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hur beräknar man medianen?

A

Rangordnas från minst till störst. Talet i mitten av rangordningen är medianen. Om man har ett jämnt antal siffror tar man de två som är i mitten och delar dessa på 2.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hur beräknar man medelvärdet?

A

Man tar alla siffror och delar dessa på, exempelvis, antalet deltagare

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Vad är parametriska metoder?

A

Metod för att räkna ut P-värde. Parametriska metoder används när man räknar med exakta siffror, och har data med kvotskala eller intervallskala. Baserat på medelvärdeberäkningar.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Vad skiljer icke-parametriska metoder från parametriska?

A

Icke-parametriska metoder är mer stabila, och det är lättare att inte få ett “galet” resultat.
Parametriska metoder är statistiskt starkare, och det är lättare att få statistisk signifikans.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Vad är, och hur skapar man ett index?

A

I ett index kan man lägga ihop flera variabler, man kan säga att ett index är en variabel som sammanfattar ett antal variabler.
Man kan bedöma röstförmågan med ett flertal tester. Man slår sedan samman poängen/siffrorna, vilket ger en indikation på röstförmågan.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Vad visar en variationsvidd?

A

Variationsvidden visar avståndet från det lägsta till högsta värdet i en normalfördelningskurva.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Vad är ett kvartilavstånd?

A

Avståndet mellan den övre och undre kvartilen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Vad är den undre kvartilen?

A

Den 25:e percentilen, vilket innebär att 25 % har lägre värden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Vad är den övre kvartilen?

A

Den 75:e percentilen, vilket innebär att 75 % har lägre värden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Var och vad är medianen på en normalfördelningskurva?

A

I mitten. Det är den 50:e percentilen, vilket innebär att 50 % har lägre värden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Vad är typvärde?

A

Det värde som flest har.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Vad är en box-and-whiskers-plot? Vad innehåller boxen?

A

En förenklad visualisering av normalfördelningskurva. “Boxen” innehåller avstånd mellan nedre och övre kvartilen. “Whiskers” är svansarna på normalfördelningskurvan, avståndet däremellan visar variationsvidden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Vad är ett histogram?

A

Ett diagram för att visa
fördelning/spridning (distribution) hos en variabel. I ett histogram sitter staplarna ihop, visar frekvens.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Vad är skevhet och vilken typ av skevhet finns?

A

Skevhet är snedfördelad data i en normalfördelningskurva. Positiv skevhet = svansen sluttar mot vänster. (Ser ut som en rutschkana.)

Negativ skevhet = svansen sluttar mot höger.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Vad är bimodal fördelning?

A

Gruppen är sammansatt av två populationer,
en större och en mindre. Två “kamelpucklar” på fördelningskurvan.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Vad är variationskoefficienten?

A

Det är ett standardiserat mått på spridningen hos en variabel. Uttrycks som standardavvikelsen i procent av medelvärdet. Variationskoefficenten gör standardavvikelser på olika mätningar jämförbara.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Hur räknas variationskoefficienten ut?

A

100 * Standardavvikelsen / Medelvärdet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Vad är värdesiffror?

A

Siffror som har ett värde, ex 0,1001 har fyra värdesiffror, men 0,0001 har bara en värdesiffra.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

Vad är ett stapeldiagram/bar chart?

A

Ett diagram som visar värdet för olika grupper och subgrupper inom en grupp.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

Vad är sannolikhetslära?

A

En del av statistiken som handlar om hur sannolikt olika saker är.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

Vad får man om man kombinerar sannolikhetslära och statistik?

A

Inferentiell statistik, som handlar om att dra slutsatser från ett stickprov.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

Beskriv formellt sannolikheten för att singla slant

A

P(gubbe) = 0,5
P(krona) = 0,5
P(summa) = P(gubbe) + P(kronor) = 1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

Vad är sannolikheten att få två ettor på rad i ett tärningskast?

A

Sannolikheten att få en etta är P(1) = 1/6 = 0,167 = 16,7%
P(1+1) = 0,167 * 0,167 = 0,0278 = 2,78 %

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

Vad är binomial fördelning?

A

Normalfördelning fast med staplar. Binomial betyder “två namn”, dvs det finns två möjliga utfall som med slantsinglingar. Exempelvis en kurva som visar fördelningen av utfall av fyra slantsinglingar flera gånger, med sannolikheten för de olika kombinationernas resultat.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
38
Q

Hur många av alla utfall hamnar inom +-3 standardavvikelse?

A

99,7%

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
39
Q

Vad är z-skalan?

A

Det är den enklaste standardskalan för att ta fram standardpoäng. Genom att räkna ut z-poäng kan man jämföra resultat på helt olika mätskalor och frågeformulär.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
40
Q

Hur räknar man ut z-poäng?

A

Z = Resultat - medelvärdet / standardavvikelsen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
41
Q

Vad är index?

A

Ett sammanslaget mått på flera variabler, t.ex flera olika tester.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
42
Q

Vad är slumpmässigt urval för stickprov?

A

Slumpmässigt urval ur populationen.

43
Q

Vad är stratifierat urval?

A

Delar in populationen i mindre grupper exempelvis baserat på kön.

44
Q

Vad är ett bekvämlighetsurval?

A

Att man inkluderar dem som är lättast att få tag på

45
Q

Vad är ett klusterurval?

A

Att välja en naturlig grupp, som en skolklass eller medlemmar i en förening

46
Q

Vad är ett ja-sägar urval?

A

Att alla inbjuds och de som tackar jag accepteras

47
Q

Vad är ett typisk urval?

A

Att man inkluderar personer som anses typiska för den population man vill undersöka

48
Q

Vad är tvåstegsurval?

A

Att man gör ett urval i två steg, exempelvis ett klusterurval av skola och sedan ja-sägar urval av de som säger ja.

49
Q

Vad är två alternativa namn för medelfel?

A

Standardfel, eller Standard Error of the Mean (SEM)

50
Q

Vad är medelfelet?

A

Det slumpmässiga felet vi kan förvänta oss att ett stickprov har. Medelfelet (SE) är alltså det mätfel på medelvärdet
man kan förvänta vid en viss storlek
på stickprovet, och vid en viss
variation i befolkningen.

51
Q

Vad beror medelfelet på?

A

Storleken på stickprovet samt variationen inom den undersökta populationen.

52
Q

Hur räknar man ut medelfelet?

A

Standardavvikelsen / roten ur antalet i stickprovet

53
Q

Vad är den statistiska felmarginalen?

A

Den anger osäkerheten i stickprovet kring ett värde, den sannolikhet att stickprovet skiljer sig från verkligheten. Den statistiska felmarginalen är ytterkantspunkterna för ett konfidensintervall, som är graden av säkerhet att det verkliga värdet stämmer med det uppmätta värdet.

54
Q

Vad är konfidansintervallen?

A

Det intervall som de lägsta och högsta punkterna av felmarginalen sprider sig över

55
Q

Vad innebär det att något är statistiskt säkerhetställt?

A

Att mätningen med 95% säkerhet stämmer.

56
Q

Hur beräknar man 95% felmarginal eller konfidensintervall?

A
  1. Först beräknas medelfelet: Standardavvikelse / roten ur antalet i stickprovet
  2. 95,4 % av fallen hamnar inom +-2 standardavvikelser, på grund av punkterna på fördelningskurvan
  3. 95% felmarginal beräknas 2 * medelfel = Felmarginalen
  4. Konfidensintervallet är medelvärdet -+ felmarginalen
57
Q

Vad står p-värde för?

A

Probability, engelska för sannolikhet. Sannolikheten för att något enbart beror på slumpen.

58
Q

Vad är alfanivå eller signifikansnivå?

A

Det kan ses som en tradition inom forskning. Man har valt en bestämd gräns för vilket p-värde man ska tro på., 00,5

59
Q

Vad är en den vanligaste alfanivån?

A

Den vanligaste alfanivån är 5 %, eller 0,05, men även 1 %, eller 0,01.

60
Q

Vad händer om p-värdet är lägre eller högre än alfanivån?

A

Då kan man säga att resultatet är statistiskt signifikant, och tvärtom om den skulle vara högre än alfanivån.

61
Q

Varför är ett p-värde på 0,05 problematiskt trots att det är statistiskt signifikant?

A

Det blir många falska slumpmässiga resultat som blir “signifikanta”, 1/20. Detta kallas även för typ I-fel.

62
Q

Vad är ett typ I-fel?

A

Att man tror på ett resultat fast att det enbart berodde på slumpen.

63
Q

Vad är nollhypotesen, och vad kan den liknas med?

A

Traditionell statistisk metod. Man testar nollhypotesen - att det inte finns något samband utan att sambandet beror på slumpen, för att kunna bevisa om det finns ett samband.
En kan likna detta med en rättegång, där nollhypotesen är ställd inför rätta. Forskaren är åklagaren som försöker motbevisa nollhypotesen, och det statistiska testet är domaren.

64
Q

Vad är ett typ II-fel?

A

Att det finns ett statistiskt samband, men att det statistiska testet inte visar ett statistiskt signifikant samband. Kan undvikas genom att ha många deltagare.

65
Q

Vad är riktmärket för statistisk power? Alltså den power en studie bör ha för att ge ett statistiskt signifikant resultat.

A

80 %, eller 0,08. Det innebär att det är 80 procents chans att studien ger ett
statistiskt signifikant resultat om det verkligen finns en effekt

66
Q

Om man planerar att utföra ett flertal statistiska analyser inför en studie, hur kan man undvika falska slumpresultat?

A

Planera de statistiska analyserna in datainsamling, och testa enbart ett litet antal hypoteser.

67
Q

Vad kallar man en hypotes som är framtagen i förväg?

A

A priori-hypotes.

68
Q

Vad kallar man en hypotes som är framtagen i efterhand?

A

Post hoc-hypotes.

69
Q

Vad är ett negativt uttryck för post hoc-hypoteser kontra ett positivt?

A

Att man väljer hypoteser efter resultaten, och att man därmed “fiskar signifikanser”. Ett positivt uttryck är att man gör en explorativ, eller utforskande, analys, för
att hitta samband. (Då måste resultatet sedan replikeras för att vara giltigt)

70
Q

Vad är publiceringsbias?

A
  • Att forskare med studier som angett p < 0,05 oftare publicerar sina resultat jämfört med forskare vars studier gav p > 0,05. Detta leder till att de riskerar publicera typ ett fel, med slumpmässiga samband.
  • Dels på grund av att tidskrifter och journaler oftast helst publicerar statistiskt signifikanta resultat.
  • Dels för att forskare kanske helst vill visa att deras hypotes stämmer, och kan tänkas vara mindre motiverade att publicera om studien “blir fel”.
71
Q

Vad är effektstorleken?

A

Effekten av tex en behandling: skillnaden i poäng före och efter. Kan även ange skillnaden i medelvärde mellan två grupper.

72
Q

Vad är cohens d?

A

Skillnad i gruppmedelvärde kan antingen innebära att spridningen överlappar, eller är separerad, trots samma effektstorlek mellan medelvärdena. Cohens d är en standardiserad effektstorlek för att även ta in detta i åtanke. Det anger gruppskillnaden i medelvärde dividerat med gruppernas standardavvikelse.

73
Q

Hur räknas Cohens d ut?

A

Cohend d = Skillnaderna i gruppernas medelvärde / medelvärdet för gruppernas standardavvikelse
(M1-M2 / SD1 + SD2 /2)

74
Q

Vad visar cohens d i den grafiska modellen?

A

Överlappningen mellan grupperna

75
Q

Vad är stor, medium och liten effekt enligt cohen?

A

Stor = 0,8 std
Medium = 0,5 std
Liten = 0,2 std

Per gillar icke detta, för vad som är stort eller litet beror på sammanhanget

76
Q

Vad är skillnaden på statistisk signifikans och effektstorlek?

A

Statistisk signifikans på 0,05 nivån säger att det med 95% sannolikhet finns en effekt större än noll. Säger inget om storleken på effekten. Effektstorlek säger något om storleken, exempelvis hur framgångsrik en behandling var, inte bara med hur stor sannolikhet effekten var verklig, utan även om studien var klinisk signifikant.

77
Q

Vad bör man titta på när man utvärderar ett resultat?

A

P-värdet som indikerar hur stor sannolikhet att resultatet uppstått bara av slump. P-värdet starkt beroende på antal deltagare. Små studier med låg power kan ej ge låga p-värden.

Effektstorlek som indikerar effekten av en behandling eller hur stor skillnaden är mellan två grupper, oberoende av antalet.

Samt spridningen hos resultatet - normalfördelad, undergrupper?

78
Q

Vad är parametriska metoder baserade på för typ av beräkning av?

A

Medelvärdet

79
Q

Vad är icke-parametriska metoder baserade på för typ av av beräkning?

A

Medianen

80
Q

Vad är en fördel och nackdel med parametriska metoder?

A

Den kan ses som något kraftfullare, alltså att den kan ge ett något lägre p-värde. Men resultatet påverkas mycket av outliers/extremvärden.

81
Q

Vilka krav på data kräver parametriska metoder?

A
  • Data i form av kvotskala eller intervallskala (ej ordinaldata).
    – Att data är ungefär normalfördelade, utan outliers.
    – Att grupperna man jämför har ungefär lika standardavvikelse.
82
Q

Vad är fördelar och nackdelar med icke-parametriska metoder?

A

Medianen är ett väldigt stabilt centralmått som inte påverkas av extremvärden. Inte lika kraftfull i vissa situationer som parametriska metodert.

83
Q

Vad är ett dubbelsidigt kontra enkelsidigt test?

A

Om man vill testa hypotesen i båda svansarna eller en av svansarna på normalfördelningskurvan

84
Q

Vilket test ska man välja om man har ordinaldata?

A

Median jämförelse = Icke-parametriskt test

85
Q

Vilket test ska man välja om man har intervall/kvotdata?

A

Parametriskt om datan upfyller kraven, om tveksamt icke-parametriskt

86
Q

Vad är oberoende och beroende data?

A

Oberoende = svaren kommer från olika individer, tex patientgrupp och kontrollgrupp
Beroende = information från samma person vid flera olika tillfällen

87
Q

Vilka test kan man välja om man har kategoridata och ska jämföra grupper?

A

Fishers eller Chitvå

88
Q

Vilket test kan man välja om man har kategoridata och gör upprepade mätningar?

A

McNemars

89
Q

När bör man välja ett icke-parametriskt test?

A

Om man har ordinaldata, tex från skattningsskalor.
Om data har outliers eller ej normalfördelad.
Om små grupper (mindre än 15). Om osäker.

90
Q

Vad är t-test?

A

T-test är ett parametriskt test

91
Q

Vad är Mann-Whitney U-test?

A

Ett test för jämförande av två grupper, icke-parametriskt.

92
Q

Vilka test kan du välja för jämförande av två grupper?

A

Stundents och Welchs (Parametriskt t-test)
Mann-Whitney U-test (icke parametriskt)

93
Q

Vilka test kan du välja för att jämföra två mätningar på samma personer?

A

t-test för beroende data (parametriskt)
Wilcoxon teckenrangtest för beroende data (icke-parametriskt)

94
Q

Vilka test kan du välja för att jämföra ett stickprov mot ett bestämt medelvärde?

A

Parametriskt t-test (for one sample)
Icke-parametriskt Wilcoxon teckenrangtest (for one sample)

95
Q

Vad är korrelation?

A

Samband mellan två eller f lera variabler

96
Q

Vad är skillnaden mellan orsakssamband och korrelation?

A

Korrelation visar samband, men inte orsak. Till exempel så finns ett samband mellan bilolyckor och husbränder, men orsaksambandet är att det är vinter.

97
Q

Vad visar regressionslinjen i en scatterplot?

A

Sambandets riktning, regression är en matematisk modell för att beskriva sambandet mellan två eller flera variabler, kan uttryckas som ekvation

98
Q

Vad är korrelationskoefficienten?

A

Om r är positiv, positiv korrelation, Om r är negativ, negativ korrelation. Om r är 0 ingen korrelation. Värde mellan -1 och 1.

99
Q

Vad är negativ kontra positiv korrelation?

A

Negativ korrelation är när en variabel ökar, så minskar en annan. Positiv korrelation är när en variabel ökar, så ökar en annan.

100
Q

Vad är förklaringsgrad?

A

Effektstorlek (r^2) - hur stark eller svag en korrelation är. Visar hur mycket variation variablerna har gemensamt, delad varations, visar hur mycket cirklarna överlappar

101
Q

Hur räknas förklaringsgrad?

A

r * r = % delad varians

102
Q

Vilken typ av korrelationsanalys bör man välja vid en parametrisk linjär korrelation?

A

Pearsons korrelationskoefficient. Påverkas mycket av extremvärden och snedfördelade data.

103
Q

Vilken typ av korrelationsanalys bör man välja vis en icke-parametrisk linjär korrelation?

A

Spearmans korrelationkoefficient.
- Baseras på rangordning av data
- Stabilt, påverkas ej av outliers
- Lämplig vid ordinaldata

104
Q

Vad anger p-värde för en korrelationskoefficient?

A

P-värdet anger sannolikheten att korrelationen enbart beror på slumpen.