Statistik Flashcards

Question 1

Q

Vad är deskriptiv statistik?

Answer

A

Kallas även beskrivande statistik. Beskriver hur verkligheten ser ut, och att beräkna mått som medelvärde, median, minimum och maximum.
Det handlar om korrelation/samvariation.

Question 2

Q

Vad är effektstorlek, och vilket typ av statistik ingår den i?

Answer

A

Ingår i deskriptiv statistik. Ett mått på hur stor skillnaden är mellan två grupper, hur mycket de skiljer sig och överlappar.

Question 3

Q

Vad är analytisk statistik?

Answer

A

Även kallad inferentiell statistik. Handlar om att beräkna sannolikheten av att resultat är verkligt eller en slump. Signifikansvärde, p-värde och konfidensintervall ingår i denna typ.

Question 4

Q

Vad är statistisk felmarginal?

Answer

A

Ett resultat kan tänkas vara ett medelvärde på 25,5 % +/- 5,5 %. Detta betyder att man med 95 % säkerhet kan säga att resultatet bör vara inom ramen av 11 %. (5,5 * 2). Så resultatet i slutändan kan antingen vara 20 % eller 31 %.

Question 5

Q

Hur minimerar man mätfel?

Answer

A

Genom att göra en powerberäkning. Ett eventuellt mätfel minskar ju fler deltagare man har i en studie.

Question 6

Q

Vad är en kvotskala?

Answer

A

Den högsta skalnivån, kvantitativ.
Kännetecknas av en nollpunkt, och alla skalsteg har samma avstånd.
T.ex. kan man mäta stämbandslängd i millimeter, och man kan säga att någon har dubbelt så långa stämband.

Question 7

Q

Vad är en intervallskala?

Answer

A

Nästhögsta skalnivån, kvantitativ.
Man mäter lika avstånd. Alla skalsteg har samma avstånd, men nollpunkten är godtycklig. T.ex. celsius-skalan.

Question 8

Q

Vad är en ordinalskala?

Answer

A

Nästägsta skalnivån, kvalitativ.
Man kan ordna upp i en ordning, men det är oklart om det är lika långt avstånd mellan varje skalsteg.
Kan t.ex. användas i skattningsskalor.

Question 9

Q

Vad är en nominalskala?

Answer

A

Lägsta skalnivån, kvalitativ, kategoriskala. Egentligen ingen riktig skala.
T.ex. kön, språk, yrken

Question 10

Q

Vilka skalor är kvalitativa eller behandlar kategorisk data?

Answer

A

Nominal- och ordinalskalorna.

Question 11

Q

Vilka skalor är kvantitativa?

Answer

A

Intervall- och kvotskalorna.

Question 12

Q

Hur kan binära variabler se ut?

Answer

A

0 / 1
Ja / Nej
Positiv / Negativ
Behandling / Ej behandling
Frisk / Sjuk

Question 13

Q

Vad ingår i genomsnittsmått?

Answer

A

Median, medelvärde och typvärde.

Question 14

Q

Hur beräknar man medianen?

Answer

A

Rangordnas från minst till störst. Talet i mitten av rangordningen är medianen. Om man har ett jämnt antal siffror tar man de två som är i mitten och delar dessa på 2.

Question 15

Q

Hur beräknar man medelvärdet?

Answer

A

Man tar alla siffror och delar dessa på, exempelvis, antalet deltagare

Question 16

Q

Vad är parametriska metoder?

Answer

A

Metod för att räkna ut P-värde. Parametriska metoder används när man räknar med exakta siffror, och har data med kvotskala eller intervallskala. Baserat på medelvärdeberäkningar.

Question 17

Q

Vad skiljer icke-parametriska metoder från parametriska?

Answer

A

Icke-parametriska metoder är mer stabila, och det är lättare att inte få ett “galet” resultat.
Parametriska metoder är statistiskt starkare, och det är lättare att få statistisk signifikans.

Question 18

Q

Vad är, och hur skapar man ett index?

Answer

A

I ett index kan man lägga ihop flera variabler, man kan säga att ett index är en variabel som sammanfattar ett antal variabler.
Man kan bedöma röstförmågan med ett flertal tester. Man slår sedan samman poängen/siffrorna, vilket ger en indikation på röstförmågan.

Question 19

Q

Vad visar en variationsvidd?

Answer

A

Variationsvidden visar avståndet från det lägsta till högsta värdet i en normalfördelningskurva.

Question 20

Q

Vad är ett kvartilavstånd?

Answer

A

Avståndet mellan den övre och undre kvartilen.

Question 21

Q

Vad är den undre kvartilen?

Answer

A

Den 25:e percentilen, vilket innebär att 25 % har lägre värden.

Question 22

Q

Vad är den övre kvartilen?

Answer

A

Den 75:e percentilen, vilket innebär att 75 % har lägre värden.

Question 23

Q

Var och vad är medianen på en normalfördelningskurva?

Answer

A

I mitten. Det är den 50:e percentilen, vilket innebär att 50 % har lägre värden.

Question 24

Q

Vad är typvärde?

Answer

A

Det värde som flest har.

Question 25

Q

Vad är en box-and-whiskers-plot? Vad innehåller boxen?

Answer

A

En förenklad visualisering av normalfördelningskurva. “Boxen” innehåller avstånd mellan nedre och övre kvartilen. “Whiskers” är svansarna på normalfördelningskurvan, avståndet däremellan visar variationsvidden.

Question 26

Q

Vad är ett histogram?

Answer

A

Ett diagram för att visa
fördelning/spridning (distribution) hos en variabel. I ett histogram sitter staplarna ihop, visar frekvens.

Question 27

Q

Vad är skevhet och vilken typ av skevhet finns?

Answer

A

Skevhet är snedfördelad data i en normalfördelningskurva. Positiv skevhet = svansen sluttar mot vänster. (Ser ut som en rutschkana.)

Negativ skevhet = svansen sluttar mot höger.

Question 28

Q

Vad är bimodal fördelning?

Answer

A

Gruppen är sammansatt av två populationer,
en större och en mindre. Två “kamelpucklar” på fördelningskurvan.

Question 29

Q

Vad är variationskoefficienten?

Answer

A

Det är ett standardiserat mått på spridningen hos en variabel. Uttrycks som standardavvikelsen i procent av medelvärdet. Variationskoefficenten gör standardavvikelser på olika mätningar jämförbara.

Question 30

Q

Hur räknas variationskoefficienten ut?

Answer

A

100 * Standardavvikelsen / Medelvärdet

Question 31

Q

Vad är värdesiffror?

Answer

A

Siffror som har ett värde, ex 0,1001 har fyra värdesiffror, men 0,0001 har bara en värdesiffra.

Question 32

Q

Vad är ett stapeldiagram/bar chart?

Answer

A

Ett diagram som visar värdet för olika grupper och subgrupper inom en grupp.

Question 33

Q

Vad är sannolikhetslära?

Answer

A

En del av statistiken som handlar om hur sannolikt olika saker är.

Question 34

Q

Vad får man om man kombinerar sannolikhetslära och statistik?

Answer

A

Inferentiell statistik, som handlar om att dra slutsatser från ett stickprov.

Question 35

Q

Beskriv formellt sannolikheten för att singla slant

Answer

A

P(gubbe) = 0,5
P(krona) = 0,5
P(summa) = P(gubbe) + P(kronor) = 1

Question 36

Q

Vad är sannolikheten att få två ettor på rad i ett tärningskast?

Answer

A

Sannolikheten att få en etta är P(1) = 1/6 = 0,167 = 16,7%
P(1+1) = 0,167 * 0,167 = 0,0278 = 2,78 %

Question 37

Q

Vad är binomial fördelning?

Answer

A

Normalfördelning fast med staplar. Binomial betyder “två namn”, dvs det finns två möjliga utfall som med slantsinglingar. Exempelvis en kurva som visar fördelningen av utfall av fyra slantsinglingar flera gånger, med sannolikheten för de olika kombinationernas resultat.

Question 38

Q

Hur många av alla utfall hamnar inom +-3 standardavvikelse?

Question 39

Q

Vad är z-skalan?

Answer

A

Det är den enklaste standardskalan för att ta fram standardpoäng. Genom att räkna ut z-poäng kan man jämföra resultat på helt olika mätskalor och frågeformulär.

Question 40

Q

Hur räknar man ut z-poäng?

Answer

A

Z = Resultat - medelvärdet / standardavvikelsen

Question 41

Q

Vad är index?

Answer

A

Ett sammanslaget mått på flera variabler, t.ex flera olika tester.

Question 42

Q

Vad är slumpmässigt urval för stickprov?

Answer

A

Slumpmässigt urval ur populationen.

Question 43

Q

Vad är stratifierat urval?

Answer

A

Delar in populationen i mindre grupper exempelvis baserat på kön.

Question 44

Q

Vad är ett bekvämlighetsurval?

Answer

A

Att man inkluderar dem som är lättast att få tag på

Question 45

Q

Vad är ett klusterurval?

Answer

A

Att välja en naturlig grupp, som en skolklass eller medlemmar i en förening

Question 46

Q

Vad är ett ja-sägar urval?

Answer

A

Att alla inbjuds och de som tackar jag accepteras

Question 47

Q

Vad är ett typisk urval?

Answer

A

Att man inkluderar personer som anses typiska för den population man vill undersöka

Question 48

Q

Vad är tvåstegsurval?

Answer

A

Att man gör ett urval i två steg, exempelvis ett klusterurval av skola och sedan ja-sägar urval av de som säger ja.

Question 49

Q

Vad är två alternativa namn för medelfel?

Answer

A

Standardfel, eller Standard Error of the Mean (SEM)

Question 50

Q

Vad är medelfelet?

Answer

A

Det slumpmässiga felet vi kan förvänta oss att ett stickprov har. Medelfelet (SE) är alltså det mätfel på medelvärdet
man kan förvänta vid en viss storlek
på stickprovet, och vid en viss
variation i befolkningen.

Question 51

Q

Vad beror medelfelet på?

Answer

A

Storleken på stickprovet samt variationen inom den undersökta populationen.

Question 52

Q

Hur räknar man ut medelfelet?

Answer

A

Standardavvikelsen / roten ur antalet i stickprovet

Question 53

Q

Vad är den statistiska felmarginalen?

Answer

A

Den anger osäkerheten i stickprovet kring ett värde, den sannolikhet att stickprovet skiljer sig från verkligheten. Den statistiska felmarginalen är ytterkantspunkterna för ett konfidensintervall, som är graden av säkerhet att det verkliga värdet stämmer med det uppmätta värdet.

Question 54

Q

Vad är konfidansintervallen?

Answer

A

Det intervall som de lägsta och högsta punkterna av felmarginalen sprider sig över

Question 55

Q

Vad innebär det att något är statistiskt säkerhetställt?

Answer

A

Att mätningen med 95% säkerhet stämmer.

Question 56

Q

Hur beräknar man 95% felmarginal eller konfidensintervall?

Answer

A

Först beräknas medelfelet: Standardavvikelse / roten ur antalet i stickprovet
95,4 % av fallen hamnar inom +-2 standardavvikelser, på grund av punkterna på fördelningskurvan
95% felmarginal beräknas 2 * medelfel = Felmarginalen
Konfidensintervallet är medelvärdet -+ felmarginalen

Question 57

Q

Vad står p-värde för?

Answer

A

Probability, engelska för sannolikhet. Sannolikheten för att något enbart beror på slumpen.

Question 58

Q

Vad är alfanivå eller signifikansnivå?

Answer

A

Det kan ses som en tradition inom forskning. Man har valt en bestämd gräns för vilket p-värde man ska tro på., 00,5

Question 59

Q

Vad är en den vanligaste alfanivån?

Answer

A

Den vanligaste alfanivån är 5 %, eller 0,05, men även 1 %, eller 0,01.

Question 60

Q

Vad händer om p-värdet är lägre eller högre än alfanivån?

Answer

A

Då kan man säga att resultatet är statistiskt signifikant, och tvärtom om den skulle vara högre än alfanivån.

Question 61

Q

Varför är ett p-värde på 0,05 problematiskt trots att det är statistiskt signifikant?

Answer

A

Det blir många falska slumpmässiga resultat som blir “signifikanta”, 1/20. Detta kallas även för typ I-fel.

Question 62

Q

Vad är ett typ I-fel?

Answer

A

Att man tror på ett resultat fast att det enbart berodde på slumpen.

Question 63

Q

Vad är nollhypotesen, och vad kan den liknas med?

Answer

A

Traditionell statistisk metod. Man testar nollhypotesen - att det inte finns något samband utan att sambandet beror på slumpen, för att kunna bevisa om det finns ett samband.
En kan likna detta med en rättegång, där nollhypotesen är ställd inför rätta. Forskaren är åklagaren som försöker motbevisa nollhypotesen, och det statistiska testet är domaren.

Question 64

Q

Vad är ett typ II-fel?

Answer

A

Att det finns ett statistiskt samband, men att det statistiska testet inte visar ett statistiskt signifikant samband. Kan undvikas genom att ha många deltagare.

Answer 64

A

80 %, eller 0,08. Det innebär att det är 80 procents chans att studien ger ett
statistiskt signifikant resultat om det verkligen finns en effekt

Answer 65

A

Planera de statistiska analyserna in datainsamling, och testa enbart ett litet antal hypoteser.

Answer 66

A

A priori-hypotes.

Answer 67

A

Post hoc-hypotes.

Answer 68

A

Att man väljer hypoteser efter resultaten, och att man därmed “fiskar signifikanser”. Ett positivt uttryck är att man gör en explorativ, eller utforskande, analys, för
att hitta samband. (Då måste resultatet sedan replikeras för att vara giltigt)

Answer 69

A

Att forskare med studier som angett p < 0,05 oftare publicerar sina resultat jämfört med forskare vars studier gav p > 0,05. Detta leder till att de riskerar publicera typ ett fel, med slumpmässiga samband.
Dels på grund av att tidskrifter och journaler oftast helst publicerar statistiskt signifikanta resultat.
Dels för att forskare kanske helst vill visa att deras hypotes stämmer, och kan tänkas vara mindre motiverade att publicera om studien “blir fel”.

Answer 70

A

Effekten av tex en behandling: skillnaden i poäng före och efter. Kan även ange skillnaden i medelvärde mellan två grupper.

Answer 71

A

Skillnad i gruppmedelvärde kan antingen innebära att spridningen överlappar, eller är separerad, trots samma effektstorlek mellan medelvärdena. Cohens d är en standardiserad effektstorlek för att även ta in detta i åtanke. Det anger gruppskillnaden i medelvärde dividerat med gruppernas standardavvikelse.

Answer 72

A

Cohend d = Skillnaderna i gruppernas medelvärde / medelvärdet för gruppernas standardavvikelse
(M1-M2 / SD1 + SD2 /2)

Answer 73

A

Överlappningen mellan grupperna

Answer 74

A

Stor = 0,8 std
Medium = 0,5 std
Liten = 0,2 std

Per gillar icke detta, för vad som är stort eller litet beror på sammanhanget

Answer 75

A

Statistisk signifikans på 0,05 nivån säger att det med 95% sannolikhet finns en effekt större än noll. Säger inget om storleken på effekten. Effektstorlek säger något om storleken, exempelvis hur framgångsrik en behandling var, inte bara med hur stor sannolikhet effekten var verklig, utan även om studien var klinisk signifikant.

Answer 76

A

P-värdet som indikerar hur stor sannolikhet att resultatet uppstått bara av slump. P-värdet starkt beroende på antal deltagare. Små studier med låg power kan ej ge låga p-värden.

Effektstorlek som indikerar effekten av en behandling eller hur stor skillnaden är mellan två grupper, oberoende av antalet.

Samt spridningen hos resultatet - normalfördelad, undergrupper?

Answer 77

A

Medelvärdet

Answer 78

A

Den kan ses som något kraftfullare, alltså att den kan ge ett något lägre p-värde. Men resultatet påverkas mycket av outliers/extremvärden.

Answer 79

A

Data i form av kvotskala eller intervallskala (ej ordinaldata).
– Att data är ungefär normalfördelade, utan outliers.
– Att grupperna man jämför har ungefär lika standardavvikelse.

Answer 80

A

Medianen är ett väldigt stabilt centralmått som inte påverkas av extremvärden. Inte lika kraftfull i vissa situationer som parametriska metodert.

Answer 81

A

Om man vill testa hypotesen i båda svansarna eller en av svansarna på normalfördelningskurvan

Answer 82

A

Median jämförelse = Icke-parametriskt test

Answer 83

A

Parametriskt om datan upfyller kraven, om tveksamt icke-parametriskt

Answer 84

A

Oberoende = svaren kommer från olika individer, tex patientgrupp och kontrollgrupp
Beroende = information från samma person vid flera olika tillfällen

Answer 85

A

Fishers eller Chitvå

Answer 86

A

Om man har ordinaldata, tex från skattningsskalor.
Om data har outliers eller ej normalfördelad.
Om små grupper (mindre än 15). Om osäker.

Answer 87

A

T-test är ett parametriskt test

Answer 88

A

Ett test för jämförande av två grupper, icke-parametriskt.

Answer 89

A

Stundents och Welchs (Parametriskt t-test)
Mann-Whitney U-test (icke parametriskt)

Answer 90

A

t-test för beroende data (parametriskt)
Wilcoxon teckenrangtest för beroende data (icke-parametriskt)

Answer 91

A

Parametriskt t-test (for one sample)
Icke-parametriskt Wilcoxon teckenrangtest (for one sample)

Answer 92

A

Samband mellan två eller f lera variabler

Answer 93

A

Korrelation visar samband, men inte orsak. Till exempel så finns ett samband mellan bilolyckor och husbränder, men orsaksambandet är att det är vinter.

Answer 94

A

Sambandets riktning, regression är en matematisk modell för att beskriva sambandet mellan två eller flera variabler, kan uttryckas som ekvation

Answer 95

A

Om r är positiv, positiv korrelation, Om r är negativ, negativ korrelation. Om r är 0 ingen korrelation. Värde mellan -1 och 1.

Answer 96

A

Negativ korrelation är när en variabel ökar, så minskar en annan. Positiv korrelation är när en variabel ökar, så ökar en annan.

Answer 97

A

Effektstorlek (r^2) - hur stark eller svag en korrelation är. Visar hur mycket variation variablerna har gemensamt, delad varations, visar hur mycket cirklarna överlappar

Answer 98

A

r * r = % delad varians

Answer 99

A

Pearsons korrelationskoefficient. Påverkas mycket av extremvärden och snedfördelade data.

Answer 100

A

Spearmans korrelationkoefficient.
- Baseras på rangordning av data
- Stabilt, påverkas ej av outliers
- Lämplig vid ordinaldata

Answer 101

A

P-värdet anger sannolikheten att korrelationen enbart beror på slumpen.

Brainscape's Knowledge GenomeTM

Statistik Flashcards

Brainscape's Knowledge Genome^TM