Forskningsmetod: Statistik (2,5 hp) Flashcards

1
Q

Vad är deskriptiv statistik?

A

Deskriptiv statistik beskriver variablerna som mätts i ett stickprov. Detta görs genom att använda sammanfattande värden (t.ex. medelvärde) och grafer (t.ex. histogram/boxplot).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vad är en population?

A

En population är alla möjliga “deltagare” av det vi är intresserade av (t.ex. alla högskolestudenter i Sverige).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Vad är inferentiell statistik?

A

Inferentiell statistik försöker använda stickprovet för att dra slutsatser om population.

Använder statistiska test, p-värden, konfidensintervall.

Redovisa deskriptiva statistiken (centralmått/spridningsmått) även om målet är inferentiell statistik.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vad är ett stickprov?

A

Ett stickprov är de deltagare från populationen som vi faktiskt observerar och gör mätningar på.

  • Låg representativitet → svårt dra inferentiella slutsatser
  • Mätfel i stickprovet → även svårt att ge bra deskriptiv statistik (Kan bero på felaktiga mätinstrument, felaktig datainsamling, eller att deltagarna i stickprovet inte svarar ärligt eller korrekt.)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Vad bör man kontrollera för i ett stickprov?

A
  • Mätfel eller orimliga värden:
    Finns det felaktiga data som behöver korrigeras eller tas bort?
  • Representativitet:
    Är stickprovet representativt för den population du vill studera?
  • Confounding variabler:
    Finns det andra faktorer som kan påverka resultaten och behöver kontrolleras för?
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Vad är en variabel?

A

En variabel är något vi mäter i vårt stickprov, t.ex. kön, längd eller resultat på en personlighetsskala.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Vad är en parameter?

A

En parameter är ett ”sant” värde i populationen, t.ex. sanna medelvärdet för alla
högskolestudenter i Sverige.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Vad är populationsmedelvärde (μ)?

A

Populationsmedelvärde (μ) är det sanna genomsnittliga värdet för en viss variabel i en hel population.

Exempel på parameter.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Vad är populationsstandardavvikelse (σ)?

A

Populationsstandardavvikelse (σ) är det sanna måttet på spridningen av en variabel i hela populationen. Den visar hur mycket värdena i populationen i genomsnitt avviker från populationsmedelvärdet (μ).

Exempel på parameter.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Vad är ett estimat?

A

Ett estimat är en uppskattning av en parameter i populationen, baserat på data från stickprovet. Till exempel är stickprovsmedelvärdet ett estimat av populationsmedelvärdet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Vad är nominalskala?

A

Nominalskala är den enklaste skalnivån och används för att kategorisera data utan någon inneboende ordning, t.ex. kön (man, kvinna).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Vad är ordinalskala?

A

Ordinalskala innebär att data kan rangordnas, men avståndet mellan olika rangordningar är inte meningsfullt, t.ex. placering i en tävling (1:a, 2:a, 3:a).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Vad är intervallskala?

A

Intervallskala innebär att data kan rangordnas och avståndet mellan olika värden är meningsfullt, men det finns ingen absolut nollpunkt, t.ex. temperatur i celsius.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Vad är kvotskala?

A

Kvotskala innebär att data kan rangordnas och att avstånden mellan värden är meningsfulla, samt att skalan har en absolut nollpunkt, t.ex. längd i centimeter.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Vad är centralmått?

A

Ett centralmått beskriver den övergripande positionen eller “tyngdpunkten” i en datamängd. Vanliga centralmått är typvärde, median och medelvärde.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Vad är ett typvärde?

A

Typvärdet är det värde som förekommer flest gånger i en datamängd.

Beskriver vilket värde som är mest representativt eller vanligast.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Vad är median?

A

Medianen är det mittersta värdet i en sorterad datamängd.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Vad är medelvärde?

A

Ett medelvärde är det genomsnittliga värdet i en datamängd, man summerar alla värden och dividerar resultatet med antalet värden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Vad är spridningsmått?

A

Ett spridningsmått beskriver hur utspridda värdena är i en datamängd/variabel.

Vanliga spridningsmått är variationsbredd, percentiler, kvartiler, standardavvikelse och varians.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Vad är variationsbredd?

A

Variationsbredden är skillnaden mellan det högsta och det lägsta värdet i en datamängd.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Vad är percentiler?

A

Percentiler delar en ordnad datamängd i 100 lika stora delar. Varje percentil motsvarar en specifik position i data, till exempel anger den 90
percentilen att 90 % av värdena ligger under detta värde och 10 % ligger över.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Vad är kvartiler?

A

Kvartiler delar en ordnad datamängd i fyra lika stora delar.

De viktigaste kvartilerna är:

  • Första kvartilen (Q1): 25 % av värdena är lägre än detta värde.
  • Andra kvartilen (Q2): Motsvarar medianen, där 50 % av värdena är lägre.
  • Tredje kvartilen (Q3): 75 % av värdena är lägre än detta värde.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Vad är z-värde?

A

Z-värde visar hur många standardavvikelser en observation ligger från medelvärdet i en normalfördelad variabel.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Vad är varians?

A

Varians är ett mått på hur spridda värdena i en datamängd är runt medelvärdet. Det beräknas som medelvärdet av de kvadrerade avvikelserna från medelvärdet.

Om variansen är liten, är alla värden nära medelvärdet.
Om den är stor, är värdena utspridda långt från medelvärdet.

För att räkna ut variansen:

  1. Ta varje värde och räkna ut hur långt det är från medelvärdet (detta kallas avvikelsen).
  2. Kvadrera dessa avvikelser (gör dem positiva).
  3. Räkna ut medelvärdet av de kvadrerade avvikelserna.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Vad är standardavvikelse?

A

Standardavvikelsen är ett mått på den genomsnittliga variationen i en datamängd, det vill säga hur mycket värdena avviker från medelvärdet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Vad är normalfördelning?

A

Normalfördelningen är en viktig statistisk fördelning som är symmetrisk och klockformad.

Många variabler i naturen är ungefär normalfördelade, t.ex. längd och IQ är ungefär normalfördelade.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Vilka är stegen i en statistisk analys?

A
  1. Klargör syftet med analysen.
  2. Definiera mått/skala, statistiskt verktyg och stickprov.
  3. Redovisa deskriptiv statistik för variablerna i stickprovet.
  4. Genomför inferentiell statistik (om det är målet med analysen).
  5. Tolka resultaten.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Hur påverkar skalnivån valet av statistik/statistiska tester?

A

Skalnivån på dina data påverkar vilka statistiska test som är lämpliga att använda:

Lägre skalnivåer (nominal och ordinal) använder oftast icke-parametriska test. Kräver inga antaganden.

Högre skalnivåer (intervall och kvot) tillåter användning av parametriska test, som kräver mer information om data. Kräver att datan är normalfördelad, med homogen varians.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Vad är ett histogram?

A

Ett histogram visar fördelningen av en kontinuerlig variabel genom att dela in datan i intervall och visa antalet observationer i varje intervall.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Vad är en barplot (stapeldiagram)?

A

En barplot visar frekvensen eller antalet observationer för varje kategori av en kategorisk variabel.

T.ex. människor med olika yrken

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Vad är en scatterplot (spridningsdiagram)?

A

En scatterplot visar sambandet mellan två variabler genom att plotta varje observation som en punkt i ett diagram.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

Vad är en boxplot (lådagram)?

A

En boxplot visar medianen, kvartilerna, och extremvärden i en datamängd, vilket ger en överblick över datans fördelning.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

Hur tolkar man en korrelation?

A

Korrelationens styrka mäts från -1 till +1. En korrelation nära +1 indikerar ett starkt positivt samband, nära -1 ett starkt negativt samband, och nära 0 ett svagt eller inget samband.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

Vad är Pearsons korrelationskoefficient (r)?

A

Pearsons r mäter styrkan och riktningen på ett linjärt samband mellan två variabler.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

När är Spearmans rangkorrelation lämplig att använda?

A

Spearmans rangkorrelation används när:

  • Data inte är normalfördelad
  • När det finns extremvärden
  • När data är på ordinalskala (data kan rangordnas, avståndet meningslöst, utan absolut nollpunkt).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

Vad innebär det att ett stickprovsmedelvärde är väntevärdesriktigt?

A

Det innebär att medelvärdet för stickprovet är lika med populationens medelvärde.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

Vad innebär det att ett estimat är konsekvent?

A

Att estimatet närmar sig parameterns sanna värde när stickprovsstorleken ökar.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
38
Q

Vad är en riktad/ensidig hypotes?

A

En ensidig/riktad hypotes förutsäger riktningen på effekten (t.ex., grupp A kommer prestera bättre än grupp B).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
39
Q

Vad är en oriktad/tvåsidig hypotes?

A

En oriktad/tvåsidig hypotes förutsäger en skillnad men specificerar inte riktningen (t.ex., det kommer vara en skillnad i prestation mellan grupp A och B).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
40
Q

Vad är alfanivå (α)?

A

Alfanivån är sannolikheten att man felaktigt förkastar nollhypotesen. När den egentligen är sann (Typ I-fel). Vanligtvis satt till 0.05 eller 5%.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
41
Q

Vad innebär replikering?

A

Att upprepa en studie för att se om resultaten är tillförlitliga och kan generaliseras.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
42
Q

Vad är en confounding variable/förväxlingsvariabel?

Bakomliggande störvariabeln

A

En confounding variabel är en tredje variabel som påverkar både den oberoende och beroende variabeln och kan snedvrida resultaten.

Skensamband: korrelation mellan X, Y är orsakad av en tredje variabel Z.

Ex: det positiva samband mellan glassätande och drunkningsolyckor. Ju mer glass som äts, desto fler människor drunknar. Vad är confounding variable? Z i det här exemplet, vädertyp.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
43
Q

Vad är skillnaden mellan deskriptiv och inferentiell statistik?

A

Deskriptiv statistik beskriver stickprovets data, medan inferentiell statistik drar slutsatser om populationen utifrån stickprovet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
44
Q

När är median och medelvärde ungefär samma?

A

Om fördelningen av värden är ungefär symmetrisk så är median och medelvärde ungefär detsamma. Om de vanligaste värdena är i mitten är även typvärdet ungefär detsamma.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
45
Q

Vad är skev fördelning i data?

A

En skev fördelning är när en datamängd inte är symmetriskt fördelad kring medelvärdet.
Datapunkterna är mer samlade på ena sidan av medelvärdet, vilket resulterar i en “svans” som sträcker sig längre åt ena hållet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
46
Q

Hur uppstår skev fördelning i data?

A

Skev fördelning uppstår ofta på grund av:

  • Extremvärden: Några få ovanligt höga eller låga värden drar fördelningen åt ena hållet.
  • Variabelns begränsningar: När en variabel inte kan ha värden under eller över en viss gräns (t.ex. inga negativa värden), kan skevhet uppstå.
  • Asymmetrisk population: Fler observationer samlas på ena sidan av skalan (dålig representativitet hos stickprovet).
  • Mätfel eller bias: Fel i datainsamling eller urval leder till snedvridning.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
47
Q

Vad händer med centralmåtten om fördelningen är skev?

A

Om fördelningen är skev så blir median, medelvärde och typvärde ofta ganska olika och kan vara missvisande.

  • Positiv skevhet (högerskev): Svansen sträcker sig åt höger, mot de högre värdena. Detta innebär att det finns fler värden klumpade ihop på den lägre delen av skalan, och några få höga värden drar upp medelvärdet. Medelvärdet är då högre än medianen. Tänk dig till exempel inkomstfördelning där de flesta har lägre till medelinkomster men ett fåtal har extremt höga inkomster.
  • Negativ skevhet (vänsterskev): Svansen sträcker sig åt vänster, mot de lägre värdena. Här är det tvärtom, med fler värden på den övre delen av skalan och några få låga värden som drar ner medelvärdet. Medelvärdet är då lägre än medianen. Ett exempel kan vara resultatet på ett lätt prov där de flesta får höga poäng, men några få får låga.
48
Q

Vad innebär “statistiskt signifikant”?

A

Statistisk signifikans innebär att det är osannolikt att observera ett resultat lika extremt som det erhållna, om nollhypotesen är sann.

49
Q

Vad är ett p-värde?

A

P-värdet är sannolikheten att, om nollhypotesen är sann, erhålla ett minst lika extremt resultat som det faktiska resultatet.

50
Q

Vad är regression?

A

Regression är en statistisk metod som används för att modellera sambandet mellan två eller fler variabler.

Enkel linjär regression beskriver sambandet mellan två variabler med en rät linje.

51
Q

Vad är regressionskoefficienten (b₁)?

A

Regressionskoefficienten (b₁) beskriver lutningen på regressionslinjen. Den visar hur mycket den beroende variabeln (y) förändras för varje enhetsökning i den oberoende variabeln (x).

52
Q

Vad är interceptet (b₀)?

A

Interceptet (b₀) är det värde där regressionslinjen skär y-axeln. Det representerar det predicerade värdet på y när x är lika med noll.

53
Q

Vad är minstakvadratmetoden?

A

Minstakvadratmetoden är den metod som används för att hitta den regressionslinje som minimerar summan av variansen mellan de observerade värden och regressionslinjen.

Det är metoden som datorer använder för att visualisera regressionslinjen.

54
Q

Vad innebär extrapolering inom regressionsanalys och varför bör man undvika det?

A

Extrapolering innebär att man använder regressionsmodellen för att predicera värden på den beroende variabeln utanför det observerade intervallet för den oberoende variabeln. Detta bör undvikas då det kan leda till felaktiga prediktioner eftersom modellen inte är testad för dessa värden.

55
Q

Vad är ett konfidensintervall?

A

Ett konfidensintervall är där vi med en viss säkerhet kan anta att populationens sanna medelvärde ligger.

56
Q

Vad är ett t-test?

A

T-värdet beskriver storleken på skillnaden mellan gruppernas medelvärden i förhållande till spridningen inom grupperna. Det ger en uppfattning om hur stor skillnaden är, relativt sett.
Ett högt t-värde tyder på att skillnaden mellan grupperna är stor i förhållande till variabiliteten.

Vad t-värdet säger som p-värdet inte säger:

  • Storleken på skillnaden mellan gruppernas medelvärden.
  • Riktningen av skillnaden (positiv eller negativ).
    Hur avlägset medelvärdena är från varandra i termer av standardavvikelser.
57
Q

Vad är ett oberoende t-test?

A

Ett oberoende t-test används för att jämföra medelvärdena i två oberoende grupper (grupper som inte är relaterade till varandra).

Oberoende t-test antar intervall- eller kvotskala, oberoende mätningar, normalfördelade populationsvärden och homogena populationsvarianser (lika varians i grupperna).

58
Q

Vad är ett beroende t-test?

A

Ett beroende t-test används för att jämföra två medelvärden från samma grupp (t.ex. mätningar före och efter en behandling).

Beroende t-test antar intervall- eller kvotskala, beroende mätningar och normalfördelade populationsvärden.

59
Q

Vad är ett icke-parametriskt test?

A

Icke-parametriska tester är statistiska metoder som inte kräver att data följer en specifik fördelning, som normalfördelning.

När används de?

  • När data inte är normalfördelad.
  • När datan innehåller extremvärden.
  • När data är ordinal (rangordnad)
60
Q

Vilka är fördelarna med att använda icke-parametriska test?

A

Icke-parametriska test har högre statistisk power (sannolikhet att korrekt förkasta nollhypotesen) och mer korrekt alfanivå (sannolikheten att man felaktigt förkastar nollhypotesen) i små stickprov när data inte är normalfördelad.
De är mindre känsliga för extremvärden och kan användas med data på ordinalskala.

61
Q

Vilka är nackdelarna med att använda icke-parametriska test?

A

Icke-parametriska test har lägre statistisk power (sannolikhet att korrekt förkasta nollhypotesen) än parametriska tester när data är normalfördelad. Det finns också färre varianter av icke-parametriska test för mer komplexa analyser.

62
Q

Vad är ett chi-två test (x²)?

A

Chi-två test används för att undersöka samband mellan två variabler på nominalskalenivå, eller om observerade frekvenser skiljer sig från förväntade frekvenser.

63
Q

Vad är ett Typ I-fel?

A

Ett Typ I-fel är att förkasta nollhypotesen (H₀) trots att den är sann. Sannolikheten för ett Typ I-fel är lika med alfanivån (α).

64
Q

Vad är ett Typ II-fel?

A

Ett Typ II-fel är att behålla nollhypotesen (H₀) trots att den är falsk.

65
Q

Vad är centrala gränsvärdessatsen?

A

Centrala gränsvärdessatsen säger att fördelningen av medelvärden från upprepade stickprov kommer att närma sig en normalfördelning, oavsett den ursprungliga fördelningen, när stickprovsstorleken ökar.

Ju mer som stickprovsstorleken ökar, ju mer kommer fördelningen likna en normalfördelning.

66
Q

Vad är samplingfördelning?

A

En samplingfördelning är en fördelning av en statistik (t.ex. medelvärde) beräknad från alla möjliga stickprov av en given storlek från en population.

Samplingfördelning: fördelningen av medelvärden från olika stickprov.

Föreställ dig att du upprepade gånger tar stickprov av samma storlek från en population och varje gång beräknar en statistik, som medelvärdet. Om du plotterar dessa medelvärden får du en fördelning som visar hur ofta olika medelvärden förekommer. Detta är samplingfördelningen.

Det hjälper en att förstå vilka medelvärden som är mest sannolika och hur mycket variation du kan förvänta dig på grund av slumpen.

67
Q

Vad är standardfelet (SE)?

A

Standardfelet är standardavvikelsen för samplingfördelningen. Det är ett mått på hur mycket stickprovsestimat varierar mellan olika stickprov.

Tänk på standardfelet som “medelvärdets standardavvikelse”. Precis som standardavvikelsen mäter spridningen av individuella värden kring medelvärdet, mäter standardfelet spridningen av medelvärden från olika stickprov kring populationsmedelvärdet.

68
Q

Vad är “Lady tasting tea”?

A
  • Experimentet designades av statistikern Ronald Fisher.
  • Det undersökte om en kvinna kunde identifiera om mjölk eller te hällts först i en kopp.
  • Nollhypotesen (H₀): Kvinnan gissar och har ingen verklig förmåga.
  • Alternativhypotesen (H₁): Kvinnan kan korrekt avgöra ordningen bättre än slumpen.
  • Hon fick åtta koppar te (4 mjölk först, 4 te först) och skulle identifiera rätt.
  • Resultatet analyserades med sannolikhetsberäkningar (hypergeometrisk fördelning).

Experimentet introducerade konceptet att med hjälp av statistik avgöra om observerade resultat (som kvinnans förmåga) är verkliga eller en slump. Det är grunden för hur vi i forskning använder statistik för att testa hypoteser.

  • Resultat: Om kvinnan korrekt identifierade alla “mjölk först”-koppar, är sannolikheten för att detta sker av en slump 1/70 (cirka 1,43%).
  • Tolkning: Eftersom p-värdet (1,43%) är lägre än den vanliga alfanivån på 5%, är resultatet statistiskt signifikant.
  • Slutsats: Man kan förkasta nollhypotesen och anta att kvinnan verkligen har förmågan att känna skillnad.
69
Q

Vad innebär kognitiv snålhet?

A

Kognitiv snålhet innebär att människor tenderar att använda minsta möjliga mentala ansträngning när de fattar beslut eller löser problem.

70
Q

Vad är Spearmans rangkorrelationskoefficient (r_s)?

A

Spearmans rangkorrelationskoefficient (r_s) är ett icke-parametriskt mått på samband mellan två variabler. Den beräknas genom att rangordna värdena för varje variabel och sedan beräkna korrelationen mellan rangerna.

71
Q

Vilka är antagandena för Pearsons korrelationskoefficient?

A

Pearsons korrelationskoefficient antar intervall- eller kvotskala, parvisa mätningar, bivariat normalfördelade populationsvärden, ett linjärt samband och inga extremvärden.

72
Q

Vad menas med homogen populationsvarians?

A

Homogen populationsvarians innebär att variansen för de grupper som jämförs är ungefär densamma.

En tumregel är att variansen i en grupp ska vara max 3 gånger så stor som variansen i en annan grupp.

73
Q

Hur påverkas t-värdet i ett oberoende t-test av skillnaden i medelvärde?

A

En större skillnad i medelvärde mellan grupperna leder till ett större t-värde.

74
Q

Hur påverkas t-värdet i ett oberoende t-test av standardavvikelserna?

A

Större standardavvikelser i grupperna leder till ett mindre t-värde.

75
Q

Hur påverkas t-värdet i ett oberoende t-test av antalet observationer?

A

Ett större antal observationer leder till ett större t-värde.

76
Q

Vilka skalnivåer förutsätts för parametriska test?

A

Parametriska test förutsätter att data är på antingen intervallskala eller kvotskala.

77
Q

Hur kan man uppskatta fördelningen av en variabel med ett tillräckligt stort stickprov?

A

Man kan skapa ett histogram för att visuellt uppskatta fördelningen av en variabel.

78
Q

Vad menas med att ett statistiskt test är robust?

A

Ett robust test är ett test som fortfarande ger tillförlitliga resultat även om vissa antaganden bryts mot i viss utsträckning.

79
Q

Vad är skillnaden mellan signifikanta och starka effekter?

A

En signifikant effekt är statistiskt säkerställd (inte troligtvis slumpmässig), medan en stark effekt har en stor praktisk betydelse. Signifikans påverkas av stickprovsstorleken.

80
Q

Vad är effektstorlek?

A

Effektstorlek är ett mått som kvantifierar styrkan eller storleken av en observerad effekt eller ett samband i en studie, oberoende av stickprovsstorleken. Det hjälper oss att bedöma den praktiska betydelsen av resultaten, inte bara om de är statistiskt signifikanta.

81
Q

Hur kan korrelationskoefficienten (r) användas som effektstorlek?

A

Eftersom korrelationskoefficienten redan är standardiserad kan den användas direkt som ett mått på effektstorlek.

82
Q

Vad anses vara en svag, medelstark och stark korrelation enligt Cohen?

A

Enligt Cohen anses r > 0.1 vara en svag korrelation, r > 0.3 en medelstark korrelation, och r > 0.5 en stark korrelation.

83
Q

Vad representerar r²?

A

r² (korrelationskoefficienten i kvadrat) representerar hur stor andel av variansen i en variabel, kan förklaras av en annan variabel.

84
Q

Vad är Cohens d?

A

Cohens d är ett mått på effektstorlek för skillnader mellan grupper.

85
Q

Vad anses vara en liten, måttlig och stor effekt enligt Cohen för Cohens d?

A

Enligt Cohen anses d > 0.2 vara en liten effekt, d > 0.5 en måttlig effekt, och d > 0.8 en stor effekt. Cohens d kan vara större än 1.

86
Q

Vad är statistisk power?

A

Statistisk power är sannolikheten att ett test korrekt identifierar en sann effekt (klassificerar sanna hypoteser som sanna).

Sannolikheten att man korrekt förkastar nollhypotesen.

87
Q

Vilka tre faktorer behöver man känna till för att beräkna sannolikheten att en effekt är sann givet ett positivt testresultat?

A

För att beräkna sannolikheten att en effekt är sann givet ett positivt testresultat behöver man känna till:

1) Priorn (hur ofta sanna hypoteser testas).
2) Power (hur ofta testet korrekt identifierar sanna effekter).
3) Alfanivån (hur ofta testet felaktigt identifierar falska effekter som sanna).

88
Q

Vilken statistisk power eftersträvas oftast i studier?

A

Minst 80% statistisk power eftersträvas oftast i studier.

89
Q

Vilka två utgångssätt finns för att beräkna vad som krävs för att uppnå en viss statistisk power?

A
  1. Utgå från effektstorleken i liknande tidigare studier.
    ELLER
  2. Identifiera den minsta intressanta effektstorleken och beräkna statistisk power utifrån den.
90
Q

Vad är delta (δ)?

A

Delta (δ) är en hjälpvariabel som används i beräkningar av statistisk power, och dess värde beror på effektstorleken och det statistiska testet som används.

91
Q

Hur påverkar alfanivån den statistiska powern?

A

En högre alfanivå leder till högre statistisk power, eftersom det blir lättare att hitta en sann effekt (men också lättare att göra typ I-fel).

92
Q

Hur påverkar stickprovsstorleken statistisk power?

A

Större stickprov leder till högre statistisk power, då mindre effekter kan bli signifikanta.

93
Q

Hur påverkar studiedesignen statistisk power?

A

Studier som minimerar brus (t.ex. beroende mätningar som kontrollerar för individuell variation) ökar statistisk power.

94
Q

Hur påverkar standardavvikelsen i populationen statistisk power?

A

Större standardavvikelse minskar statistisk power, då det blir svårare att upptäcka signifikanta effekter.

95
Q

Vad är en nackdel med att överskatta effektstorleken i beräkningar för statistisk power?

A

Överskattning av effektstorleken leder till lägre statistisk power än önskat, och därmed minskad sannolikhet att identifiera sanna effekter.

96
Q

Vilken typ av studier krävs för att säkerställa kausalitet?

A

Välkonstruerade experimentella studier krävs för att säkerställa kausala samband.

97
Q

Hur kan extremvärden påverka statistiska test?

A

Extremvärden kan ha en oproportionerligt stor påverkan på resultaten av statistiska test.

98
Q

Vad är en vanlig tumregel för att hantera extremvärden?

A

En vanlig tumregel är att sätta en gräns tre standardavvikelser från medelvärdet, och ta bort värden som ligger utanför denna gräns. Alternativt kan man använda icke-parametriska test.

99
Q

Vad är massignifikans?

A

Massignifikans uppstår när man utför många statistiska test utan att korrigera för risken att hitta slumpmässiga signifikanta resultat. Detta ökar risken för typ I-fel (falska positiva resultat).

100
Q

Hur kan man korrigera för massignifikans?

A

Bonferroni-korrigering är en metod för att korrigera för massignifikans. Man delar alfanivån med antalet utförda test.

101
Q

Vad är en nackdel med Bonferroni-korrigering?

A

Bonferroni-korrigering minskar powern för varje enskilt test, vilket gör det svårare att hitta sanna effekter.

102
Q

Vad är regressionsfelslutet?

A

Regressionsfelslutet innebär att man misstolkar naturlig regression mot medelvärdet som en effekt av en intervention. Extrema värden tenderar att vara närmare medelvärdet vid upprepade mätningar, även utan intervention.

103
Q

Vad innebär regression mot medelvärdet?

A

Regression mot medelvärdet innebär att extrema värden vid en mätning tenderar att vara närmare medelvärdet vid en upprepad mätning. Detta beror på den slumpmässiga variationen i mätningarna.

104
Q

Vad är replikationskrisen?

A

Replikationskrisen refererar till svårigheten att replikera (upprepa och få samma resultat i) många publicerade forskningsresultat, vilket tyder på att en stor del av dessa resultat kan vara falska positiva.

105
Q

Vilka faktorer bidrar till replikationskrisen?

A

Faktorer som bidrar till replikationskrisen inkluderar:
1. Publikationsbias (endast signifikanta resultat publiceras).
2. P-hacking (manipulering av data för att uppnå signifikans).
3. HARKing (Hypothesizing After Results are Known).
4. Felanvändning av statistiska metoder.

106
Q

Hur kan förregistrering minska risken för fel i forskningen?

A

Förregistrering (pre-registration) innebär att forskare publicerar sin hypotes och metod innan studien genomförs, vilket minskar risken för p-hacking och HARKing.

107
Q

Hur påverkar stickprovsstorleken tolkningen av statistisk signifikans?

A

Med små stickprov blir endast mycket stora effekter signifikanta, medan med stora stickprov kan även små, eventuellt betydelselösa, effekter bli signifikanta. Därför är det viktigt att kontrollera för effektstorlek.

108
Q

Vad innebär praktisk signifikans?

A

Praktisk signifikans avser en effekts betydelse i verkligheten, oavsett om den är statistiskt signifikant eller inte. Effektstorlek är ett mått på praktisk signifikans.

109
Q

Vad är skillnaden mellan alfanivå och p-värde?

A

Alfanivån är en förutbestämd gräns för att förkasta nollhypotesen (vanligtvis 0.05). P-värdet är sannolikheten att observera data lika extrema som de observerade, givet att nollhypotesen är sann.

110
Q

Vad är en posterior sannolikhet?

A

Posterior sannolikhet (även kallad “posterior”) är sannolikheten att en hypotes är sann givet observerad data, och används inom Bayesiansk statistik. Den tar hänsyn till både data och prior sannolikhet.

111
Q

Vad är en prior sannolikhet?

A

Prior sannolikhet är den uppskattade sannolikheten för en hypotes innan man samlar in data. Den används i Bayesiansk statistik.

112
Q

Vad är stora talens lag?

A

Stora talens lag säger att ju större ett stickprov är, desto närmare kommer stickprovsmedelvärdet att vara det sanna populationsmedelvärdet (parametern).

113
Q

När används t-fördelningen istället för normalfördelningen?

A

T-fördelningen används istället för normalfördelningen när populationens standardavvikelse är okänd och stickprovsstandardavvikelsen används som en skattning, särskilt vid små stickprov.

114
Q

När är det lämpligt att använda Spearmans rangkorrelationskoefficient istället för Pearsons r?

A

Spearmans rangkorrelationskoefficient är lämplig att använda när data inte är normalfördelade, innehåller extremvärden, är på ordinalskala, eller uppvisar ett monotont icke-linjärt samband.

115
Q

Hur avgör man om en korrelation är statistiskt signifikant?

A

För att avgöra om en korrelation är statistiskt signifikant jämförs det observerade r-värdet med ett kritiskt värde från en tabell, baserat på alfanivån och frihetsgraderna. Om det observerade r-värdet är större än det kritiska värdet är korrelationen statistiskt signifikant.

116
Q

Vad innebär statistisk signifikans i relation till Pearsons r?

A

Statistisk signifikans för Pearsons r innebär att det är osannolikt att observera en korrelation lika stark som, eller starkare än, den erhållna i stickprovet om det inte finns någon korrelation i populationen.