Omtenta Forskningsmetod: Statistik (2,5 hp) Flashcards

Question

Vad är **nominalskala**?

Answer 1

**Nominalskala** är den enklaste skalnivån och används för att kategorisera data utan någon inneboende ordning. Exempel: kön (man, kvinna).

Answer 2

**Ordinalskala** innebär att data kan rangordnas, men avståndet mellan olika rangordningar är inte meningsfullt. Exempel: placering i en tävling (1:a, 2:a, 3:a).

Answer 3

**Intervallskala** innebär att data kan rangordnas och avståndet mellan olika värden är meningsfullt, men det finns ingen absolut nollpunkt. Exempel: temperatur i celsius.

Answer 4

**Kvotskala** innebär att data kan rangordnas och att avstånden mellan värden är meningsfulla, samt att skalan har en absolut nollpunkt. Exempel: längd i centimeter.

Answer 5

**Praktisk signifikans** avser en effekts betydelse i verkligheten, oavsett om den är statistiskt signifikant eller inte. Effektstorlek är ett mått på praktisk signifikans. Statistisk signifikans indikerar om ett *resultat sannolikt inte beror på slumpen*. Praktisk signifikans bedömer om *resultatet är meningsfullt i ett verkligt sammanhang*. ## Footnote Exempel: **|**Ett statistiskt signifikant resultat som visar en viktnedgång på 0,1 kg kan sakna praktisk signifikans eftersom förändringen är för liten för att ha betydelse i verkligheten.

Answer 6

**Effektstorlek** är ett mått som kvantifierar styrkan eller storleken av en observerad effekt eller ett samband i en studie, oberoende av stickprovsstorleken. **Effektstorleken** hjälper oss att bedöma den *praktiska betydelsen* av resultaten, inte bara om de är statistiskt signifikanta. Effektstorlek kan användas för att avgöra om en statistiskt signifikant skillnad också är praktiskt meningsfull. | Cohens d är ett mått på effektstorlek. ## Footnote En effektstorlek på d = 0,8 (stor effekt) visar att två grupper skiljer sig mycket åt, medan d = 0,2 (liten effekt) indikerar en svag skillnad.

Answer 7

Ett **Mann-Whitney U-test** är ett *icke-parametriskt test* som används för att jämföra rangordnade värden mellan två oberoende grupper, när parametriska antaganden (som normalfördelning) inte är uppfyllda. Exempel: Jämförelse av patientnöjdhet mellan två sjukhus (Sjukhus A och Sjukhus B) där data är på ordinalskala (t.ex. 1 = mycket missnöjd, 2 = missnöjd, 3 = neutral, 4 = nöjd, 5 = mycket nöjd). | Oberoende Icke-parametriskt test. ## Footnote Mann-Whitney U-test antar: * **Oberoende mätningar** (individer i en grupp påverkar inte individer i den andra gruppen). * **Ordinalskala eller högre** (data kan rangordnas, t.ex. betyg på en skala från 1 till 5, men behöver inte vara normalfördelad).

Answer 8

Ett **Wilcoxon signed-rank test** är ett *icke-parametriskt test* som används för att jämföra rangordnade värden från samma grupp vid två olika tidpunkter eller för två relaterade mätningar. Exempel: Före- och eftermätningar av patientens smärtnivå (på en skala från 0 = ingen smärta till 10 = extrem smärta) hos samma patienter efter en behandling. | Beroende Icke-parametriskt test. ## Footnote Wilcoxon signed-rank test antar: * **Beroende mätningar** (samma individer mäts två gånger, eller mätningar är kopplade). * **Ordinalskala eller högre** (data kan rangordnas, t.ex. nivåer av smärta från 0 till 10, men behöver inte vara normalfördelad).

Answer 9

**Statistisk power** är sannolikheten att ett test korrekt upptäcker en verklig effekt och korrekt förkastar nollhypotesen (H_0) när den är falsk. Det är ett mått på testets känslighet. Power mäts som `1−β`, där β är risken att göra ett typ II-fel (att missa en sann effekt). ## Footnote Om power är 80% (0,8) betyder det att testet har 80% sannolikhet att upptäcka en effekt om en sådan verkligen finns. (80% power eftersträvas)

Answer 10

För att beräkna sannolikheten att en effekt är sann givet ett positivt testresultat behöver man känna till: 1. **Priorn**: Hur ofta sannolika hypoteser testas (t.ex. sannolikheten att en hypotes är sann innan data samlas in). 2. **Power**: Hur ofta testet korrekt identifierar sanna effekter (som `1−β`, där β är risken att göra ett typ II-fel). 3. **Alfanivån**: Hur ofta testet felaktigt identifierar falska effekter som sanna (risken för typ I-fel, oftast satt till α = 0,05).

Answer 11

En **högre alfanivå** leder till **högre statistisk power**, eftersom det blir lättare att hitta en sann effekt (men också lättare att göra typ I-fel). ## Footnote Exempel: Om du ökar α från 0,05 till 0,10, kan du förkasta nollhypotesen med svagare evidens, vilket gör att fler sanna effekter upptäcks, men även fler falska positiva resultat.

Answer 12

En **större stickprovsstorlek (𝑛) leder till högre statistisk power**, eftersom det *minskar standardfelet* (𝑆𝐸), vilket gör det lättare att upptäcka små effekter. ## Footnote Exempel: Ett stickprov med 100 deltagare ger mer tillförlitliga resultat än ett med 20 deltagare, eftersom slumpmässiga variationer påverkar större stickprov mindre.

Answer 13

Studiedesigner som minimerar brus eller variabilitet i data (t.ex. **beroende mätningar**, där *samma individer mäts före och efter en behandling*) **ökar statistisk power**. Detta sker genom att reducera osäkerheten och göra det lättare att upptäcka verkliga effekter. ## Footnote Exempel: I en beroende mätning jämförs varje individ med sig själv, vilket eliminerar variabilitet mellan individer.

Answer 14

En **större standardavvikelse (σ) minskar statistisk power**, eftersom *data blir mer spridd och osäkerheten i skattningarna ökar*. Detta gör det *svårare att upptäcka signifikanta effekter*, särskilt om effektstorleken är liten.

Answer 15

**Standardfelet** (SE) beskriver spridningen i en samplingfördelning och mäter hur mycket stickprovsmedelvärden tenderar att variera runt populationsmedelvärdet. Större standardfel innebär en bredare samplingfördelning, vilket indikerar större osäkerhet i skattningarna.

Answer 16

**Standardfelet** i en **samplingfördelning** räknas ut med hjälp av **standardavvikelsen**. Ju större **standardavvikelse**, desto större är **standardfelet**, ju bredare är samplingfördelningen.

Answer 17

**Centrala gränsvärdessatsen** säger att om du tar många stickprov från en population och beräknar medelvärdet för varje stickprov, kommer fördelningen av dessa medelvärden (samplingfördelningen) att närma sig en normalfördelning när stickprovsantalet (d.v.s. hur många stickprov du tar) ökar – oavsett populationens ursprungliga fördelning. ## Footnote Om du mäter längden på fiskar från olika stickprov á 10 fiskar vardera och plottar medelvärdena från varje stickprov, kommer dessa medelvärden att bilda en fördelning som blir normalfördelad när du tar tillräckligt många stickprov.

Answer 18

**Stora talens lag** säger att om stickprovsstorleken (𝑛) i ett enda stickprov blir tillräckligt stor, så kommer stickprovsmedelvärdet att närma sig populationens sanna medelvärde. ## Footnote Om du tar ett enda stickprov av 1000 fiskar, kommer medelvärdet av dessa fiskar sannolikt att ligga mycket nära populationens medelvärde, även om populationen har en skev fördelning.

Answer 19

**Stickprovsmedelvärdet** är *mittpunkten* i **konfidensintervallet**. Det beräknas genom att ta genomsnittet av intervallets nedre och övre gräns. ``` (nedre gräns + övre gräns) / 2 ```

Answer 20

Att ett konfidensintervall har 95%-ig konfidensgrad innebär att om vi drar 100 stickprov från samma population och beräknar ett konfidensintervall för varje stickprov, så kommer cirka 95% av dessa intervall att innehålla det sanna populationsmedelvärdet. Det betyder att om vi upprepar experimentet (tar nya stickprov) många gånger, så kommer 95% av de intervall vi skapar från dessa stickprov att täcka populationsmedelvärdet. Konfidensgraden beskriver alltså tillförlitligheten i metoden att skapa intervall – *inte* sannolikheten för ett enskilt intervall.

Answer 21

En **riktad hypotes** förutsäger *riktningen på effekten* (t.ex., grupp A kommer prestera bättre än grupp B).

Answer 22

En **oriktad hypotes** förutsäger en skillnad men specificerar inte riktningen (t.ex., det *kommer* vara en skillnad i prestation mellan grupp A och B).

Answer 23

Kvartiler delar upp en datamängd i fyra lika stora delar: * Q1 (första kvartilen): 25% av data är mindre än detta värde. * Q2 (andra kvartilen eller medianen): 50% av data är mindre än detta värde. * Q3 (tredje kvartilen): 75% av data är mindre än detta värde. I en boxplot används kvartiler för att visa spridningen: * Boxen sträcker sig från Q1 till Q3 och visar den interkvartila spridningen (IQR). * Medianen (Q2) visas som en linje i boxen. * "Whiskers" visar extrema värden inom ett visst intervall, och eventuella uteliggare markeras separat.

Answer 24

**Spearmans korrelation** är ett mått på *samband mellan två variabler* som baseras på deras rangordning snarare än deras faktiska värden.

Answer 25

**Pearsons korrelation** är ett mått på det linjära sambandet mellan två kvantitativa variabler. Sambandet uttrycks som ett värde mellan -1 (perfekt negativ korrelation) och +1 (perfekt positiv korrelation).

Answer 26

Det innebär att medelvärdet för stickprovet är lika med populationens medelvärde.

Answer 27

Använd **Spearmans rangkorrelation** när: 1. När data inte är normalfördelad eller innehåller extrema värden (uteliggare) som påverkar analysen. 2. När variablerna är på ordinalskala, dvs. endast rangordning är relevant, som vid enkätdata med svarsalternativ på en skala (t.ex. 1-5).

Answer 28

Använd **Pearsons korrelation** när: 1. När data *är* normalfördelad och har ett linjärt samband mellan variablerna. 2. När variablerna är på *intervall*- eller *kvotskala*, t.ex. längd i cm eller temperatur i Celsius.

Answer 29

**Percentiler** delar en ordnad datamängd i 100 lika stora delar. Varje percentil motsvarar en specifik position i data, till exempel anger den 90 percentilen att 90 % av värdena ligger under detta värde och 10 % ligger över.

Answer 30

**Regression mot medelvärdet** innebär att extrema värden i en variabel tenderar att följas av mindre extrema värden i en annan mätning. Detta beror på att slumpmässiga variationer ofta avtar vid upprepade mätningar, vilket gör att värdena rör sig närmare populationens medelvärde.

Answer 31

**Regressionsfelslutet är en felaktig slutsats** om orsakssamband som uppstår när man tolkar en naturlig regression mot medelvärdet som en faktisk effekt. Till exempel kan en förbättring efter extremt dåliga resultat bero på regression mot medelvärdet snarare än en behandling eller intervention.

Answer 32

**Extrapolering innebär att man använder regressionsmodellen för att predicera värden** på den *beroende variabeln* (y-axeln) utanför det *observerade intervallet* för den *oberoende variabeln* (x-axeln). Detta bör undvikas då det kan leda till felaktiga prediktioner eftersom modellen inte är testad för dessa värden.

Answer 33

1. **Stickprovsstorlek**: Större stickprov ökar power. 2. **Effektstorlek**: Större effekter är lättare att upptäcka. 3. **Alfanivå**: En högre alfanivå (t.ex. 0,10 istället för 0,05) ökar power men också risken för typ I-fel. 4. **Varians**: Lägre varians i data ökar power. 5. **Studiedesign**: Effektiva designer, som beroende mätningar, kan öka power.

Answer 34

Powern är **extremt låg** i ett test baserat på en tärning. Testet är *inte* känsligt för att upptäcka sanna effekter eftersom det inte använder data utan förlitar sig på slump (tärningsslag). Det är omöjligt att förutsäga en verklig effekt, vilket gör att powern i praktiken är nära noll.