statestik 2.0 Flashcards

1
Q

Population- värdet

A

Population-värdet: Det faktiska värdet för en specifik parameter i hela populationen.

Exempel: Om du vill veta medelinkomsten för alla invånare i en stad, skulle population-värdet vara den exakta genomsnittliga inkomsten för alla invånare i staden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Stickprovets-värde

A

Stickprovets-värde: Värdet för en parameter som observeras i det insamlade stickprovet från populationen.

Exempel: Om du frågar 100 slumpmässigt utvalda personer i staden om deras inkomst och beräknar medelvärdet, så är det stickprovets medelvärde.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Statistisk power

A

Statistisk power: Sannolikheten att ett statistiskt test kommer att upptäcka en verklig effekt om den finns.

Exempel: Om du utför ett experiment för att testa en ny medicin och har hög statistisk kraft, ökar chansen att du faktiskt kommer att observera en signifikant förbättring i patienternas hälsa om medicinen är effektiv.

Påverka den statistiska styrkan i en hypotestestning:

Effektstorlek (Effect Size):
Storleken på den verkliga effekten som man försöker upptäcka. Ju större effektstorlek, desto högre blir den statistiska styrkan.

Signifikansnivå (Alfa-nivå):
Den valda alfa-nivån representerar tröskeln för att förkasta nollhypotesen. Högre alfa-nivåer ökar den statistiska styrkan men ökar också risken för att begå typ I-fel.

Stickprovsstorlek (Sample Size):
Antalet observationer i stickprovet. En större stickprovsstorlek ökar oftast den statistiska styrkan genom att minska variationen i stickprovet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Oberoende t-test

A

Oberoende t-test: Ett statistiskt test som används för att jämföra medelvärdena mellan två oberoende grupper. ( Olika grupper

Typ av test: Parametrisk.

Exempel: Jämföra medelinkomsten för män och kvinnor i en population.

Motsvarighet till Oberoende t-test
Icke-parametriskt test: Mann-Whitney U-test (även kallad Wilcoxon rank-sum test).

Antaganden: Datapunkterna är oberoende. Båda grupperna har samma form av fördelning (till exempel, normalfördelning).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Beroende t-test

A

Beroende t-test: Ett statistiskt test för att jämföra medelvärdena mellan två relaterade grupper. ( Samma grupper)
Typ av test: Parametrisk.

Exempel: Jämföra prestanda före och efter en behandling på samma grupp patienter.

Motsvarighet till Beroende t-test

Icke-parametriskt test: Wilcoxon matched-pairs test (även kallad Wilcoxon signed-rank test).

Antaganden:Datapunkterna är parvis kopplade (beroende).

Differenserna mellan parvisa observationer är symmetriskt fördelade (det krävs dock inte att de är normalfördelade).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Mann-Whitney

A

Mann-Whitney-test: Ett icke-parametriskt test för att jämföra medianerna mellan två oberoende grupper.

Exempel: Jämföra poängen i ett test mellan två grupper där datan inte är normalfördelad.

En icke-parametrisk motsvarighet till det oberoende t-testet för att jämföra medianerna mellan två oberoende grupper.

Mindre känslig för normalitetsantaganden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Standardfel

A

Standardfel: Måttet på osäkerheten i ett statistiskt mått, vanligtvis standardavvikelsen för stickprovet.

Exempel: Om standardfelet för medelvärdet för inkomst i ett stickprov är högt, indikerar det att det genomsnittliga inkomstvärdet kan variera mycket i olika stickprov.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Samplingsfördelning

A

Samplingsfördelning: Fördelningen av ett statistiskt mått över olika stickprov från samma population.

Exempel: Medelvärdet för inkomst i olika stickprov från samma stad bildar en samplingsfördelning.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Konfidensintervall

A

Konfidensintervall: Ett intervall inom vilket man tror att det verkliga population-värdet faller med en viss sannolikhet.

Exempel: “95% konfidensintervall för medelinkomst” kan vara 30000 SEK till 35000 SEK, vilket indikerar att vi är 95% säkra på att det verkliga genomsnittet ligger inom detta intervall.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Nollhypotesen

A

Nollhypotes:En påstådd utgångspunkt som antas vara sann innan man samlar in data för ett statistiskt test.

Exempel: Antagandet att det inte finns någon skillnad i medelinkomst mellan män och kvinnor i en population.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Alternativhypotesen

A

Alternativ hypotes: En påstådd utgångspunkt som man försöker stödja med statistiska bevis.

Exempel: Påståendet att medelinkomsten för kvinnor är annorlunda än medelinkomsten för män i en population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Z-värdet

A

Z-värdet: Antal standardavvikelser som ett observationer eller värde avviker från medelvärdet i en standardiserad normalfördelning.

Exempel: Om ett z-värde är 2, betyder det att observationen ligger 2 standardavvikelser över medelvärdet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Regressionlinje

A

Regressionslinje: En linje som bäst passar datapunkterna i en regressionanalys, används för att modellera sambandet mellan variabler.

Exempel: En regressionslinje som visar sambandet mellan studietimmar och examensresultat.

Prametrisk
Antagande: Linjäritet, normalfördelning och homoskedasticitet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Korrelation

A

Korrelation: Måttet på hur starkt två variabler är relaterade till varandra.

Exempel: Om det finns en hög positiv korrelation mellan träningstid och viktminskning, betyder det att de som tränar mer tenderar att förlora mer vikt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Parametrisk och antagande

A

Statistiska metoder som används där alla eller nästan alla antagande (krav) är uppfyllda. Som att datan är fördelad enligt en viss fördelning (till exempel normalfördelad).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Chi-två test

A

Chi-två test: Ett statistiskt test som används för att avgöra om det finns en signifikant skillnad mellan förväntade och observerade frekvenser i en kategorisk variabel.

Exempel: Används för att avgöra om det finns en signifikant skillnad i förekomsten av en viss sjukdom mellan två grupper.

17
Q

Parametriska tester

A

Pearssons, oberoende och beroende t-test antar att deras data är på minst intervallskala men ibland ordinalskala. Antar även att de är normalfördelade mellan stickproven. Skeva fördelningar = problem. Extremvärden viktigast för Pearson men påverkar alla. Oberoende t-test: varians ska vara ungefär detsamma dvs homogen populationsvarians. Variansen ska vara max tre gånger så stor i en grupp jmfr med den andra gruppen.

18
Q

Icke-parametriska tester

A

Icke-parametriska tester är ofta användbara när antagandena för parametriska tester inte är uppfyllda. De kräver inte specifika antaganden om datans fördelning och är därför robustare i vissa situationer. Det är dock viktigt att vara medveten om deras begränsningar och att valet mellan parametriska och icke-parametriska tester bör baseras på studiens specifika förutsättningar och syfte.

Går inte att uppfylla antagandena för parametriska test så gör man icke-parametriska test. Spearmans, Mann Whitney U och Wilcoxon.

Parametriska är standard. Icke har lägre power.

19
Q

Spearmans

A

Spearmans rangkorrelation:
Typ av test: Icke-parametrisk.

Användning: Mäter styrkan och riktningen av ett monotoniskt samband mellan två rangordnade variabler.Påverkas inte av extremvärden på samma sätt som pearsons

Exempel: Om du studerar sambandet mellan studietid och examensresultat, kan du använda Spearmans rangkorrelation om datan inte är normalfördelad och sambandet är monotont.

20
Q

Wilcoxon

A

Wilcoxon matched-pairs test:
Typ av test: Icke-parametrisk.

Användning: Jämför medianerna mellan två relaterade grupper.

Exempel: Om du samlar in data från samma grupp före och efter en behandling och vill undersöka om det finns en signifikant förändring, kan du använda Wilcoxon matched-pairs test om antagandena för det beroende t-testet inte är uppfyllda.

21
Q

Pearsons korrelation

A

Pearsons korrelation:
Typ av test: Parametrisk.

Användning: Mäter styrkan och riktningen av ett linjärt samband mellan två kontinuerliga variabler.

Exempel: Om du studerar sambandet mellan studietid och examensresultat och antar att datan är normalfördelad och visar en linjär relation, kan du använda Pearsons korrelation.

Motsvarig till Pearsons Korrelation är Spearmans rangkorrelation:

Typ av test: Icke-parametrisk.
Användning: Mäter styrkan och riktningen av ett monotoniskt samband mellan två variabler.

Antaganden: Datapunkterna behöver inte vara normalfördelade.
Spearmans korrelation är robust mot avvikande värden. Tål extrem värden
Det kräver inte att sambandet är linjärt utan bara monotoniskt.

22
Q

Statistiska fallgropar

A

Massignifikansproblemet
Replikationsproblemet
Typ 1 problemet
Typ 2 problemet
P-Hacking
Har-king

23
Q

Massignifikansproblemet

A

Forskarnas ändå fokus är att få signifikant och inte bryr sig om något annat. 1 av 20 kommer vissa av slumpen att det är en signifikant, detta innefattar inte att det är signifikant utan bara genom slumpen, men det bryr sig inte de utan bara att det är signifikant.

24
Q

Replikationsproblemet

A

En oroande trend där många vetenskapliga studier inte kan replikeras av andra forskare, vilket ifrågasätter pålitligheten och generaliserbarheten av forskningsresultat.

25
Q

Typ 1 problemet

A

Att förkasta nollhypotesen när den egentligen är sann. Det innebär att man tror att det finns en signifikant effekt när det inte finns någon.

Förebyggande: Välj en passande alfa-nivå och överväg konsekvenserna av typ I-fel i kontexten av studien.

26
Q

Typ 2 problemet

A

Att inte förkasta nollhypotesen när den egentligen är falsk. Det innebär att man misslyckas med att upptäcka en verklig effekt.

Förebyggande: Öka statistisk styrka genom att använda större stickprov eller välja känsligare testmetoder.

27
Q

P-Hacking

A

Att genomföra flera statistiska tester och rapportera endast de som visar signifikanta resultat, vilket ökar risken för falskt positiva resultat.

Förebyggande: Förbättra transparens genom att rapportera alla genomförda tester och använd justeringar för multipel testning.