statestik 2.0 Flashcards
Population- värdet
Population-värdet: Det faktiska värdet för en specifik parameter i hela populationen.
Exempel: Om du vill veta medelinkomsten för alla invånare i en stad, skulle population-värdet vara den exakta genomsnittliga inkomsten för alla invånare i staden.
Stickprovets-värde
Stickprovets-värde: Värdet för en parameter som observeras i det insamlade stickprovet från populationen.
Exempel: Om du frågar 100 slumpmässigt utvalda personer i staden om deras inkomst och beräknar medelvärdet, så är det stickprovets medelvärde.
Statistisk power
Statistisk power: Sannolikheten att ett statistiskt test kommer att upptäcka en verklig effekt om den finns.
Exempel: Om du utför ett experiment för att testa en ny medicin och har hög statistisk kraft, ökar chansen att du faktiskt kommer att observera en signifikant förbättring i patienternas hälsa om medicinen är effektiv.
Påverka den statistiska styrkan i en hypotestestning:
Effektstorlek (Effect Size):
Storleken på den verkliga effekten som man försöker upptäcka. Ju större effektstorlek, desto högre blir den statistiska styrkan.
Signifikansnivå (Alfa-nivå):
Den valda alfa-nivån representerar tröskeln för att förkasta nollhypotesen. Högre alfa-nivåer ökar den statistiska styrkan men ökar också risken för att begå typ I-fel.
Stickprovsstorlek (Sample Size):
Antalet observationer i stickprovet. En större stickprovsstorlek ökar oftast den statistiska styrkan genom att minska variationen i stickprovet.
Oberoende t-test
Oberoende t-test: Ett statistiskt test som används för att jämföra medelvärdena mellan två oberoende grupper. ( Olika grupper
Typ av test: Parametrisk.
Exempel: Jämföra medelinkomsten för män och kvinnor i en population.
Motsvarighet till Oberoende t-test
Icke-parametriskt test: Mann-Whitney U-test (även kallad Wilcoxon rank-sum test).
Antaganden: Datapunkterna är oberoende. Båda grupperna har samma form av fördelning (till exempel, normalfördelning).
Beroende t-test
Beroende t-test: Ett statistiskt test för att jämföra medelvärdena mellan två relaterade grupper. ( Samma grupper)
Typ av test: Parametrisk.
Exempel: Jämföra prestanda före och efter en behandling på samma grupp patienter.
Motsvarighet till Beroende t-test
Icke-parametriskt test: Wilcoxon matched-pairs test (även kallad Wilcoxon signed-rank test).
Antaganden:Datapunkterna är parvis kopplade (beroende).
Differenserna mellan parvisa observationer är symmetriskt fördelade (det krävs dock inte att de är normalfördelade).
Mann-Whitney
Mann-Whitney-test: Ett icke-parametriskt test för att jämföra medianerna mellan två oberoende grupper.
Exempel: Jämföra poängen i ett test mellan två grupper där datan inte är normalfördelad.
En icke-parametrisk motsvarighet till det oberoende t-testet för att jämföra medianerna mellan två oberoende grupper.
Mindre känslig för normalitetsantaganden.
Standardfel
Standardfel: Måttet på osäkerheten i ett statistiskt mått, vanligtvis standardavvikelsen för stickprovet.
Exempel: Om standardfelet för medelvärdet för inkomst i ett stickprov är högt, indikerar det att det genomsnittliga inkomstvärdet kan variera mycket i olika stickprov.
Samplingsfördelning
Samplingsfördelning: Fördelningen av ett statistiskt mått över olika stickprov från samma population.
Exempel: Medelvärdet för inkomst i olika stickprov från samma stad bildar en samplingsfördelning.
Konfidensintervall
Konfidensintervall: Ett intervall inom vilket man tror att det verkliga population-värdet faller med en viss sannolikhet.
Exempel: “95% konfidensintervall för medelinkomst” kan vara 30000 SEK till 35000 SEK, vilket indikerar att vi är 95% säkra på att det verkliga genomsnittet ligger inom detta intervall.
Nollhypotesen
Nollhypotes:En påstådd utgångspunkt som antas vara sann innan man samlar in data för ett statistiskt test.
Exempel: Antagandet att det inte finns någon skillnad i medelinkomst mellan män och kvinnor i en population.
Alternativhypotesen
Alternativ hypotes: En påstådd utgångspunkt som man försöker stödja med statistiska bevis.
Exempel: Påståendet att medelinkomsten för kvinnor är annorlunda än medelinkomsten för män i en population
Z-värdet
Z-värdet: Antal standardavvikelser som ett observationer eller värde avviker från medelvärdet i en standardiserad normalfördelning.
Exempel: Om ett z-värde är 2, betyder det att observationen ligger 2 standardavvikelser över medelvärdet.
Regressionlinje
Regressionslinje: En linje som bäst passar datapunkterna i en regressionanalys, används för att modellera sambandet mellan variabler.
Exempel: En regressionslinje som visar sambandet mellan studietimmar och examensresultat.
Prametrisk
Antagande: Linjäritet, normalfördelning och homoskedasticitet.
Korrelation
Korrelation: Måttet på hur starkt två variabler är relaterade till varandra.
Exempel: Om det finns en hög positiv korrelation mellan träningstid och viktminskning, betyder det att de som tränar mer tenderar att förlora mer vikt.
Parametrisk och antagande
Statistiska metoder som används där alla eller nästan alla antagande (krav) är uppfyllda. Som att datan är fördelad enligt en viss fördelning (till exempel normalfördelad).