Omtenta Forskningsmetod: Statistik (2,5 hp) Flashcards
Vad är ett z-värde?
Ett z-värde är ett mått på hur långt ifrån medelvärdet ett visst värde ligger i en normalfördelning, uttryckt i standardavvikelser
Z-värdet används för att standardisera data (omvandlar data till en gemensam skala) och jämföra värden från olika fördelningar.
Vad är samplingfördelning?
Samplingfördelning är en fördelning av en statistik (t.ex. medelvärde) beräknad från flera lika stora stickprov av en population.
Samplingfördelning är fördelning av specifik statistik från flera stickprov av samma population.
Samplingfördelning: fördelningen av medelvärden från olika stickprov.
Föreställ dig att du upprepade gånger tar stickprov av samma storlek från en population och varje gång beräknar en statistik, som medelvärdet. Om du plotterar dessa medelvärden får du en fördelning som visar hur ofta olika medelvärden förekommer från samma population. Detta är samplingfördelningen.
Det hjälper en att förstå vilka medelvärden som är mest sannolika och hur mycket variation du kan förvänta dig på grund av slumpen.
Vad är ett estimat?
Ett estimat är ett uppskattat värde för en populationsparameter (det sanna värdet för populationen) baserat på data från ett stickprov.
Estimat är ett sätt att gissa värdet för en parameter när hela populationen inte är undersökt.
Vad är en parameter?
En parameter är det sanna värdet för en population, t.ex. hela medellängden för hela populationen, eller
Vad är skillnaden mellan en parameter och ett estimat?
En parameter är det sanna värdet hos en population, ett estimat är värdet hos ett stickprov från populationen (en gissning/approximation av det sanna värdet).
Hur påverkar standardavvikelsen konfidensintervallets bredd?
- Ett stickprov med liten standardavvikelse tyder på att variansen också är liten.
| Stickprovsmedelvärdena varierar alltså inte lika mycket kring det sanna medelvärdet.
| Konfidensintervallet blir alltså mindre då variansen är mindre.
Vad är standardfelet (SE)?
Standardfelet är standardavvikelsen för samplingfördelningen. Det är ett mått på hur mycket stickprovsestimat varierar mellan olika stickprov.
Tänk på standardfelet som “medelvärdets standardavvikelse”. Precis som standardavvikelsen mäter spridningen av individuella värden kring medelvärdet, mäter standardfelet spridningen av medelvärden från olika stickprov kring populationsmedelvärdet.
Hur påverkar stickprovets storlek konfidensintervallets bredd?
- Ett stort stickprov gör testet mer representativt för populationen
| Medelvärdet i stickprovet ligger då närmare det sanna medelvärdet i populationen.
| Detta leder till att konfidensintervallet blir mindre (spannet för det sanna värdet blir mindre).
Ett litet stickprov gör att medelvärdet riskerar att ha större avvikelse från dess sanna medelvärde. Konfidensintervallet blir också större då spannet för det sanna värdet blir större.
Vad är regressionskoefficienten (b₁)?
Regressionskoefficienten (b₁) beskriver lutningen på regressionslinjen. Den visar hur mycket den beroende variabeln (y) förändras för varje enhetsökning i den oberoende variabeln (x).
Vad är ett p-värde?
Ett p-värde beskriver sannolikheten att få det resultat man har, eller ett mer extremt resultat, om nollhypotesen trots allt skulle vara sann.
P-värde = 0.05, eller mindre är statistiskt signifikant
Hur kan man använda konfidensintervallet för att ta reda på om medelvärdet av stickprovet skiljer sig från noll?
- I stickprovet så har man ett estimat av vad medelvärdet i populationen är.
| Genom att observera konfidensintervallet kring estimatet, så kan man se ifall konfidensintervallet inkluderar nollpunkten.
Ifall konfidensintervallet inkluderar nollpunkten så kan man inte med säkerhet säga att medelvärdet inte kan vara noll, men om det inte gör det så är sannolikheten stor att medelvärdet inte är noll.
Vad är en nollhyptes (H₀)?
En nollhypotes (H₀) är antagandet att det inte finns någon effekt eller skillnad i ens resultat.
Nollhypotesen är den vi testar och försöker motbevisa i statistiska analyser.
Vad är en alternativhypotes (H₁)?
En alternativhypotes (H₁) är antagandet att det finns en effekt eller skillnad i ens resultat.
Om nollhypotesen förkastas (p-värde ≤ 0,05), tyder resultaten på att alternativhypotesen är mer sannolik.
Vad är t-test?
Ett t-test är en statistisk metod som används för att avgöra om det finns en signifikant skillnad mellan medelvärdena i två grupper (oberoende t-test/beroende t-test) eller mellan ett stickprovs medelvärde och ett populationsmedelvärde (one-sample t-test).
Vad är ett oberoende t-test?
Vad för antaganden krävs?
Ett oberoende t-test används för att jämföra medelvärden från två separata grupper som inte är relaterade till varandra.
Exempel: Jämförelse av blodtryck mellan två grupper som tar olika mediciner (Grupp 1 = Medicin A, Grupp 2 = Medicin B).
Parametriskt test.
Oberoende t-test antar:
- Intervall- eller kvotskala (datavärdena måste kunna mätas på en skala där skillnader har meningsfulla tolkningar).
- Oberoende mätningar (individer i en grupp påverkar inte individer i den andra gruppen).
- Populationen eller stickprovet antas vara normalfördelat (värdena i populationen eller stickprovet ska följa en normalfördelning).
- Homogena populationsvarianser (lika spridning i båda grupperna).
Vad är ett beroende t-test?
Vad för antaganden krävs?
Parametriskt test
Ett beroende t-test används för att jämföra medelvärden från samma grupp vid två olika tidpunkter.
Exempel: Före- och eftermätningar av vikt för samma personer efter ett träningsprogram.
Parametriskt test.
Beroende t-test antar:
- Intervall- eller kvotskala (datavärdena måste kunna mätas på en skala där skillnader har meningsfulla tolkningar).
- Beroende mätningar (samma individer mäts två gånger, eller mätningar är kopplade på något sätt).
- Populationen eller stickprovet antas vara normalfördelat (värdena i populationen eller stickprovet ska följa en normalfördelning).
Vad är centralmått?
Ett centralmått beskriver den övergripande positionen eller “tyngdpunkten” i en datamängd. Vanliga centralmått är typvärde, median och medelvärde.
Centralmått ger en sammanfattning av data för att förstå det typiska värdet.
Vad är ett typvärde?
Ett typvärde är det värde som förekommer flest gånger i en datamängd.
Beskriver vilket värde som är mest representativt eller vanligast i en datamängd.
Vad är median?
Median är det mittersta värdet i en sorterad lista av data.
T.ex. i [1, 3, 5], är 3 medianen.
Vad är ett medelvärde?
Ett medelvärde är det genomsnittliga värdet i en datamängd, man adderar alla värden och dividerar summan med antalet värden.
Vad är regression?
Regression är en statistisk metod som används för att modellera sambandet mellan två eller fler variabler.
Regression används för att förstå sambandet mellan t.ex. studietimmar (X) och provresultat (Y).
Vad är interceptet (b₀) hos regressionslinjen?
Interceptet (b₀) är det värde där regressionslinjen skär y-axeln. Det representerar värdet på y när x är lika med noll.
Interceptet kan visa startvärdet, som en persons grundlön innan bonusar läggs till.
Vad är en regressionslinje?
En regressionslinje används för att visa sambandet mellan två variabler och för att förutsäga värdet på den beroende variabeln (y-axeln) baserat på värdet av den oberoende variabeln (x-axeln).
Lutningen på regressionslinjen visar om sambandet är positivt (y ökar när x ökar
) eller negativt (y minskar när x ökar
), samt hur starkt detta samband är.
Interceptet (b₀) visar var linjen skär y-axeln, det vill säga värdet på y när x är 0
.
Exempel: Om vi undersöker sambandet mellan antal studietimmar (x) och provresultat (y), kan regressionslinjen hjälpa oss att förutse provresultatet för en elev som studerar ett visst antal timmar.”