Forskningsmetod kognition Flashcards
Vad är statistik? Teoretiskt synsätt
En del inom tillämpad matematik som fokuserar på insamling, analys och presentation av data eller information
Vad är statistik? Tillämpat synsätt
Statistik ger oss en mängd olika verktyg som vi kan använda för att besvara frågor om världen omkring oss
Ofta används statistik för att dra generella slutsatser om en population från begränsade datamängder (stickprov)
Statistiska modeller
Mycket statistik går ut på att skapa modeller om verkligheten.
Modeller är aldrig perfekta presentationer men kan hjälpa oss dra användbara slutsatser. Statistiska modeller innefattar ofta en del osäkerhet.
Statistik klargör syftet (1)
- Kan vara kopplat till en forskningshypotes men måste inte vara det
- Ju tydligare syfte desto tydligare svar
- Handlar om att dra slutsatser med hjälp av data
Definiera mått/skala och statistiskt verktyg (2)
- Statistik kräver data som på något sätt rangordnad, kategoriserad eller kvantifierad
- Vilken mätmetod man väljer påverkar vilka statistiska verktyg man har tillgång till
- Skalnivåer är användbara för att koppla mått/skala till statistiska verktyg
Applicera statistiska verktyget på data (3)
- Statistiska verktyg inkluderar bl.a deskriptiv statistik och statistiska test
- Olika verktyg har olika regler för hur de kan användas
- Matematiken sköts ofta av datorer, dock viktigt att veta hur matten fungerar
Tolkning av resultat (4)
- Ju bättre man skött tidigare steg desto lättare blir tolkningen
- Tolkningar av statistiska test kräver att man förstår både resultatens praktiska och tekniska betydelser
- En viktig färdighet för att förstå statistiska undersökningar??
Tolkning av resultat (4)
- Ju bättre man skött tidigare steg desto lättare blir tolkningen
- Tolkningar av statistiska test kräver att man förstår både resultatens praktiska och tekniska betydelser
- En viktig färdighet för att förstå statistiska undersökningar??
Population
Teoretiskt begrepp, de vi är intresserade av, ex alla läkare i Sveriga
Stickprov
Praktiskt begrepp, den grupp som vi mätt, exempelvis alla läkare i vår undersökning
Parameter
Värde som beskriver populationen
Estimat
Värde som vi mätt eller beräknat från stickprovet
Observation
Enskild mätning, rangordning eller kategorisering
Variabel
Ett antal observationer som är mätta, rangordnade eller kategoriserade på samma sätt
Centralmått
Olika mått på centraltendenser i data, medelvärde, median och typvärde.
Om fördelningen av värden är symmetriskt fördelade tenderar dessa centralmått att vara ungefär samma.
Om fördelningen är skev tenderar de att vara olika och därmed missvisande.
Medelvärde
- Vanligt centralmått eftersom det har många praktiska egenskaper
- Väntevärdesriktigt, ju större n desto närmare hamnar m den populationsvärdet
Spridningsmått
- Olika mått på hur data är fördelad
- Variationsbredd
- percentiler och kvartiler
- varians och standardavvikelse
Variationsbredd
Skillnaden mellan högsta och lägsta värdet
Percentiler och kvartiler
Värde som en viss andel av fördelningen befinner sig under
Varians och standardavvikelse
Genomsnittlig variation
- Standardavvikelse, spridningsmått inom statistik och används inom statistiska test
Normalfördelning
- Teoretisk fördelning av data med många användbara egenskaper.
- Väldigt många typer av data är ungefär normalfördelade, ex längd och reaktionshastighet.
- Många statistiska test kräver, ungefär, normalfördelad data
- Beskriver inte vilka värden data har utan endast hur datan är fördelad
- I en ideal normalfördelning sammanfaller alltid standardavvikelser med specifika percentiler
- Man vet därför exakt hur en normalfördelning ser ut från medelvärde och standardavvikelse
Z-värden
- Ett sätt att skriva om data så att varje värde beskriver hur många standardavvikelser det är från medelvärdet
- Ändrar enheten inte värdet
- En standardisering av data så man enklare kan jämföra de med varandra
- När vi pratar om hur långt ett värde är från medelvärdet brukar vi använda z-värden
- Normalfördelning och Z-värden är väldigt viktiga för inferentiell statistik
- Mellan z 1.96 och -1.96 avgränsar man 95% av normalfördelningen VIKTIGT
Korrelation
- Mått på samvariation
- Kan vara positiv eller negativ
- Betyder inte kausalt samband
Pearsons produktmomentkorrelationskoefficient
- Standardiserat mått på samvarians, mellan 1 o -1
- Z- värden för en variabel är alltid både positiva och negativa
- Påvisar endast linjära korrelationer
- Påverkas mycket av extremvärden
- Kräver tillräcklig mängd variation hos båda variablerna
Pearsons r - tolkning
- Enligt Cohen är 0.1 svag korrelation, 0.3 medelstark korrelation och 0.5 en stark korrelation
- Detta är dock rätt godtyckligt och en korrelations praktiska betydelse beror mer av vilka variabler som mäts
- Även relevant om korrelationen är statistiskt signifikant
Spearmans rangkorrelationskoefficient
- Baserat på observationens rangordning istället för deras Z-värden
- Används exempelvis när data är på ordinalnivå, när det inte är normalfördelat eller när det förekommer extremvärden
- Kan även användas för monotona icke-linjära samband
Regression
- Används för att förutsäga värdet på en variabel baserat på värden för en annan
- Innefattar en eller flera regressionskoefficienter och ett intercept
- Tillskillnad från korrelation är det viktigt att avgöra vilken variabel som är beroende och vilken som är oberoende
Enkel linjär regressionsnalys
Vanligtvis beräknas regression med minsta kvadratavvikelse, (ex i statistik-program)
Räknar man för hand finns det mer praktiska formler
Regressionsanalys tolkning, ta hänsyn till? varje variabel?
- Intercept kan ses som basnivå och rk som mått på hur mycket den beroende variabeln beror av den oberoende
- Viktigt att ta hänsyn till variabelns begränsningar och inte försöka räkna ut värden som inte existerar
- Ofta undersöker man om varje enskild variabel är statistiskt signifikant, syftet med en multipel regression är ofta för att ta reda på vilka oberoende variabler som påverkar den beroende variabeln
Samplingsfördelning
- Oftast har vi inte tillgång till hela den population vi vill undersöka, därför stickprov/samples
- Medelvärde från stickprovet är sällan exakt samma som för populationen
- Samplingsfördelningen är en teoretisk fördelning som beskriver hur medelvärden från stickprov är fördelade
- Samplingsfördelningen är i princip alltid normalfördelad
Hur medelvärden från stickprov sprider sig kring populationens, normalfördelningen
Standardfelet (SE) (och påverkas av?)
- Standardavvikelsen för samplingsfördelningen
- Mått på hur mycket våra stickprov varierar
- Påverkas av stickprovsstorleken (n) och standardavvikelsen i populationen som uppskattas med standardavvikelsen för stickprovet
Samplingsfördelningens egenskaper
- Eftersom den är normalfördelad har den samtliga egenskaper som en normalfördelning har
- Standardfelet avgränsar alltså specifika percentiler
- Vi vet hur stor andel av värden (stickprov) som hamnar över och under vissa värden därmed vet vi också sannolikheten att få ett stickprov som är över eller under ett visst värde