Begrepp Flashcards
Riktningsproblemet
när man ej kan veta om OV —> BV eller BV —> OV.
Bakomliggande-variabel-problemet
när de finns ett skensamband mellan OV och BV som bor på en annan bakomliggande variabel (som orsakar båda)
Obundet slumpmässigt urval
att slumpmässigt välja ett stickprov utifrån en urvalsram (den förteckning man har att tillgå, bör representera hela populationen). Alla har lika stor sannolikhet att komma med.
Reliabilitet
i vilken mån man kan lita på sitt mätinstrument, dvs hur mycket slumpen kan förvränga resultatet.
Validitet
om mätinstrumentet faktiskt mäter det man avser att mäta.
Det totala felet (5)
urvalsfel, täckningsfel, bortfallsfel, mätfel, bearbetningsfel
Urvalsfel
val av eneter till studien är inte representativt, man kan inte identifiera representativa enheter till studien, skillnad på slumpmässigt urval och inte.
Täckningsfel
målpopulationen och rampopulationen matchar inte, Övertäckning/undertäckning
Bortfallsfel
att man inte får svar från alla man tänkt att undersöka, Individ/variabel
Mätfel
när det är skillnader mellan det erhållna värdet och det sanna värdet, kan bero på mätinstrumenten, mätmetoden, en intervjuare, en respondent.
Bearbetningsfel
uppkommer i analys och bearbetning av data, t.ex kodningsfel, fel vid registrering till datorn eller vid datorbearbetning
Diskret/kontinuerlig variabel
Diskret - kan anta vissa värden, har ett exakt värde, Kontinuerlig - kan anta alla värden, dvs oändligt många värden inom en viss intervall
Skalnivåer
Nominalskala, Ordinalskala, Intervallskala, Kvotskala
Relativ frekvens
andelen i procent.
Envägstabell
endast en variabel redovisas.
Korstabell
två kvalitativa variabler redovisas tillsammans
Fyrfältstabell
där två variabler har två variabelvärden var. Tabellen har två rader och två kolumner med totalt fyra fält för frekvenser.
Kumulerade frekvenser
frekvenser adderas kumulativt neråt eller uppåt i frekvenstabellen, även för relativa frekvenser.
Talpar
paret av ett x och ett y värde som anger en punkt i ett koordinatsystem
Histogram
stapeldiagram för klassindelat material, stolparnas bredd motsvarar klassens bredd och det finns inget mellanrum mellan dem.
Variationsbredd
range, bredden mellan de lägsta och det högsta värdet
Varians
mått på hur spridningen på en variabel förhåller sig till medelvärdet. genomsnittliga värdet som varje observation avviker från medelvärdet i kvadrat
Standardavvikelse
standard deviation, genomsnittliga värdet som varje observation faktiskt avviker från medelvärdet
z-poäng
standardpoäng, standardiserad normalfördelning. Hur många standardavvikelser en råpoäng befinner sig från medelvärdet. En universell norm som man kan använda på allt som är approximativt normalfördelat
Normalfördelning
klockformad och symmetrisk,
asymptotisk (fortsätter oändligt åt båda sidor och möter aldrig x-axeln),
har inflekionspunkter vid ± 1 standardavvikelse från medelvärdet (buktar först ut och sen in),
fördelningens utseende bestäms av medelvärde och varians
Mellanliggande variabel
en variabel som ligger mellan X och Y, X påverkar MV och MV påverkar Y, X påverkar då Y indirekt genom MV
Skensamband
när det finns ett samband mellan X och Y som orsakas av en bakomliggande störvariabel Z, Z påverkar både X och Y
Korrelation
mått som beskriver hur starkt ett samband mellan två variabler är, den standardiserade samvariationen
Pearsons korrelationskoefficient
mäter graden av linjär samvariation mellan två variabler. Kan anta värden mellan -1 och +1, där både -1 och +1 är perfekta samband
Deskriptiv statistik
beskriver data i ett stickprov genom centralmått, spridningsmått, frekvenstabeller och frekvensdiagram.
Inferentiell statistik
hypotesprövning, dra slutsatser om populationer utifrån observationer i stickprov. Att undersöka om skillnader, korrelation osv är så stor att de inte kan ha uppkommit genom slump.
Samplingfördelning
en frekvensfördelning över någon slags stickprovsegenskap, som t.ex medelvärde, varians, korrelation osv. Visar hur slumpen kan ge olika värden på stickprovsegenskapen i olika stickprov.
Centrala gränsvärdessatsen
om vi beräknar medelvärdet av ett stort antal slumpmässiga tal kommer medelvärdet närma sig en normalfördelning, oavsett hur fördelningen för de enskilda talen ser ut.
Medelfelet
standardavvikelsen i en samplingfördelning av medelvärden.
Ju mindre standardfelet är desto mindre är osäkerheten och desto bättre kommer stickprovet estimera populationen.
Kritisk gräns
markerar de gränser i samplingfördelningen som gäller om nollhypotesen är sann, dvs de procent som man måste hamna över eller under för att förkasta den
Typ I-fel
man förkastar nollhypotesen trots att det inte finns ett samband, man fick ett signifikant resultat av en slump.
Typ II-fel
man får inte ett signifikant resultat trots att det finns ett samband, man behåller nollhypotesen trots att den är falsk.
Z-test
hypotesprövning för stickprovsmedelvärde när både medelvärde och SD är känt för hela populationen. undersöker om skolland på medelvärde mellan stickprov och population kan ha uppkommit av en slump
T-fördelning
ett sätt att uppskatta SD för populationen utifrån SD för stickprovet, genom att använda frihetsgrader, För varje antal frihetsgrader finns ett motsvarande t-fördelning i en tabell
T-test
hypotesprövning för stickprovsmedelvärde när man endast har tillgång till t och inte z
Effektstyrka
Cohens d, ett standardiserat mått på avståndet mellan två populationsmedelvärden, med populationen SD som enhet. Man mäter hur stora skillnaderna/effekterna faktiskt är
ANOVA
variansanalys, statistisk metod för att ta reda på om stickprovsmedelvärden skiljer sig signifikant från varandra. handlar enkelt om att studera variationen inom grupper, mellan grupper och den totala variationen, samt relationen mellan dessa.
Oberoende variansanalys
man har olika individer på olika nivåer på OV. T.ex att olika personer slumpas in i olika grupper som med olika betingelser.
Beroende variansanalys
man har aningen samma eller matchande individer i olika nivåer på OV. T.ex att alla försökspersoner testas på för alla tre betingelser (och jämförs mig sig själva) eller matchas ihop genom vissa nyckelvariabler. Man måste dock se upp med ordningsföljden.
Envägs oberoende variansanalys
man studerar effekterna av en OV på BV och man jämför två eller flera oberoende grupper (dvs olika grupper som får olika betingelser).
Regressionslinjen
beskriver den linje som bildas vid korrelation mellan variabler. För att räkna ut en måste man alltså första ha ett linjerät samband och ha räknat ut korrelationskoefficienten
Prediktion
förutsägelse från data.
Regressionsanalys
ett sätt att analysera sin data likt variansanalys, används när OV är på intervall- eller kvotnivå. Endast vis linjära samband.
Regressionskoefficienten
linjens lutning. Hur många enheter Y ändras när X ändras en enhet.
Intercept
skärningspunkten med y-axeln. Det värde Y antar när X är 0.
Statistiska fallgropar (8)
Korrelation ≠ kausalitet, Extremvärden, Hypotesprövning vs. post-hoc, Massignifikationsproblemet, Litet vs. stort stickprov, Restriction of range-problemet, Gruppnivå ≠ individnivå, Regressionsfelslutet
Korrelation ≠ kausalitet
statistiskt samband behöver inte innebära kausalsamband, att det finns samband mellan X och Y betyder inte att X orsakar Y
Hypotesprövning vs. post-hoc
vid hypotesprövning används en teori för att formulera en hypotes som sedan testas mot verkligheten, samma teori kan då både stärkas eller försvagas. Post-hoc innebär att men hittar ett fynd ur verkligheten och i efterhand inser att se stärker en teori
Massignifikationsproblemet
när flera hypotesprövningar gör i samma underökning ökar risken för typ I-fel till mer än alfanivån för varje prövning. Risken att gör minst ett fel av x-antal prövningar är större än risken att gör fel för varje prövning för sig
Litet vs. stort stickprov
man riskerar att inte ta signifikanta resultat vid små stickprov på allvar eller att göra typ II-fel om stickprovet är för litet för att visa signifikans. Stora stickprov ger nästan alltid signifikanta resultat, varligs de finns eller inte egentligen
Restriction of range-problemet
dålig spridning ökar generellt risken för typ II-fel, dvs minskar ofta chansen att få ett signifikant resultat. Ibland gör detta att man minskar viktiga samband, ibland blir det mer verklighetstroget.
Regressionsfelslutet
det finns nästan alltid en regressionseffekt åt något håll, antingen positiv eller negativ. Att därför dra en slutsats endast utifrån en ökning eller sänkning av ett visst värde är inte att rekommendera. Om man utgår från x och ska prediciera y, får vi utgå från att y kommer vara mindre extrem än x.
Variationskoefficient
relativ spridning, jämföra spridning mellan grupper eller variabler, när man vill se hur stora variationerna är trots att inte siffrorna är samma
Negativ snedvridning
svansen åt vänster och toppen åt höger.
Positiv snedvridning
svansen åt höger och toppen åt vänster.
Intern validitet
om vi kan dra slutsatser om ett orsakssamband och vilken riktning det går, huruvida OV —> BV helt säkert.
Extern validitet
möjligheten att generalisera det samband man påvisat till andra sätt att manipulera/mäta OV och BV, andra miljöer eller andra individer/populationer. Görs bäst genom att faktiskt visa att samma samband finns på flera ställen.
Determinationskoefficienten
anger andelen förklarad varians och räknas ut genom att kvadrera korrelationskoefficienten (r²). detta får bort negativa tal som sedan kan skrivas som procent, för att förstå hur stark korrelationen är
F-kvot
genom att dela något som kan bero på både slump och systematik (MSb) med något som bara kan bero på slump (MSw), kan man se hur mycket systematik som finns i datan. Ju större F-kvot desto mer systematik.