statistik Flashcards

1
Q

Pearsons correlation coefficient

A

ett mått på graden av samvariation mellan två variabler

Förkortas r för stickprov och p för population.

Vanligaste sättet att beräkna en korrelation och mäter graden av linjär samvariation. Ger ett värde mellan -1 och 1.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Yerkes-Dodsons lag

A

Ett av psykologins äldsta fynd. Postulerar att det råder ett upp-och nedvänt U-samband mellan arousal och prestation. En konsekvens av denna lag blir att varken låg eller hög arousal för optimala förutsättningar för ett gott resultat.

Enligt Pearson r med data skulle vi erhålla en korrelation på 0,001 dvs mycket nära noll, men det stämmer ju inte alls för det finns ju ett starkt samband däremellan. Svaret är att detta samband inte är linjärt och kan därför inte fångas med Pearsons korrelations koefficient

Yerkes-Dodsons lag - är ett icke-linjärt samband.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

z-poäng

A

På samma sätt som vi kan jämföra värdet av två olika valutor (USD och GBP) genom att översätta dom till en gemensam norm, ex svenska kronor, kan vi jämföra värden på helt olika skalor genom att översätta dom till z-poäng (standardpoäng)

Z-poäng - universell norm som kan användas på sådant som är normalfördelat. Ex: om vi översätter vikt och längd till z-poäng kan vi jämföra dom och till exempel säga vilken som är störst.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

När används paried-samples t-test? Ange en konkret frågeställning som skulle kunna testas med detta test.

A

Används när vi vill testa om två olika varabler antas ha samma medelvärde i en population.

Ex: Gillar alla barn i åldern 5 glass lika mycket som de gillar godis?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

oberoende variabel

A

den variabeln som manipuleras eller betraktas som orsaksvariabel. OV

Betecknas ofta med X

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Beroende variabel

A

den variabel som mäts som en effekt av den oberoende variabeln. BV

betecknas ofta Y

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

olika samband riktningar

A

Enkelriktat - ökad längd, ökad vikt

Dubbelriktat - studieresultat och hälsa

Samband med mellanliggande variabel (M) - reklam - löning - konsumtion

Skensamband - orsakat av en bakomliggande variabel (z)

Ålder (z)

byxlängd (x) IQ (y)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Punktdiagram

A

visar sambandet mellan två variabler. Varje individs värden på variablerna x och y ritas som punkter, cirklar, kryss, fyrkanter, etx i ett koordinatsystem.

Scatterplot diagram

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Vad är ett svagt, medelstarkt och starkt samband enligt Cohens riktlinjer?

A

r = 0,10 svagt

r = 0,30 medelstarkt

r = 0,50 starkt samband

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

determinationskoefficienten

A

om man kvadrerar r får man dk (r^2) som anger proportion förklarad varians

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Spearmans rangkorrelationskoefficient

A

Är lämplig då man vill beräkna korrelationen mellan snedfördelade variabler, särskilt om stickprovet är litet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

kvalitativ metod

A

data ofta i form av språkliga enheter, bearbetningen är beskrivande och kategoriserande

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

kvantitativ metod

A

insamling av siffermässiga data, bearbetningen är matematisk/statistisk

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

undesökningsdesign

research method

A

försöksupplägg

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

experiment

A

kännetecknas av kontroll över OV och randomisering av undersökningsdeltagare till betingelser

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

kvasi-experiment

A

kännetecknas av kontroll över OV men inge randomisering av undersökningsdeltagare till betingelser

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

icke-experiment

A

så kallade korrelationsstudier. Varken kontroll över OV eller randomisering av individer till betingelser

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

undersökningens validitet

A

i vilken utsträckning man kan lita på slutsatserna från undersökningen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

intern validitet

A

handlar om att man verkligen kan lita på att det var OV och ingenting annat som påverkade BV.

Riktningsproblemet och bakomliggande-variabel-problemet måste beaktas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

extern validitet

A

Handlar om giltigheten i att göra generaliseringar från det samband mellan OV och BV som påvisats.

Dels till andra sätt att mäta OV och BV, dels till andra miljöer, dels till andra individer än de undersökta.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

urvalsmetoder

A

speciellt vid större frågeformulärsundersökningar (surveys) är det viktigt att man är noggrann med hur man slumpmässigt väljer undersökningsdeltagare till stickprovet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

mätdata

A

uppmätta variabelvärden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

mätinstrumentets reliabilitet

A

handlar om hur pålitligt instrumentet är för att mäta det som det avser att mäta. Hur litet det påverkas av slumpmässiga fel.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

mätinstrumentets validitet

A

handlar om huruvida instrumentet verkligen mäter det som det ska mäta. Dess giltighet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

dikotom

A

kan endast anta två värden

26
Q

kvalitativ

A

icke numerisk, till exempel en variabel vars variabelvärden uttrycks med ord.

27
Q

kvantitativ

A

numerisk, variabel uttrycks med siffror

28
Q

diskret

A

sägs om en variabel som bara kan anta vissa värden, ex heltalsvärden

29
Q

kontinuerlig

A

sägs om en variabel som kan anta alla värden inom ett intervall

30
Q

nominaldata

ordinaldata

intervalldata

kvotdata

A

nominaldata - gäller för kvalitativa variabelvärden som endast kan gruppers. Ex: färger, kön, bostadsort

ordinaldata - gäller för variabler som är uppmätta med en ordinalskala och vilkas variabelvärden endast kan rangordnas. Ingen ekvididtans. ex längd

intervalldata - gäller för variabler som är uppmätta med en intervallskala och vilkas variabelvärden har lika stora steg, men ingen absolut nollpunkt. Ex grader celcius

kvotdata - gäller för variaber som är uppmätta med kvotskala och vilkas variabelvärden har lika stora steg, samt en absolut nollpunkt. ex: läng, vikt (inget negativt värde)

31
Q

statistisk inferens

A

slutledning

32
Q

spridningsmått

A

sammanfattande mått över hur mätvärdena är utspridda i datamängden

33
Q

variationsbredd

range

A

det högsta och det lägsta värdet i datamängden

34
Q

kvartilavstånd

A

Beräknas som differensen mellan den tredje och den första kvartilen. I en symmetrisk fördelning beskriver medianen +- kvartilavvikelsen det avstånd som täcker in 50 % av observationerna runt medianen.

35
Q

standardavvikelse

A

är på sätt och vis ett mått på observationernas genomsnittliga avstånd från medelvärdet.

Standardavvikelsen är kvadratroten ur variansen.

Stickprovsvariansen är det väntevärdesriktiga estimatet av populationsvariansen.

36
Q

frihetsgrader

A

antal frihetsgrader är det antal värden som återstår, som har frihet att variera, när man subtraherat det totala antalet restriktioner från antalet värden. En restriktion eller begränsning orsakas av ett mått som beräknats från värdena (till exempel medelvärdet)

37
Q

variationskoefficienten

A

Kallas också för den relativa spridningen, och anges ofta i procent.

38
Q

spridningsmått eller variationsmått

+ de vanligaste spridningemåtten 4x

A

de mått som beskriver spridningen

1. variationsbredd (range)

2. kvartilavvikelse

3. standardavvikelse

4. varians

Vilket spridningsmått man bör välja hänger dels samman med vilken datatyp variabelvärdena har (nominal, ordinal, intervall eller kvotdata), dels med fördelningsformen utseende.

39
Q

Variationsbredd (range)

A

range = X max - X min

Ex: För kardiolog är det av intresse att veta en individs enskilda frekvensvärde och sätta i relation till individens variationsbredd i hjärtfrekvens.

40
Q

percentiler, kvartiler och kvartilavvikelse

A

En percentil är det värde under vilket en viss procentandel av fördelningen ligger och brukar betecknas med stora P.

T.ex: medianen utgör den den 50:e percentilen, P50 och den 10:e, P10, o.s.v.

De percentiler som delar datamängden i fjärdedelar kallar kvartiler. (q1, q2, q3). Medianen P50 motsvarar q2, q1 är P25 och q3 är P75.

q1 och q3 är medianer i nedre och övre hälften

41
Q

kvartilavstånd

A

ett spridningsmått som utnyttjar kvartilerna (q3-q1)

kvartilavvikelse: (q3-q1)/2

median

42
Q

Vad handlar inferentiell statistik eller hypotesprövningar om?

A

Det handlar om att dra slutsatser om populationer utifrån observationer i stickprov.

43
Q

Vad går logiken bakom hypotesprövning ut på?

A
  1. Man ställer upp en alternativhypotes, H1, som säger att det finns ett visst samband eller skillnad eller effekt mellan två eller fler variabler.
  2. Man gör om alternativhypotesen till en nollhypotes H0, som säger att det inte finns något samband eller skillnad eller effekt mellan dessa variabler.
  3. Sedan utgår man från att nollhypotesen är sann. Man samlar in data från ett stickprov och gör beräkningar på dessa data och tar reda på om data är förenliga med nollhypotesen (ingen skillnad). Är data oförenliga med nollhypotesen förkastar man nollhypotesen och säger sig ha fått stöd för alternativhypotesen.

Ett exempel:

  1. Alternativhypotes: Jag tror att fler träningspass i veckan gör det gladare.
  2. Nollhypotes: Antal träningspass i veckan har ingen effekt på din lin upplevda lycka.
  3. Startläge: Nollhypotes = sann

Stickprovsdata för att ta reda på om data är förenliga med nollhypotesen eller oförenlig med data. Då bör vi förkasta nollhypotesen. Människor blir gladare av att träna fler gånger i veckan. Vi har stöd för alternativhypotesen.

44
Q

Vad betyder att ett resultat är signifikant?

A

det betyder att resultatet troligen inte har har uppkommit av en slump.

Om man förkastar nollhypotesen säger man att resultatet är signifikant.

45
Q

vad säger alfa?

A

säger exakt hur osannolikt resultatet ska vara för att man ska förkasta nollhypotesen. Normalt= 0.05

46
Q

Vad är samplingsfördelning?

A

Det är en frekvensfördelning över någon stickprovsegenskap, t.ex. stickprovsmedelvärden, och visar hur slumpen kan ge olika värden på stickprovsegenskapen i olika stickprov.

Samplingsfördelningar av medelvärden blir mer normalfördelade än ursprungspopulationen, får samma medelvärde som ursprungspopulationen och får en SD som är lika med pop SD delat med roten ur stickprovsstorleken (=medelfelet)

47
Q

konfidensintervall

A

vi vill uppskatta pop medelvärdet, med hjälp av den kunskap vi kan få från stickprovet genom stickprovsmedelvärdet. Vi vill estimera my med hjälp av x bar

48
Q

Vad anger ett medelfel?

A

Hur mycket värden, t.ex. medelvärden, framräknade i stickprov i genomsnitt avviker från motsvarande värde i den population som stickprovet är draget ur.

49
Q

När används one-sample t-test? Ange en konkret frågeställning som skulle kunna testas med one-sample t-test. (2p)

A

Man testar om ett visst värde kan antas vara medelvärde i den population som stickprovet har blivit draget ur. Utifrån värdena i fråga 1 skulle vi t.ex. kunna testa om det genomsnittliga systoliska blodtrycket på julafton i populationen (svenskar) skulle kunna vara lika med 120.

50
Q

När används independent samples t-test? Ange en konkret frågeställning som skulle kunna testas med ett sådant test.

A

Används när vi vill ta reda på om två populationer har samma populationsmedelvärde på en variabel.

ex: Tittar män och kvinnor i genomsnitt lika mycket på tv?

Man vill att deras konfidensintervall ska överlappa varandra. Om ej, förkasta H0

t eller z?

51
Q

När används Paired samples t-test? Ange en konkret frågeställning som skulle kunna testas med ett sådant test.

A

när man vill veta om medelvärdet på två olika variabler kan antas vara detsamma i en viss population.

Ex: Kan vi anta att vuxna svenska män kastar pil lika bra med jämfört med utan alkohol i kroppen.

z eller t?

52
Q

Vad säger noll- respektive alternativhypotesen vid paired-samples t-test? Ge ett konkret exempel.

A

Paired samples t-test

H0: medelvärdena för de två olika variblerna antas vara det samma i en viss population.

Ex: Lika bra på att kasta bil med och utan alkohol i kroppen = samma populationsmedelvärde

H1: populationsmedelvärdet är inte lika med x och y bar.

Ex: Män kastar sämre med pil sämre med alkohol i kroppen.

Svar:

Nollhypotesen: Det finns ingen skillnad mellan de två variablernas medelvärde i populationen som stickprovet representerar, den genomsnittliga skillnaden är alltså lika med noll.

Alternativhypotesen: Det finns en skillnad mellan de två variablernas medelvärde i populationen, den genomsnittliga skillnaden är alltså inte lika med noll.

Exempel: Vi har mätt graden av depression bland ett antal patienter före och efter en ny behandling X.

Nollhypotesen: Om alla patienter i populationen skulle få behandling X så skulle den genomsnittliga graden av depression vara den samma före och efter behandling, den genomsnittliga förändringen skulle alltså vara lika med noll.

Alternativhypotesen: Om alla patienter skulle få behandling X så skulle den genomsnittliga graden av depression inte vara den samma före jämfört med efter behandling, den genomsnittliga förändringen skulle alltså inte vara lika med noll.

53
Q

Ange två faktorer som minskar risken för typ 2-fel.

A

T.ex. ökad stickprovsstorlek och ökad precision i mätningarna.

54
Q

Beskriv de fyra datanivåerna (med namn, vad som karakteriserar dem och med exempel på variabler på de olika nivåerna).

A

(1) Nominaldata: Olika värden kan förekomma, men dessa kan inte rangordnas. T.ex. födelseland.
(2) Ordinaldata: Olika värden kan förekomma och dessa kan rangordnas men det råder inte ekvidistans, vilket innebär att en ökning med ett inte alltid innebär en lika stor förändring i egenskapen. T.ex. placering i mål i ett maratonlopp som ett mått på löphastighet.
(3) Intervalldata: Olika värden kan förekomma, dessa kan rangordnas och har ekvidistans. Däremot saknas en absolut nollpunkt, vilket innebär att det inte finns ett värde noll (0) som innebär avsaknad av egenskapen. T.ex. Celsius-skalan som mått på temperatur.
(4) Kvotdata: Olika värden kan förekomma, dessa kan rangordnas, har ekvidistans och det finns en absolut nollpunkt. T.ex. längd i centimeter.

55
Q

Ange två faktorer som minskar risken för typ 2-fel.

A

T.ex. ökad stickprovsstorlek och ökad precision i mätningarna.

56
Q

när använda z och när använda t-värden?

A

Z: När du ska jämföra en persons ålder med medelåldern av alla personer i mätpopulationen.

T: När du ska jämföra mäns medelålder med kvinnors medelålder.

57
Q

Visualisera uträkning för en paired samples t-test

A
58
Q

visualisera uträkning för CI

A
59
Q

visualisera uträkning för korrelation

A
60
Q

visualisera uträkning för One-sample t-test

A
61
Q

visualisera uträkning för Independent Samples t-test

A
62
Q

OP df

A

a carefully worded statement of the exact procedures (operations) used in a research study. Ex: happiness is defined as certain score on a test