Centralmått till z-värden Flashcards
Vad är statistik?
Det är ett sätt för oss människor att bearbeta (förstå och granska) numerisk data ( information som är uttryckt med siffror). Detta används som en analysmetod i den kvantitativa metodiken.
Det finns två sorters statistik, vilka är de?
- Den beskrivande (deskriptiva) statistiken. Här använder vi statistiska mått (medelvärde, frekvenser osv, för att beskriva en grupps egenskaper).
- Inferentiell statistik, vi använder statistiska jämförelser för att dra slutsatser om en populations egenskaper.
Vad är en variabel?
Det är en egenskap, beteende, känsla etc hos personer eller saker som kan variera och alltså kan ha flera olika. Ett exempel är: kön, eller sorgsen till inte alls sorgsen. Lycka: Till inte alls lycklig, till extremt lycklig. Så vi använder ordet variabel istället för att skriva vad det exakt är för något.
Det finns olika sorters variabler, vad heter dem? och vad innebär dem?
Exempel: Hur påverkar stress hälsa?
Beroende variabel: Den som påverkas. (hälsa)
Oberoende variabel: Den som vi tror orsakar förändringen. (stress)
Sedan finns det också:
Kvantitativa variabler: Det är variabler som vi kan uttrycka med siffror, exempelvis ålder, datum, årtal.
Kvalitativ variabler: Detta är variabler vi inte kan uttrycka med siffror som exempelvis, kön, etnicitet.
Skalnivåer, det finns 4 st: förklara varje
Nominalskala: Klassificerar händelser utifrån kategorisering eller namn. t.ex: kön, civilstånd: ogift eller gift.
Ordinalskala: Möjligheten att rangordna, till exempel placering i melodifestivalen, eller betyg (a,b,c,d,e och f) eller kategorivariabler: aldrig, sällan, ofta.
Intervallskala: Skillnaden mellan två enheter lika oavsett var på skalan vi befinner oss ( rangordnar men med samma intervall: skillnaden mellan 1 och 2 grader är lika stor som skillnaden mellan 10 och 11 grader.
Kvotskala: Man kan bilda en kvot av två mätvärden beroende på att kvotskalan har en naturlig nollpunkt (absolut nollpunkt: en punkt som motsvarar värdet 0 av det som mäts: frånvaron av variabeln (ex, längd och tid). 0 cm långt och 0 minuter.
Vad är Centralmått?
Ett mått som ger oss en indikation på vart det genomsnittliga värdet befinner sig i gruppen.
Det finns 3 typer av centralmått som vi använder beroende på vilket skalnivå vi använder:
Typvärde: Mått för variabler på nominalskalenivå
Median: Mått för variabler på ordinalskalenivå
Medelvärde: Mått för variabler på intervall eller kvotskalenivå
Vilket mått du väljer att använda beror alltså på hur det du avser att mäta tar sig uttryck i dina mätinstrument. De skalnivåer du kan beräkna medelvärde på kan du också beräkna typvärde och median på.
Tydliggör Typvärde:
Det mätvärde som har högst frekvens (förekommer flest gånger i en serie av mätningar, Det de finns mest av!). Typvärdet är ett enkelt sätt att ge en översiktlig bild av hur mätvärden fördelar sig över en variabel. Det kan användas på samtliga skalnivåer.
Exempelvis: Vi vill ta reda på typvärdet för antalet dagar ledighet i samband med förlossning barnets far tar ut. Vi samlar in data och finner följande:
Vi får fram en frekvenstabell, där det står antal dagar lediga vilket är: 0-12 och antal pappor vilket är 35 st uppdelade i antal dagar ledighet. Typvärdet är 6, då flest pappor tagit ledigt i 10 dagar. Man kan se detta i en tabell snabbt då det är den längsta tabellen.
Typvärde är känslig för slumpen och kan därför variera stort mellan olika stickprov. Detta då typvärden är oberoende av alla andra värden. Två värden kan förekomma lika många gånger, då blir det en bimodal fördelning. Då har vi ett problem.
Tydliggör Median:
Det mätvärde som är det mittersta värdet i en uppsättning siffror eller det värde som hälften av siffrorna ligger ovanför och hälften av siffrorna ligger nedanför. Det beräknas på två olika sätt beroende på om antalet mätvärden är udda eller jämnt. Det kan användas på samtliga skalor utom nominalskala ( det är ju inte relevant att hitta det mittersta värdet av man och kvinna osv).
Exempel:
Vid udda antal mätvärden: Det mittersta värdet:
1 2 3 4 5
Vid jämn antal värden: addera de två mittersta värdena och dividera med två:
1 2 3 4 5 6 = 3+4= 7/2= 3.5
I exemplet med papporna:
0 1 2 2 2 2 2 3 3 4 5 5 6 6 6 7 7 7 8 8 8 8 9 9 9 9 9 10 10 10 10 10 10 11 12
Då vi har ett udda antal observationer: 35st, letar vi efter mittersta värdet av observationer. Det mittersta är 8, medianen för pappors ledighet i samband med förlossning är alltså 8 dagar. Typvärdet är: 10. Medianen är 8.
Fallgropar med median:
Medianen är ett bra att använda när man vill ha en uppfattning av den “typiska” individens resultat och kan användas så länge data kan rangordnas. Det påverkas inte heller av extremvärden på samma sätt som typvärden eller medelvärdet. Men, medianen är precis som typvärdet känslig för slumpen (om än mindre än typvärdet). Vidare lider medianen av problemet att vi inte från separata gruppers median kan beräkna medianen för en större grupp som satts samma av dessa grupper.
Tydliggör medelvärde:
ett centralmått som påverkas av VARJE observation. Beräknar summan av alla observationer delat med antalet observationer
Ex med pappor förlossning:
Så man plussar ihop alla observationer: 0+1+2+2+2+2+2+3+3+4+5+5+6+6+6+7………=230
Sedan dividerar vi denna summa med antalet observationer: 230/35= 6.6
Så alla centralmått är olika: Typvärdet var 10, Median var 8 och medelvärdet var 6.6.
Det som används mest i psykologisk forskning är medelvärdet. Vi kan med hjälp av medelvärdet generalisera våra resultat. Från grupp medelvärde kan vi uttala oss om populationens medelvärde. Det är ett väntevärdesriktigt estimat, det vill säga att om vi tar medelvärdet av många olika grupper och beräknar medelvärdet av dessa värden så tar varje felaktighet ut varandra. Exempelvis: I en grupp fanns någon med väldigt hög intelligens. Om ett nytt medelvärde beräknas på båda dessa gruppers medelvärden så tar felen ut varandra.
Fallgropar med medelvärden:
Då medelvärdet använder VARJE observation vid beräkningar kan enskilda, avvikande observationer få orimligt stor inverkan på värdet. Detta gör att medelvärdet inte blir representativt för gruppen som helhet.
Vad är Spridningsmått:
Vi behöver också se spridningen i en grupp. Annars vet vi inte hur representativt ett centralmått är.
Det finns 3 typer av spridningsmått, och varje centralmått har ett spridningsmått:
Spridningen kring ett typvärde kallas variationsbredd (range).
Spridningen kring en median kallas kvartilavstånd eller kvartilavvikelse
Spridning kring ett medelvärde kallas varians eller standardavvikelse.
Den vi kommer använda mest är varians och standardavvikelser: Varians och standardavvikelse är närbesläktade. De säger liksom övriga spridningsmått något om hur mycket varje mätvärde avviker från centralmåttet.
Vad är Varians:
Variationen kring medelvärdet, variation i siffrorna. Det räknas ut genom att summera samtliga avvikelser mellan varje mätvärde och medelvärde.
Ex: Hur viktigt är det att använda hen som pronomen i undervisning på dagis (1 - 5, 1 = helt oviktigt, 5 mycket viktigt)
Data: 1 1 4 3 5 4 1 3 5
Först måste vi räkna fram ett medelvärde. så de är 1+1+4+3+5+4+1+3+5= 27 / 9 = 3
Sedan beräknar vi hur mycket varje mätvärde avviker från medelvärdet.
1-3 = -2
1-3= -2
4-3= 1
3-3= 0
5-3= 2
4-3= 1
1-3= -2
3-3= 0
5-3= 2
Sedan summerar vi dessa avvikelser och dividerar med antalet observationer för att få fram medelvärdet av avvikelsen.
Såå… man tar -2 + -2 + 1 + 0 + 2 + 1 + -2 + 0 + 2 = 0/9= 0
De sammanlagda avvikelserna från medelvärdet är ALLTID noll!
Så för att kunna beräkna ett medelvärde för avvikelser så måste varje observation kvadreras. så hur får vi fram avvikelsen: genom att kvadrera. ( betyder att man multiplicerar med sig själv) så i detta fall blir det:
-2 x -2= 4 osv osv så det blir 4+4+1+0+4+1+4+0+4= 22/9= 2,44
Så! nu har vi fått fram vår varians: 2.44
Okej så formeln för att ta reda på medelvärdet av avvikelser från medelvärdet. detta för att kunna generalisera till en större grupp människor,