Föreläsning 1 Flashcards
Vad är deskriptiv statistik?
Beskrivande statistik
- Får fram tydliga siffror
- Medelvärde, typvärde, median
- Beskriver stickprovets data
- Redovisning av variablerna (grafiskt)
Infrentiell statistik
Gör antaganden (inferences) av vår data
- P-värde, statistiska test och konfidensintervall
- Slutsatser om stickprovet
- Är det statistisk signifikant?
- Försöker använda stickprovet för att dra slutsatser om populationen
Parameter
Det SANNA värdet i en mätbar egenskap hos en population
- Median, typvärde, standardavvikelse, medelvärde
- Exempel: om vi vill mäta hur mycket folk tjänar i en viss stad, så är medelvärdet för inkomst vår parameter. Alltså det sanna värdet i vår undersökning.
- Numeriska mått eller egenskaper som beskriver olika aspekter av populationen.
Lättare att få fram estimat än parameter
Estimat
Medelvärdet för våra deltagare
- Vad vi tror det sanna värdet är baserat på den population vi undersöker
- En gissning av hur vi tror det ser ut i befolkningen, estimate
- Estimatet används som en uppskattning eller gissning om vad parametern kan vara för hela populationen.
Population
Alla deltagare vi är intresserade av, omöjligt att undersöka alla. Från populationen tas stickprov för att dra slutsatser om det vi vill undersöka.
Vad är ett centralmått? Ge några exempel på centralmått?
Statistiska mått som representerar “centrum” eller det typiska värdet i en datamängd
- Medelvärde, typvärde, median
Lägsta nivån
Nominalskala
Endast grupper!
Ingen grupp är “bättre” än den andra
Äpplen och päron
Ordinalskala
Nominalskala + rangordning
- Vilken plats folk kom på i ett marathon
- Går ej att säga hur mycket bättre ettan är än tvåan
Vad menas med “skalnivå, forskningsfrågan och om antaganten bakom olika statistiska test är uppfyllda?”
- Skalnivå är viktig för att avgöra vilka statistiska metoder och analyser som är mest lämpliga för att besvara forskningsfrågan
- Det viktigt att överväga skalnivån när man planerar en statistisk analys, eftersom det påverkar valet av metoder och tolkningen av resultaten. Att använda rätt statistiskt verktyg för datatypen och forskningsfrågan är avgörande för att få tillförlitliga och meningsfulla resultat
Steg 1
Klargör syftet med den statistiska analysen
- Vill vi endast bekskriva stickprovet (deskriptiv)?
- ^.Eller även försöka dra slutsatser om vårt stickprov (infrentiell)
- Vilken typ av statistik är vi intresserade av?: Samband mellan variabler, skillnader mellan grupper
Varför är det bra att göra en redovisning av sin statistik?
- Går att se uppenbara mätfel
- Kan övgöra om antaganden för olika test är uppfyllda
Vilken skalnivå krävs om man vill göra en “meningsfull summering”?
Intervallskala
- Går ej att summera ex.v. ordinalskala
- Kan ej lägga ihop värden under intervallskala
- Hence ej en meningsfull summering
Om medelvärdet är symmetriskt så kommer vilka två värden vara ungefär samma?
Medelvärde och median
- Om de vanligaste värdena är i mitten kommer även typvärdet vara desamma
Om fördelningen är skev så är median, medelvärde och typvärde ofta…
..Ganska olika!
- Kan vara missvisande!
Vad är en infrentiell slutsats?
En slutsats där man försöker dra slutsatser om en hel population baserat på ett stickprov
Vad är variationsbredd?
Skillnaden mellan högsta och lägsta värdet.
Lägsta:1, högsta:5 VB: 4
Vad är en percentil?
En statistisk term som beskriver där ett visst värde ligger i förhållande till resten av datamängden
- Brukar betecknas med P
- Medianen utgör den 50e percentilen (P50)
Vad är en frihetsgrad?
Antalet frihetsgrader är det antal värden som återstår, som har “frihet att variera”, när man subtraherat det totala antalet restriktioner från antalet värden. En restriktion eller begränsning orsakas av ett mått som beräknats från värdena (till exempel medelvärdet)
- Ju fler frihetsgrader, desto mer flexibilitet i beräkningarna
Stulet direkt ur boken
Vad är en kvartil?
En kvart av värdena
* Q1: 25%
* Q2: 50%
* Q3: 75%
* Q4: 100%
Standardavvikelse
Hur spridda/koncentrerade dina data är runt medelvärdet
Vad är ett z-värde?
Ett mått på hur många standardavvikelser från medelvärdet som en observation är
Frekvensgraf
Barplot
Sånadär stolpar typ där varje stolpe är ett värde
* Observationen för varje enskilt värde redovisat i varsin stapel
* Ofta begränsat antal värde
* Bra för att se skillnad mellan staplarna - tydlighet
Lådagram
Median och kvartiler/percentiler
* 50% av värdena är mellan Q1 och Q3 - interquartal range
* Interquartal range: hur stor skillnad det är mellan övre respektive undre delen av lådan, mellan kvartil 1-3, det som är innanför själva lådan är the interquartal range
Scatterplott
- Värden på två variabler samtidigt - för att se samband
- Sätter ut alla variabler
- Bra för korrelation samt regression
- Ser sambandet linjärt ut? Alla värden är varsin punkt!
Vad innebär positiv korrelation?
Att höga värden på x hänger samman med höga värden på y
Vad innebär negativ korrelation
Att låga värden på x korrelerar med låga värden på y
Pearsons korrelationskoefficent
Styrkan och riktningen av ett linjärt samband mellan två variabler
Spearmans rangordningskorrelationskoefficient (ρ)
Mäter styrkan och riktningen av ett linjärt samband mellan två variabler
- Till skillnad från Pearsons kan Spearmans även mäta icke-linjära samband
- Användbar när data inte är normalfördelad
Vad är regression?
Används för att predicera värdet på en variabel y utifrån variabeln x
- Hur högt blodtryck (y) vi förväntar oss att en person med en viss nivå av stress (x) har
Vad är intercept i en regressionsanalys?
Det värde där linjen korsar y-axeln (y går uppåt)