Förklara Flashcards
Vad har man statestik till, vad fyller det för funktion?
Statestik används för att samla, analysera, tolka och presentera data på ett meningsfullt sätt. Genom statistiska metoder kan man förstå samband, identifiera trender och göra prognoser. Statestik fyller en viktig funktion inom många områden såsom vetenskap, samhälle, företagande och medicin genom att stödja beslutsdattande och valodering av hypoteser.
Vad är en variabel? Ge ett konkret exempel.
En variabel är en egenskap eller ett attribut som kan anta olika värden. Ett exempel är “ålder” där individer i en studie kan ha olika åldersvärden.
Beskriv de fyra datanivåerna (med namn, vad som karakteriserar dem och med exempel på variabler på de olika nivåerna).
1) Nominalnivå. Data delas in i kategorier utan inbördes ordning (t.ex kön och färg)
2) Ordinalnivå. Data har en ordning men avstånden mellan värdena är inte meningsfulla (t.ex A, B, C)
3) Intervallnivå. Data har både en ordning och meningsfulla avstånd mellan värden, men ingen absolut nollpunkt (t.ex celsius)
4) Kvotnivå. Data har ordning, meningsfulla avstånd och en absolut nollpunkt. (tex vikt och längd)
Beskriv de tre olika typer av centralmått (vad de heter och vad de anger)
1) Medelvärde. Genomsnittet av alla värden, används för att beskriva ett “typiskt” värde.
2) Median. Det mittersta värdet när data är sorterad, används för att beskriva centralvärden i en fördelning.
3) Typvärde. Det mest förekommande värdet, användsbart när man vill veta vilket värde som är vanligast.
Beskriv tre olika typer av spridningsmått (vad de heter och vad de anger)
1) Variationsbredd. Skillnaden mellan det högsta och det lägsta värdet, beskriver dataområdets bredd.
2) Standardavvikelse. Hur mycket observationerna varierar kring medelvärdet, ger en bild av spridningen.
3) Varians. Kvadraten på standardavvikelsen, visar också spridningen men tar större avstånd till extremvärden.
Vad anger Z-poängen?
Z-poängen anger hur många standardavvikelser ett specifikt värde ligger från medelvärdet i en normalfördelad datamängd.
Ange två karaktärsdrag för s.k. Z-transformerade variabler.
Z-transformerade variabler har ett medelvärde på 0
Z-transformerade variabler har en standardavvikelse på 1.
Vad anger ett korrelationsvärde?
Korrelationsvärdet anger styrkan och riktningen av det linjära sambandet mellan två variabler där värdena nära +1 eller -1 indikerar starka samband, och värden nära 0 indikerar svaga eller inga samband
Vilka värden kan en korrelation anta?
En korrelation kan anta värden mellan -1 och +1.
Vad är ett s.k. “starkt samband”?
Ett starkt samband innebär en hög korrelation (tex runt +0,7 eller högre), där förändringar i den ena variabeln ofta följs av förändringar i den andra variabeln.
Argumentera, gärna med exempel, för det korrekta i påståendet “korrelation bevisar ej kausalitet”.
Koorelation visar bara att två variabler samvarierar, men det betyder inte att den ena variabeln orsakar den andra. Till exempel, att glassförsäljning och drunkningsolyckor är korrelerade betyder inte att glassätande orsakar drunkningsolyckor; båda ökar istället när temperaturen stiger.
Vad heter den vanligaste korrelationskoefficenten?
Den vanligaste korrelationskoefficenten är pearsons korrelationskoefficient.
Hur tenderar “medelvärdet för stickprovsmedelvärden” att förhålla sig till “medelvärden för enskilda värden”?
Medelvärdet för stickprovsmedelvärden tenderar att vara detsamma som medelvärdet för enskilda värden i populationen.
Hur tenderar “standardavvikelsen för stickprovsmedelvärden” att förhålla sig till “standardavvikelsen för enskilda värden”? Vad kallas “standardavvikelsen för stickprovsmedelvärden”?
Standardavvikelsen för stickprovsmedelvärden är mindre än standardavvikelsen för enskilda värden och minskar med ökande stickprovsstolek. Detta kallas för standardfel.
Varför används t-testet oftare i praktiken än “Z-testet”?
T-testet används oftare eftersom det fungerar bättre när stickprovsstolekten är liten eller när standardavvikelsen är okänd, medan Z-testet kräver en större stickprovsstolek och känd populationsstandardavvikelse.