Statistik Flashcards
Vad är deskriptiv statistik?
Kallas även beskrivande statistik. Beskriver hur verkligheten ser ut, och att beräkna mått som medelvärde, median, minimum och maximum.
Det handlar om korrelation/samvariation.
Vad är effektstorlek, och vilket typ av statistik ingår den i?
Ingår i deskriptiv statistik. Ett mått på hur stor skillnaden är mellan två grupper, hur mycket de skiljer sig och överlappar.
Vad är analytisk statistik?
Även kallad inferentiell statistik. Handlar om att beräkna sannolikheten av att resultat är verkligt eller en slump. Signifikansvärde, p-värde och konfidensintervall ingår i denna typ.
Vad är statistisk felmarginal?
Ett resultat kan tänkas vara ett medelvärde på 25,5 % +/- 5,5 %. Detta betyder att man med 95 % säkerhet kan säga att resultatet bör vara inom ramen av 11 %. (5,5 * 2). Så resultatet i slutändan kan antingen vara 20 % eller 31 %.
Hur minimerar man mätfel?
Genom att göra en powerberäkning. Ett eventuellt mätfel minskar ju fler deltagare man har i en studie.
Vad är en kvotskala?
Den högsta skalnivån, kvantitativ.
Kännetecknas av en nollpunkt, och alla skalsteg har samma avstånd.
T.ex. kan man mäta stämbandslängd i millimeter, och man kan säga att någon har dubbelt så långa stämband.
Vad är en intervallskala?
Nästhögsta skalnivån, kvantitativ.
Man mäter lika avstånd. Alla skalsteg har samma avstånd, men nollpunkten är godtycklig. T.ex. celsius-skalan.
Vad är en ordinalskala?
Nästägsta skalnivån, kvalitativ.
Man kan ordna upp i en ordning, men det är oklart om det är lika långt avstånd mellan varje skalsteg.
Kan t.ex. användas i skattningsskalor.
Vad är en nominalskala?
Lägsta skalnivån, kvalitativ, kategoriskala. Egentligen ingen riktig skala.
T.ex. kön, språk, yrken
Vilka skalor är kvalitativa eller behandlar kategorisk data?
Nominal- och ordinalskalorna.
Vilka skalor är kvantitativa?
Intervall- och kvotskalorna.
Hur kan binära variabler se ut?
0 / 1
Ja / Nej
Positiv / Negativ
Behandling / Ej behandling
Frisk / Sjuk
Vad ingår i genomsnittsmått?
Median, medelvärde och typvärde.
Hur beräknar man medianen?
Rangordnas från minst till störst. Talet i mitten av rangordningen är medianen. Om man har ett jämnt antal siffror tar man de två som är i mitten och delar dessa på 2.
Hur beräknar man medelvärdet?
Man tar alla siffror och delar dessa på, exempelvis, antalet deltagare
Vad är parametriska metoder?
Metod för att räkna ut P-värde. Parametriska metoder används när man räknar med exakta siffror, och har data med kvotskala eller intervallskala. Baserat på medelvärdeberäkningar.
Vad skiljer icke-parametriska metoder från parametriska?
Icke-parametriska metoder är mer stabila, och det är lättare att inte få ett “galet” resultat.
Parametriska metoder är statistiskt starkare, och det är lättare att få statistisk signifikans.
Vad är, och hur skapar man ett index?
I ett index kan man lägga ihop flera variabler, man kan säga att ett index är en variabel som sammanfattar ett antal variabler.
Man kan bedöma röstförmågan med ett flertal tester. Man slår sedan samman poängen/siffrorna, vilket ger en indikation på röstförmågan.
Vad visar en variationsvidd?
Variationsvidden visar avståndet från det lägsta till högsta värdet i en normalfördelningskurva.
Vad är ett kvartilavstånd?
Avståndet mellan den övre och undre kvartilen.
Vad är den undre kvartilen?
Den 25:e percentilen, vilket innebär att 25 % har lägre värden.
Vad är den övre kvartilen?
Den 75:e percentilen, vilket innebär att 75 % har lägre värden.
Var och vad är medianen på en normalfördelningskurva?
I mitten. Det är den 50:e percentilen, vilket innebär att 50 % har lägre värden.
Vad är typvärde?
Det värde som flest har.
Vad är en box-and-whiskers-plot? Vad innehåller boxen?
En förenklad visualisering av normalfördelningskurva. “Boxen” innehåller avstånd mellan nedre och övre kvartilen. “Whiskers” är svansarna på normalfördelningskurvan, avståndet däremellan visar variationsvidden.
Vad är ett histogram?
Ett diagram för att visa
fördelning/spridning (distribution) hos en variabel. I ett histogram sitter staplarna ihop, visar frekvens.
Vad är skevhet och vilken typ av skevhet finns?
Skevhet är snedfördelad data i en normalfördelningskurva. Positiv skevhet = svansen sluttar mot vänster. (Ser ut som en rutschkana.)
Negativ skevhet = svansen sluttar mot höger.
Vad är bimodal fördelning?
Gruppen är sammansatt av två populationer,
en större och en mindre. Två “kamelpucklar” på fördelningskurvan.
Vad är variationskoefficienten?
Det är ett standardiserat mått på spridningen hos en variabel. Uttrycks som standardavvikelsen i procent av medelvärdet. Variationskoefficenten gör standardavvikelser på olika mätningar jämförbara.
Hur räknas variationskoefficienten ut?
100 * Standardavvikelsen / Medelvärdet
Vad är värdesiffror?
Siffror som har ett värde, ex 0,1001 har fyra värdesiffror, men 0,0001 har bara en värdesiffra.
Vad är ett stapeldiagram/bar chart?
Ett diagram som visar värdet för olika grupper och subgrupper inom en grupp.
Vad är sannolikhetslära?
En del av statistiken som handlar om hur sannolikt olika saker är.
Vad får man om man kombinerar sannolikhetslära och statistik?
Inferentiell statistik, som handlar om att dra slutsatser från ett stickprov.
Beskriv formellt sannolikheten för att singla slant
P(gubbe) = 0,5
P(krona) = 0,5
P(summa) = P(gubbe) + P(kronor) = 1
Vad är sannolikheten att få två ettor på rad i ett tärningskast?
Sannolikheten att få en etta är P(1) = 1/6 = 0,167 = 16,7%
P(1+1) = 0,167 * 0,167 = 0,0278 = 2,78 %
Vad är binomial fördelning?
Normalfördelning fast med staplar. Binomial betyder “två namn”, dvs det finns två möjliga utfall som med slantsinglingar. Exempelvis en kurva som visar fördelningen av utfall av fyra slantsinglingar flera gånger, med sannolikheten för de olika kombinationernas resultat.
Hur många av alla utfall hamnar inom +-3 standardavvikelse?
99,7%
Vad är z-skalan?
Det är den enklaste standardskalan för att ta fram standardpoäng. Genom att räkna ut z-poäng kan man jämföra resultat på helt olika mätskalor och frågeformulär.
Hur räknar man ut z-poäng?
Z = Resultat - medelvärdet / standardavvikelsen
Vad är index?
Ett sammanslaget mått på flera variabler, t.ex flera olika tester.