Statistik Flashcards
Vad menas med skalnivå?
Anger hur en variabels variabelvärden förhåller sig till varandra. Skalnivån avgör vilken typ av analyser vi kan göra med en variabel.
Ge ex på kategorisk skalnivåer.
Nominalskala = Kan ej rangordnas ex kön, yrke, favoritfilm. Ordinalskala = Kan rangordnas men ej avståndsbedömas ex utbilningsnivå, många enkätfrågor.
Ge ex på numerisk skalnivå.
Kvotskala = Kan avståndsbedömas och har absolut nollpunkt, alla antal och andelar. Intervallskala = Kan avståndsbedömas men saknar nollpunkt, temperatur i Celsius och årtal. Diskreta = kan bara vara heltal ex antal besök på socialkontoret.
Vad är en linjär regression?
När vi söker efter en linjär modell som beskriver sambandet mellan våra variabler, kallar man detta linjär regression eller regressionsanalys. Vad vi söker är alltså en linje som våra markerade punkter avviker så lite från som möjligt.
Enkel linjär regression är således där y (vertikal) är den beroende (den som påverkas) variabeln och x (horisontell) är den oberoende (den som påverkar). Interceptet med y-axeln a och lutningen b beräknas så att felet jämfört med observerade data blir så litet som möjligt.
Vad menas med logistisk regression?
logistisk regression är en matematisk metod med vilken man kan analysera mätdata.
Metoden lämpar sig bäst då man är intresserad av att undersöka om det finns ett samband mellan en responsvariabel (Y), som endast kan anta två möjliga värden, och en förklarande variabel (X).
Exempel:
Man är intresserad av att studera om det finns ett samband mellan mängden tjära i lungorna (X) och huruvida lungcancer föreligger (Y). Responsvariabeln kan endast anta de två värdena ‘Ja’ eller ‘Nej’, medan den förklarande variabeln (i princip) kan anta vilka positiva värden som helst.
Det är inte meningsfullt att försöka beskriva ett eventuellt samband mellan X och Y på en linjär form, så som är brukligt vid enkel linjär regressio
Vad menas med Centralmått?
Centralmåttet tillhör den beskrivande statistiken. Centralmåttet för en grupp beskriver var tyngdpunkten i gruppen ligger. De flesta individerna i gruppen ligger i närheten av gruppens centralmått. Det finns flera olika centralmått som alla har sitt användningsområde.
Vad menas med Spridningsmått?
Spridningsmått är inom statistik och matematisk statistik ett sammanfattande mått på utspridningen av observerade data eller en sannolikhetsfördelning. De vanligaste spridningsmåtten är standardavvikelsen, variansen och percentilavståndet (av vilket det ofta använda kvartilavståndet är ett specialfall).
Beskrivs;
Medelvärde
Median
Typvärde
Medelvärde = När vi ska beräkna medelvärdet av ett antal värden, då adderar vi första alla värdena och dividerar sedan summan vi får med antalet värden. Ett medelvärde eller medium är ett lägesmått för ett genomsnittligt värde av ett urval eller en population. I dagligt tal menar man med medelvärde normalt det aritmetiska medelvärdet. Median = Median är inom statistiken det värde för ett ordnat datamaterial som delar materialet i två lika stora delar och är ett medelvärde sådant att det överskrides lika ofta som det underskrides av värden i det givna materialet. Typvärde = Typvärde (kallas även modalvärde)[1] i ett statistiskt datamaterial är det värde som förekommer flest gånger. En mängd kan ha mer än ett typvärde, eftersom det kan finnas flera olika värden som alla är lika (och mest) förekommande. Typvärde används ofta i grupper där de olika värdena inte är tal (exempelvis bilmärken, färger, sjukdomar eller nationaliteter).
Vilka termer tillhör gruppen lägesmått?
Median, Medelvärde, Typvärde.
Vad menas med standardavvikelse?
Med standardavvikelsen menar vi ett mått på den genomsnittliga avvikelsen från medelvärdet i en serie observationsvärden. Ju större standardavvikelsen är, desto större är spridningen bland våra observationsvärden.
Vad menas med Variationsvidd?
Variationsbredd eller variationsvidd är inom statistik ett mått på skillnaden mellan det minsta och största värdet i ett givet material. Variationsbredden räknas ut genom att ta skillnaden mellan det största eller maximala och det minsta eller minimala värdet i en datatabell.
Vad menas med kvartiler?
Ett bättre sätt att beskriva spridningen runt medianen är att dela in observationsvärdena i kvartiler. Kvartil betyder fjärdedel och dessa kvartiler kommer vi fram till genom att dela in våra storlekssorterade observationsvärden i fyra lika stora grupper.
Det finns fem viktiga värden att hålla koll på när vi ska dela in våra observationsvärden i kvartiler:
Det högsta värdet och det lägsta värdet, som är de mest extrema observationsvärdena vi har åt vardera hållet i serien. Dessa motsvarar alltså det största och det minsta värdet som vi använde då vi räknade ut variationsbredden tidigare i avsnittet.
Vi behöver även känna till medianen, som ju delar våra storlekssorterade observationsvärden i två lika stora delar.
De två sista värdena som vi måste ta reda på är den nedre kvartilen, som delar de lägre 50 % av värdena i två lika stora delar, och den övre kvartilen, som delar upp de högre 50 % av värdena i två lika stora delar. Detta innebär att 25 % av våra observationsvärden kommer att vara mindre än den nedre kvartilen och 75 % av observationsvärdena kommer att vara mindre än den övre kvartilen.
Ofta betecknar man den nedre kvartilen som Q1, medianen som Q2 och den övre kvartilen som Q3.
Vad menas med kvartilavstånd?
Skillnaden mellan den övre och den nedre kvartilen kallas för kvartilavståndet. Detta motsvarar variationsbredden för de 50 % av värdena som befinner sig i mitten av serien av observationsvärden. Därigenom är kvartilavståndet ett mått på hur stor spridningen är i närheten av medianen.
Vad menas med deskriptiv statistik?
Att mäta kvantitativt, olika slags mätnivåer, hur man beskriver materialets fördelning, central och spridningsmått, tabeller och diagram.
Lådagram
Lådagram
Med hjälp av de begrepp rörande kvartiler som vi har introducerat ovan kan vi åskådliggöra spridningen runt medianen med hjälp av lådagram.
Ett lådagram ritas på en tallinje och består av en låda (rektangel) vars vänstra respektive högra sida befinner sig vid den nedre respektive den övre kvartilen. Observationsvärdenas medianvärde är även markerat med en vertikal linje inuti lådagrammet. Från lådans respektive sidor sträcker sig en vågrät linje ut till det största respektive lägsta observationsvärdet i serien.