Kap 1 och 2 Flashcards
Man brukar dela upp statistik i två delar, vilka?
Beskrivande statistik (descriptive statistics) - insamling av data, organisera data och presentera data. Kan vara grafiskt; ex. stapel- cirkel diagram och histogram och numeriskt; ex. medelvärde (mean), median, typvärde (mode) och standardavvikelse.
Inferentiell statistik (inferential statistics) - används för att dra slutsatser om populationsparametrar baserat på erhållen data på urvalsnivå. Kan vara hypotestest; T- test, parade test, icke-parametriska test och sambandsanalys; association och regression.
Vad innebär en population och ett sample(urval)?
En population innehåller samtliga observationer av intresse i ett statistiskt problem.
Ett sample (urval) är en delmängd ur populationen. Vi analyserar urvalsdata och beräknar urvalsvariabler för att kunna uppskatta populationen.
Vilka är de två typerna av data (sammanfattningen)?
Tvärsnittsdata: innehåller värden av en särskild karaktär av många subjekt från samma tid eller ungefär samma tid. Ex. intervjun med 20 ungdommar om vilken deras favorit radiokanal var.
Tidsseriedata: innehåller värden av ett kännetecken av ett objekt över tid.
Ex. En graf över utvecklingen för investor B aktier.
Vad innebär en kvalitativ variabel?
Kvalitativ variabel:
-en variabel som beskrivs verbalt snarare än med siffror, t.ex; profession, bilmärke, ras osv.
Vad innebär en kvantitativ variabel?
Kvantitativ variabel:
-en variabel som antar numeriska värden, dessa kan i sin tur vara antingen diskreta eller kontinuerliga.
Diskreta variabler:
-antar ett uppräkneligt antal av distinkta värden, t.ex; antal barn i en familj eller antal poäng i en basketmatch. En diskret variabel kan anta värden som inte är heltal, t.ex; 20,37 och 20,38, men den kan inte anta ett värde emellan dessa två punkter (om det inte finns utskrivet). Den kan uppta ett oändligt antal värden men dessa värden är räknebara.
Kontinuerliga variabler:
- är karaktäriserade av oändligt ouppräkneliga (överuppräkneliga) värden inom ett intervall och kan anta vilket som helst värde i ett intervall. Vikt, tid, höjd och investeringsavkastning är exempel på detta. Kontinuerliga variabler kan mätas i diskreta termer genom avrundning men vi vet fortfarande att det finns ett oändligt antal värden.
Vad innebär den Nominala skalan?
-Används för kvalitativ data och är den minst sofistikerade nivån av mätning. Om vi har nominal data kan vi bara kategorisera eller gruppera datan, t.ex; mäta hur många olika färger det finns på bilar på en parkeringsplats.
Ofta översets de kvalitativa namnen till siffror. Ex.
Blå bilar: 0 ANTAL:2
Röda: 1, ANTAL:5
Gula: 3 ANTAL:6
Vad innebär Ordinalskalan?
-Används för kvalitativ data. Variabelns olika värden kan rangordnas, men det går inte att på något meningsfullt sätt ange skillnader eller avstånd mellan värdena. Exempel är utbildning som kan anta värdena grundskola/gymnasium/högskola/forskarutbildning. Det går att ordna värdena efter stigande utbildningsnivå, men man kan inte tilldela en viss utbildning något numeriskt värde.
För en variabel mätt enligt denna skala är det möjligt att beräkna typvärde, median och percentiler, men inte aritmetiskt medelvärde.
Vad innebär Intervallskalan?
Används för kvantitativ data. I detta fall kan det man mäter tilldelas ett numeriskt värde. Ett exempel är temperatur mätt i grader Celsius. Det är här meningsfullt att ange skillnaden mellan två mätvärden. 20 grader Celsius är 10 grader varmare än 10 grader Celsius och 30 grader är ytterligare 10 grader varmare. Däremot är det inte riktigt att påstå att det en dag är dubbelt så varmt som föregående dag eftersom nollpunkten är godtycklig och det finns negativa temperaturvärden.
För variabler mätta enligt denna skala är det möjligt att beräkna både typvärde, median och aritmetiskt medelvärde.
Vad innebär Kvotskalan (ratio scale)??
Används för kvantitativ data.
Det som mäts kan beskrivas med ett kontinuerligt varierande numeriskt värde, och det finns ett entydigt sätt att definiera ett nollvärde. Därmed kan man jämföra storleken mellan de olika värdena.
Exempel är kroppslängd mätt i centimeter. En person kan vara dubbelt så lång som en annan.
Märk väl att det inte är i princip omöjligt att uppmäta negativa värden på en kvotskala. Exempelvis kan en persons samlade ekonomiska tillgångar anta ett negativt värde på en kvotskala om personens skulder överstiger dennes tillgångar.
Endast för variabler som mäts enligt en kvotskala är det meningsfullt att multiplicera och dividera mätvärdena.
Vilka är de fyra olika skalorna? NOIK
Nominala
Ordinala
Interval
Kvot (Ratio)
Vad innebär en variabel?
Inom statestik så kan man ex. undersöka människor, objekt ellerhändelser med särskild karaktär. När ett särskilt kännetecken skiftat i grad mellan olika observationer kan det kallas en variabel.
Ex. proportionen av kvinnor i en stickprovsproportion av den svenska populationen.
Vad innebär en frekvensfördelning?
En frekvensfördelning för kvalitativ data grupperar data i kategorier och visar antalet observationer som faller inom varje kategori.
Vad innebär relativ frekvensfördelning?1
Det är den procentuella andelen av helheten.
Ex. 7 regniga dagar utav 28 möjliga. 7/28= 0.25
Vad innebär en “Pie chart”?
Det är en cirkulär graf som visar hur stora segment delarna utgör av hela cirkeln
Vilka är de tre råden för att konstruera en frekvenstabell för kvantitativdata?
- Klasserna är mutally exclusive
- En typ observation faller bara inom en klass och inte flera! - Klasserna är uttömande
- Alla Typer av observationer faller inom de valda klasserna. - Antalet klasser bör vara mellan 5-20 st.
- Det får inte vara förstora eller för små frekvenser, för då går det inte att utlösa tabellerna bra! - Vi får fram vidden av varje klass genom att:
(Största värde-minsta värde)/ Antalet klasser
Viktigt är att det ska vara jämna viddar.