Fleralternativsfrågor Flashcards by Ludvig Berggren

VILKET CENTRALMÅTT?
Det här centralmåttet är det värde som förekommer flest gånger i en uppsättning data.
Det är ett centralmått som används för att beskriva det mest frekventa värdet i en datamängd.

TILL EXEMPEL:

För data 3, 5, 7, 7, 9, 10 är 7 centralmåttet, eftersom det förekommer två gånger, mer än något annat värde.

För data 2, 4, 6, 8 finns inget centralmått av det här slaget, eftersom alla värden förekommer lika ofta (en gång vardera).

TYPVÄRDE

How well did you know this?

Not at all

Perfectly

VILKET CENTRALMÅTT är mest meningsfullt att använda för variabeln etnicitet?

A) Typvärde
B) Medianen
C) Medelvärde
D) Inget alls eftersom centralmått inte går att använda på variabler på den skalan

TYPVÄRDE
(etnicitet = nominalskala)

How well did you know this?

Not at all

Perfectly

Varför är typvärde det mest meningsfulla att använda för variabeln etnicitet?

Etnicitet representeras som olika kategorier, och eftersom dessa kategorier inte har någon inbördes ordning eller kvantitativ betydelse, är det inte meningsfullt att använda medelvärde eller median.

Typvärdet anger den mest frekventa etniciteten i en datamängd, vilket ger
en bra sammanfattning av vilken etnicitet som förekommer mest i gruppen.

How well did you know this?

Not at all

Perfectly

VILKET CENTRALMÅTT?
Det här centralmåttet är det värde som delar en uppsättning data i två lika stora delar, där hälften av värdena är mindre och hälften är större.

TILL EXEMPEL:
För data 1, 3, 5, 7, 9: Centralmåttet är 5.

För data 1, 3, 5, 7, 9, 11: Centralmåttet är (5 + 7) / 2 = 6

Medianen

How well did you know this?

Not at all

Perfectly

Vilket centralmått är mest meningsfullt att använda för variabeln inkomst/lön?

A) Typvärde
B) Medianen
C) Medelvärde
D) Inget alls eftersom centralmått inte går att använda på variabler på den skalan

Medianen

Medianen är bättre än medelvärdet för att mäta inkomst eller lön eftersom den inte påverkas av extrema värden, som mycket höga löner, och ger en mer rättvis bild av vad en “typisk” inkomst är i en befolkning.

How well did you know this?

Not at all

Perfectly

Varför är medianen det mest meningsfulla att använda för variabeln inkomst/lön?

Medianen är det mest meningsfulla måttet för inkomst/lön eftersom den inte påverkas av extremt höga eller låga värden. Inkomstfördelningar är
ofta snedvridna med några få mycket höga löner, vilket gör att medelvärdet kan bli missvisande. Medianen visar istället den typiska lönen för majoriteten av befolkningen och ger en mer rättvisande bild av den “vanliga” inkomsten.

How well did you know this?

Not at all

Perfectly

Vilket centralmått?

Det är ett centralmått som beräknas genom att summera alla värden i en uppsättning data och sedan dela summan med antalet värden. Det ger en genomsnittlig värde för datamängden.
Till exempel: 4+7+5+3+7+4 (summan) / 6 (antalet) = 5 (centralmåttet)

Medelvärde

How well did you know this?

Not at all

Perfectly

Vilket centralmått är mest meningsfullt att använda för variabeln arbetstimmar?

A) Typvärde
B) Medianen
C) Medelvärde
D) Inget alls eftersom centralmått inte går att använda på variabler på den skalan

Medelvärde

How well did you know this?

Not at all

Perfectly

Varför är medelvärde det mest meningsfulla att använda för variabeln arbetstimmar?

Medelvärdet är meningsfullt för arbetstimmar eftersom det ger en rättvisande
bild av den genomsnittliga arbetstiden för en grupp när timmarna är relativt lika och inte innehåller extrema variationer. Det är användbart för att planera resurser och förstå arbetsbelastningen på en övergripande nivå.

How well did you know this?

Not at all

Perfectly

VILKEN SKALNIVÅ ÄR RELEVANT?
Denna skalnivå används för att kategorisera data utan någon ordning eller rangordning. Variablerna är bara olika, och det går inte att säga att en kategori är större eller bättre än en annan.

TILL EXEMPEL:
Kön (man, kvinna), färger (röd, blå, grön)
Nationalitet (svensk, amerikansk, indisk)

EGENSKAPER: Kategorisering utan ordning. Ingen meningsfull matematisk operation
(t.ex. addition eller subtraktion).

Nominalskala

How well did you know this?

Not at all

Perfectly

VILKEN SKALNIVÅ ÄR RELEVANT?
Denna skalnivå används för att kategorisera data där det finns en naturlig ordning eller rangordning mellan kategorierna, men avstånden mellan dem är inte nödvändigtvis lika eller mätbara.

TILL EXEMPEL:
Betyg (A, B, C, D), utbildningsnivå (grundskola, gymnasium, universitet),
kundnöjdhet (mycket missnöjd, missnöjd, neutral, nöjd, mycket nöjd).

EGENSKAPER: Rangordning finns (men inte exakt avstånd mellan nivåerna). Man kan säga att
en kategori är högre eller lägre än en annan, men inte exakt hur mycket.

Ordinalskala

How well did you know this?

Not at all

Perfectly

VILKEN SKALNIVÅ ÄR RELEVANT?
Denna skalnivå är en numerisk skala där avstånden mellan mätvärdena är lika stora, men det finns inte ett absolut nollpunkt. Det innebär att det går att mäta skillnader, men inte förhållanden (t.ex. dubbelt så mycket).

TILL EXEMPEL:
Temperatur i Celsius eller Fahrenheit (där 0 inte betyder “ingen temperatur”),
kalenderår (t.ex. 2020, 2021).

EGENSKAPER:
Likavstånd mellan mätvärdena.
Ingen absolut nollpunkt (t.ex. 0 grader Celsius är inte “ingen temperatur”).
Addition och subtraktion går bra, men multiplikation och division ger inte meningsfulla resultat.

Intervallskala

How well did you know this?

Not at all

Perfectly

I en undersökning av sambandet mellan inkomst och antalet högskolepoäng fann forskarna ett positivt samband. Vad innebär detta? (1p)

Välj ett alternativ:

A)
Att ett lågt värde i den ena variabeln sammanfaller med ett lågt värde i den
andra variabeln.

B)
Att högskolepoäng inte ger någon ledtråd till om lönen är hög eller låg.

C)
Att ett högt värde av den ena variabeln sammanfaller med ett lågt värde i den andra variabeln.

A.
Att ett lågt värde i den ena variabeln sammanfaller med ett lågt värde i den
andra variabeln

How well did you know this?

Not at all

Perfectly

Vad är sant gällande statistisk inferens?

Statistisk inferens betyder att vi kan dra slutsatser om en population från ett urval.

How well did you know this?

Not at all

Perfectly

Vad är sant när det gäller normalfördelningen?

Normalfördelningens utseende bestäms helt av medelvärdet och
standardavvikelsen.

How well did you know this?

Not at all

Perfectly

I det följande är två påstående om olika sannolikhetsurval riktiga, medan ett är felaktigt. Vilket är det felaktiga?

A)
OSU är den mest grundläggande formen av sannolikhetsurval.

B)
I ett klusterurval utgörs den primära samlingsenheten inte av populationens enheter utan av grupper av sådana enheter.

C)
Stickprovet väljs systematiskt så att det avspeglar populationen.

C.
Stickprovet väljs systematiskt så att det avspeglar populationen.

How well did you know this?

Not at all

Perfectly

I det följande är två påstående om statistisk inferens felaktiga, medan ett är riktigt. Vilket är det riktiga?

A)
Statistisk inferens betyder att vi utifrån ett stickprov kan uttala oss om populationen.

B)
Vi uppnå statistisk inferens när produktmomentkorrelationskoefficienten är < 0,05.

C)
Inferens är ett svårare uttryck för att beskriva den variation som finns mellan två medelvärden.

A.
Statistisk inferens betyder att vi utifrån ett stickprov kan uttala oss om populationen.

How well did you know this?

Not at all

Perfectly

Vad är två sanna påstående om normalfördelningen?

Normalfördelningen används för att dra slutsatser om en population utifrån ett stickprov

Normalfördelningens utseende bestäms av medelvärdet och
standardavvikelsen.

How well did you know this?

Not at all

Perfectly

Vad är ett sant påstående om kausalitet?

En förändring i X måste gå tidsmässigt före en förändring i Y.

Forskaren Shirin Sariaslan vill undersöka om social status kan förklara skillnader i ohälsa hos förvärvsarbetande svenskar i åldrarna 18-75 år. Hon vill även kontrollera för könets, utbildningens och inkomstens effekt på ohälsa.

Den beroende variabeln Ohälsa mäts med antal sjukskrivningsdagar under de senaste tre åren.

De oberoende variablerna mäts på följande sätt:
Social status: tre kategorier (låg=0, medelhög=1 och hög=2) som har
skapats på grundval av respondentens yrke.
Kön: 0=man, 1=kvinna
Utbildning: antal år som respondenten har utbildat sig.
Inkomst: inkomst i kronor per månad före skatt

På vilka skalnivåer befinner sig variablerna; ohälsa, Social status, utbildning och inkomst?

Och VARFÖR?

Ohälsa = kvot
Social status = ordinal
Utbildning = kvot
Inkomst = kvot

Variabeln Kön är en kategorisk variabel. Denna typ av variabel kallas också för något annat eftersom den kan anta två variabelvärden, vad?

Variabeln Kön är en dichotom (binär) variabel, eftersom den kan anta två värden, t.ex. “man” eller “kvinna”. En dichotom variabel är en typ av kategorisk variabel som bara har två möjliga värden.

Det enklaste i detta sammanhang vore om Shirin kunde genomföra en multipel
regressionsanalys med nämnda variabler, är det möjligt? Motivera ditt svar!

Ja, det är möjligt eftersom vi har två eller fler oberoende variabler. Beroende kvot + social status måste dummykodas.

Vad betyder konfidensintervall och ge ett exempel.

Ett konfidensintervall är ett intervall som används för att uppskatta ett
okänt värde (till exempel ett medelvärde) med en viss säkerhet. Det anger det
intervall där det sanna värdet förväntas ligga, baserat på data från ett urval.

Exempel: Om ett medelvärde för en grupp är 50, med ett 95%, konfidensintervall på 48-52, betyder det att vi är 95% säkra på att det sanna medelvärdet för hela populationen ligger
mellan 48 och 52.

Förklara kortfattat statistisk signifikans ge ett exempel.

Statistisk signifikans innebär att resultatet från en statistisk analys inte beror på slumpen, utan troligen reflekterar ett verkligt mönster eller effekt. TILL EXEMPEL: Om ett läkemedel testas och p-värdet är 0,03, innebär det att det finns en 3% chans att resultatet beror på slumpen. Eftersom p-värdet är mindre än 0,05, anses resultatet statistiskt signifikant och läkemedlet tros ha en verklig effekt.

Förklara kortfattat standardavvikelse och ge ett exempel.

Standardavvikelse är ett mått på hur spridda eller varierade värdena i en datauppsättning är från medelvärdet. TILL EXEMPEL: Om vi har testresultaten 85, 90, 95 och 100, så är medelvärdet 92,5. Standardavvikelsen mäter hur mycket dessa resultat avviker från 92,5. Ju högre standardavvikelse, desto större spridning i data.

På vilken skalnivå ligger variabeln antal timmar läst metodlitteratur?

Kvotskalenivå

På vilken skalnivå ligger variabeln lärares skattning av studenters intresse för kvantitativ metod, mätt med en skala från 1=mycket lågt till 5=mycket högt?

Ordinalskalenivå

På vilken skalnivå ligger variabeln statistiska metoder (korstabell, regressionsanalys, medelvärdestest)?

Nominalskalenivå

Vad är ett korrekt påstående om skalnivåer och centralmått?

För variabler på intervall- och kvotskalenivå kan alla typer av centralmått beräknas.

Nedan följer ett antal påståenden. Det räcker att skriva den rätta bokstaven! A) I det följande är två påstående om olika sannolikhetsurval riktiga, medan ett är felaktigt. Vilket är det felaktiga? A) OSU är den mest grundläggande formen av sannolikhetsurval. B) Sannolikhetsurvalet är representativt för urvalsramen. C) Undersökningsenheterna ska ha en känd sannolikhet att komma med i urvalet

C. Undersökningsenheterna ska ha en känd sannolikhet att komma med i urvalet.

Vad är ett korrekt påstående om statistisk inferens?

Statistisk inferens betyder att vi utifrån ett stickprov kan uttala oss om populationen

Vad är två korrekta påståenden om normalfördelningen?

Normalfördelningen har lika många observationer på varje sida om medelvärdet Normalfördelningens utseende bestäms av medelvärdet och standardavvikelsen

Vad är ett korrekt påstående om kausalitet?

En förändring i X måste gå tidsmässigt före en förändring i Y.

På vilken skalnivå ligger variabeln antal studietimmar?

Kvotskalenivå

På vilken skalnivå ligger variabeln studenters egen skattning av kunskap i Sociologisk kvantitativ metod, mätt med en skala från 1=mycket dålig till 5=mycket god

Ordinalskalenivå

På vilken skalnivå ligger variabeln yrkeskategori (svetsare, jurist, sociolog)?

Nominalskalenivå

Vad är korrekt påstående om skalnivåer och centralmått?

För variabler på intervall- och kvotskalenivå kan alla typer av centralmått beräknas.

Vad är två sanna påstående om olika sannolikhetsurval?

OSU är den mest grundläggande formen av sannolikhetsurval I ett klusterurval utgörs den primära samplingsenheten inte av populationens enheter utan av grupper av sådana enheter

Vad är sant påstående om statistisk inferens?

Statistisk inferens betyder att vi utifrån ett stickprov kan uttala oss om populationen.

Vad är ett sant påstående om normalfördelning?

Normalfördelningens utseende bestäms av medelvärdet och standardavvikelsen.

SANT eller FALSKT om kausalitet? Kausalitet är ett annat ord för korrelation.

FALSKT

Variabeln Kön är en kategorisk variabel. Denna typ av variabel kallas också för något annat då den bara kan anta två variabelvärden - vad?

Variabeln Kön kallas också för en dichotom variabel eller binär variabel, eftersom den bara kan anta två möjliga värden, till exempel "man" och "kvinna".

Sociologen Alex har tagit del av tidigare forskning som visar att skillnaderna i inkomst ökar i Sverige och vill därför undersöka om social status kan förklara skillnader i inkomst bland ett slumpmässigt urval av Sverige befolkning. Det är sedan tidigare känt att inkomst tenderar att skilja sig mellan kvinnor och män varför hen även vill kontrollera för könets effekt på inkomsten. Alex kan dock inte bortse från att utbildning troligen har en effekt på inkomsten och kontrollerar även för detta. - Den beroende variabeln inkomst mäts med respondentens bruttoinkomst i kronor per år - De oberoende variablerna mäts på följande sätt: Social status: tre kategorier (0=låg, 1=mellan, 2=hög) baserat på grundval av respondentens yrke. Kön: 0=man, 1=kvinna Utbildning: antal år som respondenten har utbildat sig B) Det enklast i detta sammanhang vore om Alex kunde genomföra en multipel regressionsanalys med nämnda variabler. Beskriv för Alex om det är möjligt och hur hen i så fall ska gå tillväga! (2p)

Det är möjligt eftersom den beroende variabeln ligger på kvotskalenivå (är kvantitativ) och det finns flera oberoende variabler. Där skulle dock Alex behöva koda om variabeln ‘’social status’’ till en dummyvariabel. Eftersom den nu har tre kategorier räcker det att göra två dummyvariabler ex sshög. (dvs koda alla 2:or till 1 och resterande till 0) och ssmellan (dvs fortsätta använda 1 för alla 1:or och koda resterande som 0). Då använder Alex lag social status som referenskategori.

Vad är ett sant påstående om att uttala sig om kausalitet mellan två variabler?

Att man uttalar sig om vilken av variablerna som påverkar den andra.

Hur definieras typvärdet?

Typvärde är det värde som förekommer flest gånger i en datamängd. Det är alltså det vanligaste värdet i en uppsättning data.