kryssfrågor Flashcards
Välj ett eller flera alternativ:
Linjär regression ska enbart användas när feltermen är normalfördelad
Linjär regression ska enbart användas när sambandet mellan X och Y är linjärt.
Linjär regression kan användas för deskriptiva, prediktiva och kausala frågeställningar
Linjär regression kan användas när effekten av en oberoende variabel beror på värdet på en
annan oberoende variabel
Linjär regression kan användas för deskriptiva, prediktiva och kausala frågeställningar
Linjär regression kan användas när effekten av en oberoende variabel beror på värdet på en
annan oberoende variabel
Välj ett eller flera alternativ:
Om två oberoende variabler är starkt korrelerade med varandra så innebär det att det finns multikollinearitet
Homoskedasticitet innebär att variansen på feltermen är samma oavsett värdena på de
oberoende variablerna
Det finns metoder som kan hantera fall när feltermen är heteroskedastisk
Ett prediktionsintervall för ett visst värde på X kommer alltid att vara större än ett
konfidensintervall för den betingade väntevärdesfunktionen för samma värde på X
Om två oberoende variabler är starkt korrelerade med varandra så innebär det att det finns multikollinearitet
Homoskedasticitet innebär att variansen på feltermen är samma oavsett värdena på de
oberoende variablerna
Det finns metoder som kan hantera fall när feltermen är heteroskedastisk
Ett prediktionsintervall för ett visst värde på X kommer alltid att vara större än ett
konfidensintervall för den betingade väntevärdesfunktionen för samma värde på X
Välj ett eller flera alternativ:
Exponentiell utjämning kan enbart användas när en tidsserie växer exponentiellt
Enkel exponentiell utjämning används när det enbart finns trend men inte cyklisk variation i
data
Det är alltid bättre att använda trippel exponentiell utjämning istället för enkel och dubbel
exponentiell utjämning
Dubbel exponentiell utjämning används när det finns trend i data
Dubbel exponentiell utjämning används när det finns trend i data
Välj ett eller flera alternativ:
Överanpassning innebär att modellen alltid kommer att anpassa sig bättre till träningsdata
ju mer komplex modellen är
Det faktum att förklaringsgraden alltid ökar när fler variabler läggs till i modellen är ett
exempel på överanpassning
Problemet med överanpassning är i huvudsak relevant för kausala frågeställningar och
mindre viktigt för prediktiva och deskriptiva frågeställningar
Överanpassning innebär att modellen alltid kommer att anpassa sig bättre till testdata ju
mer komplex modellen är
Överanpassning innebär att modellen alltid kommer att anpassa sig bättre till träningsdata
ju mer komplex modellen är
Det faktum att förklaringsgraden alltid ökar när fler variabler läggs till i modellen är ett
exempel på överanpassning
Välj ett eller flera alternativ:
Logistisk regression används när den beroende variabeln bara kan anta värdet 0 eller 1
Logistiskt regression garanterar att den predicerade sannolikheten att Y=1 aldrig ligger
utanför intervallet 0 till 1
Logistisk regression används när en oberoende variabel bara kan anta värdet 0 eller 1
Med logistiskt regression så kan den predicerade sannolikheten att Y=1 om man har otur
ligga utanför intervallet 0 till 1
Logistisk regression används när den beroende variabeln bara kan anta värdet 0 eller 1
Logistiskt regression garanterar att den predicerade sannolikheten att Y=1 aldrig ligger
utanför intervallet 0 till 1
Välj ett eller flera alternativ:
Gildande medelvärden är användbart när man har säsongsvariation i data
Gildande medelvärden tar bort den cykliska variationen i data
Glidande medelvärden används i huvudsak när man vill göra prognoser för framtida
värden i en tidsserie
Glidande medelvärden används i huvudsak när man vill beskriva hur en tidsserie har
utvecklats över tid
Gildande medelvärden är användbart när man har säsongsvariation i data
Glidande medelvärden används i huvudsak när man vill beskriva hur en tidsserie har
utvecklats över tid
Välj ett eller flera alternativ:
Det går att modellera en tidsserie som växer exponentiellt över tid med regression
En tidsseriemodell med många polynom av tidsvariabeln kommer alltid att ge bättre
prognoser jämfört med en modell med få polynom
Om det finns seriekorrelation i en tidsseriemodell som skattats med regression så
kommer prediktionsintervall att bli missvisande
En tidsseriemodell med många polynom av tidsvariabeln kommer alltid att anpassa
befintlig data bättre jämfört med en modell med få polynom
Det går att modellera en tidsserie som växer exponentiellt över tid med regression
Om det finns seriekorrelation i en tidsseriemodell som skattats med regression så
kommer prediktionsintervall att bli missvisande
En tidsseriemodell med många polynom av tidsvariabeln kommer alltid att anpassa
befintlig data bättre jämfört med en modell med få polynom
Om vi har 95% konfidensgrad är sannolikheten att ett slumpmässigt intervall täcker
medelvärdet i populationen 95%
Sant eller Falskt?
Sant
Det är väl 95% sannolikhet att detta intervall innehåller det sanna medelvärdet för populationen.
Anta att vi har två 95% konfidensintervall för två medelvärden. Dessa konfidensintervall
överlappar varandra. Detta innebär att det inte finns en statistisk säkerställd skillnad på 5%
signifikansnivå.
Sant eller Falskt?
Falskt
Två överlappande KI innebär INTE att det inte finns en statistisk säkerställd skillnad
The p-value is the probability of the null hypothesis being true, given the data.
Sant eller Falskt?
Falskt
Det är väl sannolikheten att null hypotesen är sann och man får ett sådant värde eller mer?
The p-value measures the size or the importance of an observed effect.
Sant eller Falskt?
Falskt
Det är väl sannolikheten att null hypotesen är sann och man får ett sådant värde eller mer? Ingenting med storlek av viktighet?
p-values can indicate how incompatible the data are with a specified statistical model (H0).
Sant eller Falskt?
Sant
p-values can indicate how incompatible the data are with a specified statistical
model (H0). This incompatibility can be interpreted as casting doubt on or providing
evidence against the null hypothesis or the underlying assumptions.
A researcher wanted to study an alternative hypothesis (H1) and set up a statistical test
with a null hypohesis (H0). The significance test resulted in a p-value of 0.024. This proves
that H1 is true.
Sant eller Falskt?
Falskt
Det bara sannolikheten att null hypotesen är sann om man får ett sådant värde eller mer? Ingenting om H1 är sant eller inte.
När gångrar man med (N-n)/(N-1)
och
När gångrar man med 1 - n/N ?
Man gångrar med (N-n)/(N-1) när man måste skatta populationsstorlek eller urvalsstorlek
Man gångrar med 1 - n/N när man vet urvalsstorlek och populationsstorlek
Det är medelfelet^2 man gångrar med ifall det inte handlar om andelar. Dvs s^2/n (medelfel är s/rotenur(n))
Handlar det om andelar av en population så gångrar man med “(n(1-n))/(n-1)”, (medelfelet är sqrt((n(1-n))/n))
När kvadrerar man konstanterna?
Man kvadrerar konstanterna när man ska räkna ut konfidensintervall, konstanter är t.ex. populationsstorlek. i ett OSU-UÅ