Begreper Flashcards
Hvilke målenheter for sentraltendenser har vi?
- Mean, i.e. gj.sn. (sum/antall)
- Median ((N+1) ÷ 2)
- Modus (typetallet)

Hva menes med univariat analyse?
Univariat analyse betyr analyse av én variabel (uni)
Hva menes med bivariat analyse?
Bivariat analyse betyr analyse av to variabler (bi)
Hva menes med multivariat analyse?
Multivariat analyse betyr analyse av tre eller flere variabler
Hvilke spredningsmål for variabler med intervaller / forholdstallsnivå?
- (normert) Modalprosent
- Variasjonsbredde
- Kvartildifferanse
- Standardavvik
- Varians
Hva er Helleviks første vitenskapelige norm?
Overenstemmelse med virkeligheten som det høyeste kriterium.
Sentral vitenskapelig norm 2 (Hellevik)
Systematisk utvalg av data.
Sentral vitenskapelig norm 3 (Hellevik)
Mest mulig nøyaktig bruk av data.
Sannsynlighetsutvelging
Ved sannsynlighetsutvelging benyttes det en tilfeldighetsmetode for å velge ut enheter fra universet til utvalget som gjør at enhetenes sjanse for å komme med er kjent, og forskjellig fra 0 og 1. Dermed er en sikret mot systematiske skjevheter i utvalget g en kan beregne omfange av de tilfeldige forskjellene en må regne med mellom utvalg og univers. Det finnes to hovedtyper av sannsynlighetsutvelging - enkel tilfeldig og systematisk utvelging. Et eksempel er et tilfeldig utvalg (ved eenkel tilfeldig utvelging av 1000 mennesker i Norge for å undersøke partipreferanser.
Proporsjonalt stratifisert utvelging
Proporsjonalt stratifisert utvelging innebærer at enhetene deles inn i ulike grupper(strata) etter hvilken verdi de har på en bestemt variabel (stratifiseringsvariabel), at utvelgingn foregår separat fra hvert stratum og at uvalgsbrøken er den samme for ulike strata. Hvis kjønn er stratifiseringvaiabel og det er 51 prosent kvinner i den voksne norske befolkningen, vil vi ha et proporsjonalt stratifisert utvalg om man trekker ut 51 prosent kvinner.
Klyngeutvelging
Når vi bruker klyngeutvelging, velger vi ikke ut enhetene som skal undersøkes direkte fra populasjonslisten. Utgangspunktet er heller en liste over klynger som enhetene kan grupperes sammen i. Det er gjerne geografiske områder som land, kommuner, distrikter eller lignende. Vi trekker først ut et visst antall klynger og trekker så ut utvalg fra disse klyngene. I vårt eksempel hvor det trekkes ut 1000 personer, kan man for eksempel trekke ut 5 landkommuner og 5 bykommuner i Norge og trekke til sammen 1000 personer fra de 10 kommunene.
Kvoteutvelging
Ved kvoteutvelging bestemmer vi på forhånd hvor mange som skal med i utvalget fra hver verdi på en eller flere variabler. Vi kan for eksempel bestemme oss for å ha 490 menn og 510 kvinner. Har vi så valgt ut 510 kvinner og 450 menn, fortsetter vi å ete etter flere menn til også den kvoten er fylt opp. Kvoteutvelging er en form for ikke-sannsynlighetsutvelging og må ikke forveksles med stratifisert utvelging.
Utvelging ved selvseleksjon
Dette er en form for ikke-sannsynlighetsutvelging. Respondentene tar selvinitiativ til å delta i en spørreundersøkele. Det klassisk eksempelet er mulighetene til å ringe inn og stemme “ja” eller “nei” på et spørsmål i et debattprogram på TV.
Korrelasjon/Samvariasjon/Bivariat sammenheng
Korrelasjon foreligger når en variabel påvirker en annen variabel. En mer teknisk forklaring er at korrelasjon foreligger når enhetenes verdier på en variabel er betinget av hvilken verdi de har på en annen variabel.
Samsvar
Samsvar er et spesialtilfelle av korrelasjon, som forutsetter at begge variablene har identiske verdier. Samsvar uttrykker i hvilken grad enhetene har samme verdi på to variabler. Scotts pi er et statistisk mål som måler grad av samsvar.
Panelundersøkelse
Ved panelundersøkelse har vi resultat for samme variabel fra samme utvalg på ulike tidspunkter. De samme menneskene blir med andre od spurt om det same på forskjellige tidspunkter. Det er ikke uvanlig å følge et panel over flere år for å måle endringer i for eksempel politiske preferanser.
Median
Median er et mål for sentraltendens i en univariat fordeling (analyse av én variabel). Hvis man rangerer alle enhetene fra den høyeste til den laveste verdien, vil medianen være den verdien hvor den midterste enheten befinner seg. Det er med andre ord like mange enheter med verdi høyere enn medianene som enheter med verdi lavere enn medianen. Sier hvilken verdi den midterste enheten har om vi rangerer alle enhetene fra den som har lavest verdi, til den som har høyest verdi på variabelen. Median kan brukes på ordinalnivå eller høyere.
Variasjonsbredden
Variasjonsbredden er et mål for spredning i en univariat fordeling. Variasjonsbredden måler differansen mellom den høyeste forekommende verdien og den laveste forekommende verdien i fordelingen.
Kvartildifferansen
Kvartildifferansen er et mål for spredning ved analyse av en bariabel. Etter at man har rangert enhetene fra enheten med høyest verdi og variabelen med lavest verdi blant de midterste 50% av enhetene i fordelingen.
Samspill
Samspill betyr at effekten av en uvhengig variabel på den avhengige varierer med hvilken verdi vi har på en annen uavhengig variabel.
Konsekvenser ved multikolinearitet
Multikolinearitet påvirker ikke estimatet av stigningskoeffisienten (eks. b1), men øker standardfeilen
Det gjør ikke resultatet systematisk skjevt, men øker usikkerheten rundt funnet.
Multikolinearitet
Multikolinearitet er når to eller flere uavhengige variabler i en regresjon korrelerer sterkt med hverandre. De individuelle variablene produserer derfor ikke unik og/eller individuell informasjon til regresjonen.
Ikke-Monoton effekt
En effekt som først er positiv, så negativ. F.eks. “Alder og deltakelse ved valg”.
Monoton effekt
En effekt som enten bare er positiv eller negativ.
Hva kalles en variabel med bare to verdier?
Dikotom variabel. Kan deles i naturlige dikotomier(f.eks. kjønn) og oppkonstruerte dikotomier(f.eks. høy/lav inntekt, gammel/ung, osv.)
Modus
Sier hvilken verdi flest enheter har. Modus kan brukes på alle de fire målenivåene.
Gjennomsnitt
Sier oss hva gjennomsnittsverdien i fordelingen er. Denne teknikken kan bare brukes på variabler på intervallnivå og forholdstallsnivå (unntaksvis også på ordinalnivå om variabelen har mange tallverdier) .
Univariat frekvensfordeling
En oversikt over antall enheter som har en bestemt verdi.
Bivariat frekvensfordeling
En oversikt over antall enheter som har en bestemt verdikombinasjon på to variabler.
Multivariat frekvensfordeling
En oversikt over antall enheter som har en bestemt verdikombinasjon på tre eller flere variabler.
Fordeling
En fordeling viser antall observasjonsenheter for hver variabelverdi.
Sannsynlighetsfordeling
En fordeling som brukes til å beregne feilmarginene og konfidensintervall til en utvalgsverdi
Konfidensintervall / sikkerhetsintervall
Området mellom øvre og nedre grense som trolig indkluderer den sanne verdien i pop (populasjonsverdi)
Feilmarginen
Et tall som sier oss hvor presis utvalgsverdien er
* Oppgis gjerne med “± n”
Populasjonsverdien
Verdi som vi får når vi undersøker en populasjon = parameterverdi - parametre - sannverdi (m, b, p)
Utvalgsverdien
Verdi som vi får når vi undersøker et utvalg / estimert verdi