Kvantitativ Metode Flashcards
Statistik
Teknikker til både planlægning af dataindsamling,
den efterfølgende analyse og
præsentation af data
Deskriptiv statistik
Beskriver data:
Tabeller,
Diagrammer,
Gennemsnit og procent
Analytisk statistik
Samenhæng og sandsynlighedsberegning
Repræsentativ stikprøve
- Alle i populationen har haft mulighed for at deltage
- Udvælgelsen er sket tilfældigt
- Man kender sandsynligheden for at den enkelte bliver udvalgt.
µ
Populations middelværdi
Punkt-estimat
Et enkelt tal, der er vores bedste gæt på en ”den sande
værdi”. F.eks. et gennemsnit
Interval-estimat
Interval omkring punktet, hvor vi det tænkes, at den
‘sande værdi’ ligger. F.eks. et konfidensinterval
Standardafvigelse
Vi kan bruge standardafvigelsen fra
vores stikprøve til at udregne
standardfejlen, så vi kan estimere
Standardfejl for gennemsnit
Standardfejl=
standardafvigelse/
√𝑎𝑛𝑡𝑎𝑙 𝑝𝑒𝑟𝑠𝑜𝑛𝑒𝑟
Standardfejlen for en andel
Standardfejl= √
(𝑎𝑛𝑑𝑒𝑙 1−𝑎𝑛𝑑𝑒𝑙)/
𝑎𝑛𝑡𝑎𝑙 𝑝𝑒𝑟𝑠𝑜𝑛𝑒𝑟
Spørgeskemaundersøgelse
- Formål
- Målgruppe
- Udvægelse - hvem (hvor mange)
- Indsamlingsmetode
- Opeartionalisering
- Spørgsmål og svar
- Rækkefølge
- Kvalitet af spørgeskemaet
De første to punkter er mest væsentlige. Alt afhænger af den enkelte undersøgelse
Svarprocent
Svar divideret med antallet af potentielle respondenter
Målgruppe
Hvem er modtager / relevante respondenter
Opeartionalisering
Målbare centrale begreber
Tilfældig sampling
Tilfældig udvælgelse af respondenter.
Stratificeret udvælgelse
Undergrupper, hvor man vælger yderligere undergrupper.
Klyngeudvælgelse
Indsamling på overordnet niveau
Typer af spørgsmål
Faktuelle
Holdning
Kundskabs
Baggrundsspørgsmål
Opddeles i:
Bagudskuende
Aktuelle
Fremtidsrettede spørgsmål
Otte råd til spørgsmålsformulering
Anvend alemene termoer og dagligdagssporg Anvend prævist sprogbrug Overvej, hvor meget respondenten kan huske Undgå antagelser Spørg kun én ting ad gangen Undgp negationer Undgå følelsesladede ord Undgå suplerlativer
Svarkategorier
Give mening
Udtømmende
Afbalanceret
Lukkede spørgsmål
Fast defienret svarkategorier
Kodning givet på forhånd
Begrænset indflydelse for respondenten
Åbne spørgmsål
Udefienret svarkategorier
Kodning foretages efterfølgende
Respondenten definere selv mulige svar
Bortfald
Svarprocent.
Antal af svar) / (Antal af potentielle respondenter
Pilottest
Sikre kvaliteten af survey / interview
Hypoteser
Antagelse / påstand om en sammenhæng / forhold
Falsificerbar som videnskabeligt kriterie
Forudsætning for videnskabelig progression
Deduktiv tilgang: hypoteser fremsættes før indsamling og analyse af data
Nulhypotese
Udgangspunktet for ¨’ingen effekt’ eller at to værdier er lig med hinanden
Skrevet som H0
Defineret således, at der ingen sammenhæng er
Alternativhypotese
Afvisning af nulhypotesen
Skrevet som Ha eller H1
Modstykke af H0
P-værdier
Sandsynlighedsværdier
Sandsynlighed for at have opnået de givne svar / data.
Mindre p-værdi -> stærkere beviser for H0 forkastes
P-v. mål for, hvor langt data ligger fra H0
Sandsynlighedsværdi mellem 0 og 1
Signifikanstest
- Ordinale/nominelle (kategoriske) eller intervalskala (kvantitative) variable
- Er det tilfældig udvælgelse
- Antagelse om populationsfordeling
- Stikprøvestørrelse / antal besavrelser
Sammenhæng mellem to variable.
Procedure for signifikanstest
- Tjek antagelserne for signifikanstest
- type data, tilfældig udvælgelse, krav om populationsfordeling - Formuler nulhypotese
- Udregn testværdi
- Udregn p-værdi
- Konkluder om H0 kan forkastes
Signifikans
Bestemmer hvornår vi afviser en nulhypotese
Hvilken p-værdi er den kritiske grænse
Signifikansniveauet kaldes også alpha-niveau
Alpha-niveau oftest sat til 0,05
Forkost H0m ved p-værdi på 0,05 eller mindre
H0 kan kun være sand eller falsk
Type 1 fejl
H0 sand
Type I fejl
Korrekt konklusion
Type 2 fejl
H0 falsk
Korrekt conclusion
Type II fejl
Signifikanstest do’s and don’ts
- Undlad at afrepportere signifikante resutlater
- Vær kritisk overfor signigikante resultater
Kategoriske variabler
- Variabler der omhandler grupperingerne i populationen
- Data med kendte og ofte bregrænset antal udfald - nominale og ordinale variable
Chi i anden benyttes
Anvendes til at teste, om der er sammenhæng mellem to kategoriske variable
Afprøver hvorvidt der er forksel mellem en observeret og forventet frekvensfordeling i den anden variabels kategorier
Afhængige variable
Det der påvirkes at de uafhængige variable
Uafhængige variable
Variable der kan stå for sig selv
Frihedsgrader
Hvordan den underliggende chi2 ser ud. Om man skal afvise eller ikke afvise H0.
Des flere rækker og tabeller, des mere ligner det en normalfordeling.
(antal rækker - 1)*(antal kolonner-1)
CHI i anden test komponenter
Excel, chi2.test
kontekst: Krydstabel
(Kolonne total) x (rækketotal) / (total totalen)
Signifikans
P-værdi der er under 0,05, afviser nulhypotese
Komponenter i Chi2-test
Observerede og forventede værdier
Forventede værdier udregnes som (kolonnetotal * rækketotal) / samlet total
Antal af frihedsgrader = (antal rækker - 1) * (antal kolonner - 1)
Pbg. Chi2-værdi og antallet af frihedsgrader, kan man udlede en p værdi
Tosidet hypotese
Hvorvidt ‘ingen forskel’ er mellem to grupper
Ensidet hypotese
Hvorvidt en gruppe har større eller mindre værdi end en anden gruppe (ensidet)
Antager noget - teoretisk og fagbegundet
Overvægt af en mulighed af to mulige
T-test
T-værdier bruges til at teste, hvorvid der er forskel mellem to gruppers gennemsnit (independent-samples t-test)
Independent-samples t-test: Hvorvidt der er forskel mellem to grupperse gennemsnit
One-sample t-test : Teste en gruppe mod en given testværdi
Paired samples: Test mellem de samme personer observeret på to forskellige tidspunkter
T-test forudsætninger
Tilfældig udvælgelse (stikprøve af population)
Kvantitativ/intervalskaleret afhængig
T-test antager en normal populationsofrdeling
Robust med stort antal besvarelser og tisudet hypotesetest
Antagelse om en varians for de to grupper
T-fordelingen har tykkere haler end en normalfordeling
T-test formler
T= (gennemsnit gruppe 2 - gennemsnit gruppe 1) / standardfejl
Statisisk signifikans i t-test
Stor forskel i gennemsnit for to grupper øger sandsynligheden for, at der er en signifikant forskel på gennemsnitene.
Mindre standardafvigelse øger sansynligheden for en signifikant forskel
T-test Excel
haler = 1 eller 2 afhængig af om ensidet eller tosidet hypotese
Intervalskalerede variable
Variable med mange mulige udfald såsom ratio- og intervalvariable.
Meningsfyldt udregning af gennemsnit
Punktdiagram
Illustrere sammenhænge mellem variabler med mange dataværdier
Korrelationskoeffeicienten
Sammenhængen mellem to intervalskalerede variable, der kan antage værdi fra -1 til +1 afhængig af styrken og retning
1 = Perfekt positiv korrelation 0 = ingen sammenhæng -1 = perfekt negativ correlation
Spuriøse sammenhænge
Man kan finde en visuel sammenhæng, men der er ingen reel sammenhæng
Tendenslinje
Regrssionslinjen, - viser r-værdi - viser sammenhæng
Regression
Aller observationer er indbyrdes uafhængige
Y har konstant standardafvigelse
Middelværdien af Y afhænger linært af X
Kausalitet
Årsagssammenhæng
Lineær regression
Y = a*x+b a= skæring med y-aksen b= hældningskoefficienten r= korrelationskoefficienten
Statistisk signifikans
Store froskelle i gennemsnittende for to grupper øger sansynligheden for, at der er en signifikant forskel på gennemsnittene.
Mindre standardafvigelse giver mindre overlap mellem grupperne - øger sandsynligheden for en signifikant forskel mellem de to gruppers gennemsnit
Nominal variabel
Ingen rangorden eller
Normalfordeling
Klokkeformet symetrisk fordeling
Optræder ved stort datasæt
Konfidensinterval
Angiver et interval for hvor den sande værdi ligger
Intervalestimater tager højde for usikkerhed