Kvantitativa forskningsmetoder Flashcards
Kvantitativa forskningsmetoder
Vilka delar innefattar forskningsprocessen?
Projektering
Forskningsdesign
Insamling av data
Bearbetning av data
Rapportering
Projektering
Formulera syfte och frågeställningar. Gå till tidigare forskning, teori för att kunna formulera en forskningsfråga. Olika typer av syften och frågeställningar leder till olika typer av forskningsdesign.
Forskningsdesign
Vad är det för studie som ska göras? Vilka ska studeras? Mer specifikt hur en ska gå tillväga för att besvara sina frågeställningar.
Insamling av data
Det kan göras på en mängd olika sätt. Standardiserade intervjuer, enkäter, standardiserade bedömningsinstrument, tidigare insamlad data
Bearbetning av data:
Handlar om att sammanställa, beskriva, data på ett överskådligt sätt. I kvantitativa metoder har en olika mått, tabeller. Är resultaten tillräckligt säkra för att en ska kunna säga att det även ser ut på detta sätt i andra sammanhang?
Rapportering
Presentering av resultatet
Vad betyder variabel
Fenomen eller egenskaper som kan variera och vars variation vi vill studera, t.ex. kön eller ålder. en egenskap som kan variera (t.ex. ålder, bostadsort, utbildning, hårfärg). Kan vara beroende och oberoende
Beroende variabel?
En variabel som antas påverkas av en annan (Y)
X → Y
Oberoende variabel?
En variabel som antas påverka en annan (den beroende, X)
X → Y
Variabelvärden/kategorier, vad är det?
de faktiska siffror eller andra sätt som en variabel kan variera på t.ex. man/kvinna/annat eller 10 år/54 år/ 73 år.
Enheter inom variabler, vad är det
oftast individer, men även socialkontor, kommuner, länder osv
Inom kvantitativ metod kan syften delas upp i: (3st)
Beskrivande
*Mål att sammanfatta och presentera information om världen
*Ex på frågor: Hur mycket? Hur många? Hur länge?
Förklarande
*Mål att försöka förstå hur världen fungerar och varför den ser ut som den gör
*Frågor med fokus på samband: samvariation eller orsakssamband/kausalitet
Predicerande
*Mål att förutsäga framtida händelser i världen baserat på tidigare data och mönster
*Frågor med fokus på prognoser
Grundläggande etiska principer
Autonomi, rättvisa och icke-skadliggörande
Autonomi som etisk grundprincip
*Rätten till självbestämmande
*Människor vet bäst själva vad som är bäst för dem
*Etisk forskning utifrån autonomiprincipen innebär att forskaren främjar autonomi *Informerat samtycke: för att kunna bestämma måste man vara väl informerad
*Information måste finnas tillgänglig och vara begriplig
*Måste ses som en pågående process
Icke-skadlig/välgörande som etisk grundprincip
*Forskning ska främja nytta och det ‘goda’
*Undvika skada
*Sträva efter att uppnå positiva resultat för studiedeltagare
*Kontrollgrupp kan inte vara utan behandling eller få en behandling vi vet inte funkar
*Konfidentialitet
*Handlar om autonomi. Skydd av integritet och privatliv.
*Sekretess och skydd av personuppgifter
Rättvisa som etisk grundprincip
*Olika tolkningar:
*Forskning ska genomföras utifrån i vilken utsträckning resultatet går att omvandla till policy och praktik
*Forskning ska riktas mot och hjälpa utsatta grupper
*Forskning ska motverka social ojämlikhet
*Alla grupper ska vara representerade i forskning
*Barn? Autonomi eller rättvisa?
*Det kommer alltid finnas en diskussion kring vad som utgör denna princip
*En process som innebär övervägningar gällande potentiella konsekvenser för rättvisa
Vad handlar EBP om?
Började inom medicin på 1990-talet som en reaktion på att kliniska beslut ofta baserades på erfarenhet snarare än vetenskaplig evidens. Användning av forskning för att förbättra beslut inom professionellt arbete
Ambition: Ett mer kunskapsbaserat socialt arbete. EBP handlar i vid bemärkelse om att kombinera
Bästa tillgängliga kunskap/evidens med professionell expertis och klientens situation, erfarenheter och önskemål
Två modeller av EBP
Processmodellen och riklinjemodellen
Processmodellen inom EBP
Fokuserar på att den enskilda professionella aktivt söker, värderar och använder evidens i praktiken →EBP = en process som drivs av praktiker
1. Formulera en fråga
– Omvandla behovet av information (om prevention, diagnos, prognos, intervention, etc) till en fråga som låter sig besvaras
2. Söka bästa tillgängliga evidens
3. Värdera/kritiskt granska evidensen
4. Väga Samman Evidens med egen expertis och klientens/brukarens preferenser och implementera
– Integrera den kritiska bedömningen av evidensen med din professionella kunskap samt med klientens värderingar och situation –välj insats
5. Utvärdera/följa upp
–Följa Upp den enskilde klientens situation och utvärdera även steg 1-4 och sök om möjligt att förbättra tills nästa gång
För och nackdelar med processmodellen inom EBP
Fördelar
*Flexibilitet och individualisering
– skräddarsydda beslut
*Främjar professionell utveckling
Nackdelar/kritik
*Tidskrävande
*Kräver färdigheter
Riktlinjemodellen inom EBP
–Betonar användningen av redan utvecklade riktlinjer och manualer som baseras på forskning →EBPs= sammanställningar/listor av effektiva interventioner
–”Top-down”
Har till stor utvecklats som ett reaktivt alternativ till processmodellen
● Riktlinjer ses som det viktigaste instrumentet för en faktisk evidensbasering
● Kriterier för vad som ska känneteckna effektiva insatser har utvecklats av myndigheter och andra professionella organisationer vilka väger samman forskningsresultat och skapar sammanställningar/listor av ”effektiva” interventioner
För- och nackdelar med rinktlinjemodellen inom EBP
Fördelar
*Tidsbesparande
*Enhetlighet och standardisering
Nackdelar/kritik
*Minskad flexibilitet, färre individuella, klient relaterade bedömningar
*Risk för överdriven styrning och avprofessionalisering
Vad betyder forskningsdesign?
Ram eller grund för insamling och analys av data. Något bredare än studeidesign. Handlar om olika val eller ställningstaganden som görs under forskningsprocessen gällande:
Studiedesign (typ av studie).
Urvalsförfarande. Vilket typ av urval man ska göra
Datainsamlingsmetoder
Analystekniker.
Validitet
Validitet handlar om VAD vi mäter. Tillförlitligheten i en mätning med avseende på dess relevans. Handlar om att säkerställa att det man mäter faktiskt motsvarar det man avser att mäta. Går ut på en bedömning om slutsatserna som kommer från en studie hänger ihop eller ej, kan man lita på de, vilka slutsatser kan man dra givet studiens validitet. Tydlig koppling till studiedesign och urvalsförfarande, men även datainsamling/hur mätningarna har gjorts
Olika typer av validitet
Intern och extern validitet
Vad är intern validitet
Huruvida en slutsats om kausalitet (orsakssamband) är hållbar. Den oberoende variabeln orsakar förändringar i den andra.
Ex. beror minskningen av skadlig alkoholkonsumtion på en viss behandling eller har det att göra med annat?
Vilken utrsäckning vi kan anta att det finns ett orsakssamband
Vad är extern validitet
Huruvida resultaten från en studie kan generaliseras till andra sammanhang än de som faktiskt studerats, dvs utöver den specifika undersökningskontexten.
Ex. Gäller sambandet mellan skadligt alkoholkonsumtion och psykisk ohälsa också för personer som inte ingick i studien.
Generaliserbarhet om det kan kopplas till utanför urvalsgruppen
Reliabilitet
HUR vi mäter – tillförlitligheten i en mätning med avseende på dess upprepbarhet/stabilitet. Huruvida man mäter de som hör ihop
Tydlig koppling till datainsamling. Hur man mäter och samlar in data, det är det som ska vara stabilt och upprepbart. att kunskap är framtagen på ett tillförlitligt sätt, att det inte finns okontrollerade tillfälliga fel som stör
Olika typer av reliabilitet
Test-retest reliabilitet (stabilitet)
Intern reliabilitet
Interbedömarreliabilitet
Vad betyder test-retest-reliabilitet
Huruvida mätningen påverkas av tiden. vilket innebär att man frågar sig om måttet över tid är så pass stabilt att man kan vara övertygad om att de resultat som gäller ett urval av respondenter inte fluktuerar. Det betyder i sin tur att om exempelvis en viss grupps attityder mäts två gånger efter varandra, ska resultaten inte skilja sig åt i någon större utsträckning.
Om flera mätningar görs över tid – hur väl stämmer de olika mätningarna överens?
Vad innebär intern reliabilitet?
Huruvida det finns samstämmighet mellan olika mått som är tänkta att mäta samma sak. Den viktiga frågan är om de indikatorer som utgör en skala eller ett index är pålitliga och följdriktiga, det vill säga hur respondenternas poäng på någon av indikatorerna är relaterade till deras poäng på de andra indikatorerna.
Ex: Jämföra olika frågor som alla syftar till att mäta ungas problembeteenden avseende impulsivitet
Vad innebär interbedömarreliabilitet
Huruvida mätningen är fri från bias/skevhet från undersökaren. Resultatet ska inte styras av forskaren som person. Man ska få samma resultat. överensstämmelse mellan olika observatörer eller bedömare. Om det rör sig om subjektiva bedömningar, då man exempelvis ska observera eller översätta data till kategorier och då det finns flera observatörer inblandade, finns det risk för att överensstämmelsen mellan deras tolkningar är alltför liten. Detta kan bli aktuellt i många situationer, till exempel vid en innehållsanalys då olika inslag i medier ska kategoriseras, då man ska kategorisera svar på öppna frågor i en enkät eller vid strukturerade observationer då en eller flera personers beteende ska klassificeras på något sätt.
Om flera undersökare mäter samma sak – hur väl stämmer de olika mätningarna överens?
Ex: Jämföra självskattning-föräldraskattning-lärarskattning av ungas problembeteenden
Vad betyder kausalitet?
Orsakssamband. Hur väl man mäter det man avser att mäta
Vad betyder studiedesign
vad det är för typ av studie. Kvantitativa metoder innehåller flera olika studiedesign. Olika design är lämpliga för olika forskningsfrågor – ingen design är bra för alla forskningsfrågor!
Studiedesignen kan vara uppdelat i två grenar..
Experimentella och icke experimentella
Experimentella studier innebär..
Innebär manipulation av den oberoende variabeln.
Dvs deltagare utsätts för denna tänkta orsaksfaktor, oftast en intervention (t.ex. KBT) för att avgöra i vilken grad den påverkar den beroende variabeln (t.ex. depression).
Manipulerar den oberoende variabeln att några får interventionen och andra som inte får.
- Innehåller en kontrollgrupp
Dvs de deltagare som fått en intervention (t.ex. KBT) jämförs med deltagare som inte fått interventionen.
Fördelar med experimentella studier
Bra för att fastställa kausalitet (orsakssamband) - utvärdera effekter av interventioner (hög intern validitet) i detta fall att KBT kan direkt påverka depression. Om en experimentell studie säger att ena faktorn påverkar den andra kan man lita på det just för att forskarna påverkat den oberoende variabeln.
Nackdelar med experimentella studier
De är ofta små - få deltagare - svårt att generalisera resultaten. Hög validitet men på bekostnad av ??. Det är svårt att se att det kan appliceras utanför studiens kontext eftersom det är få deltagare och svårt att generalisera. (Låg extern validitet)
Randomiserad kontrollerad studie (RCT) - experimentella studier
Fördelningen av studiedeltagare till experiment- respektive kontrollgrupp sker genom randomisering – slumpen avgör vilka som hamnar i vilken grupp.
● Randomiseringen (om tillräckligt många deltagare) försäkrar att grupperna i genomsnitt är lika i alla andra avseenden – hanterar därmed selektion dvs initiala skillnader mellan grupperna och ”confounding”, dvs möjligt inflytande från bakomliggande faktorer.
● Bästa designen för att fastställa kausala samband (effekter) kallas därför ofta för ”den gyllene standarden”. Den som har högst intern validitet.
● Den bästa RCTn är den dubbelblinda – deltagarna vet inte om de ingår i experiment- eller kontrollgrupp och de som förmedlar insatsen/medicinen vet inte heller det.
OBS randomisering är ingen urvalsprincip!
Kvasiexperimentell studie - experimentell studie
Fördelningen av studiedeltagare till experiment- respektive kontrollgrupp sker INTE genom randomisering – det är INTE slumpen som avgör vilka som hamnar i vilken grupp – ofta används ”naturliga” grupper. Ex om det gäller inom socialt arbete att man jämför två kommuner med varann där den ena kommunen testar en insats och den andra inte testar. Man har en kontrollgrupp och det är inte slumpen som avgör vilken som får vad.
- Kan vara ett bra alternativ till RCT när det är praktiskt svårt eller etiskt problematiskt med randomisering.
Icke experimentella studier innebär..
Innebär ingen avsiktlig manipulation av variabler.
● Utförs INTE i laboratorier eller kontrollerade miljöer som forskare styr över.
● Fenomen studeras eller observeras i sina naturliga sammanhang – kallas också för observationsstudier.
Man går ut i världen och observerar och samlar in data.
För och nackdelar med icke experimentella studier
Fördelar: Bra för att kartlägga olika företeelser. Bra alternativ för att studera hur olika saker stämmer samman nör det är för dyrt/svårt eller oetiskt att göra experiment. De är ofta stora - många deltagare - bättre möjligheter att generalisera resultaten (hög extern validitet)
Nackdelar: Svårare att fastställa kausalitet (låg interna validitet). Eftersom vi bara går ut och observerar är det svårt att fastställa att just den faktor påverkar.
Tvärsnittsstudier - icke experimentella studier
Data samlas in vid ett enda tillfälle (en mätpunkt)
● Ger alltså en bild av en population vid en viss tidpunkt och används för att kartlägga och beskriva olika egenskaper eller fenomen (och samband dem emellan).
● Relativt enkla, snabba och billiga att genomföra, men lägre intern validitet än experimentella och longitudinella studier.
Ex: Samband mellan attityder och beteende – går inte att veta vad som påverkar vad i och med att uppgifter bara samlas in en gång.
Longitudinella studier - icke experimentella studier
Data samlas in vid två eller flera tillfällen (flera mätpunkter). Flera bilder av hur något ser ut.
● Kan ge en bild av förändringar över tid och används därför för att studera utveckling, trender och samband mellan olika egenskaper eller fenomen.
● Bra alternativ för att studera samband när experiment inte är lämpliga – jämförelsevis ofta högre extern validitet, men lägre intern validitet.
Två inriktiningar inom longitudinella studier
● Upprepade tvärsnittsstudier
Följer olika observationer över tid. En viss grupp men olika individer. Det skulle kunna säga exempelvis hur utsatthet för brott för folk i åk 9 har påverkats över tid.
● Panel-/kohortstudier
Följer samma observationer över tid. Följer samma individer.
Vad menas med population
Population är den grupp/de enheter som man vill studera.
I vissa fall går det att studera hela populationen, t.ex.
Om det är en liten population, t.ex. en fallstudie av anställda på ett småföretag eller klienter på ett socialkontor. Om man använder sig av nationella register då dessa täcker hela befolkningen.
En population består i grunden av samtliga de enheter som man gör sitt urval ifrån. Forskaren kan göra sitt urval från en population som består av exempelvis nationer, städer, bostadsområden, skolor eller företag. Ordet “population” har därför ett bredare användningsområde än normalt när det gäller en vardaglig användning av ordet; population brukar då avse alla invånare i ett land.
vad menas med urval
Ofta är det inte möjligt att undersöka en hel population – kan vara dyrt, ta lång tid och inte vara praktiskt genomförbart.
●Då kan man istället göra ett urval i populationen och studera urvalet. Man väljer ut en viss del av populationen. Sedan är det de man studerar.
● För att vi ska kunna generalisera resultaten tillbaka till populationen är det viktigt att urvalet har samma egenskaper som populationen alltså att det är representativt
Urvalsförfarande = typen av urvalet man tar från populationen
Vilka två huvudsakliga två urvalsmetoder finns
Slumpmässigt urval
Icke slumpmässigt urval - externa validiteten kommer vara LÄGRE
Vilka tre metoder inom icke slumpmässigt urval finns?
Snöbollsurval, kvoturval och bekvämlighetsurval
Snöbollsurval
En respondent tipsar om en annan som tipsar om en annan etc. Alla har något gemensamt
Kvoturval
Urvalet ska fylla vissa i förväg bestämda kvoter. Målet för ett kvoturval är att ge ett stickprov som speglar en population i termer av den relativa fördelningen av individer i olika kategorier, till exempel kön, etnisk bakgrund, ålder, socioekonomisk status och boendeform. urvalet av individer inte på något slumpmässigt sätt, eftersom det är forskaren som står för det slutgiltiga beslutet.
ex. Könsfördelning
Bekvämlighetsurval
Respondenter som är lättillgängliga. Respondenterna är sådana personer som för tillfället råkar finnas tillgängliga för forskaren.
ex. Studenter på campus
Vilka fyra metoder finns inom slumpmässigt urval
Obundet slumpmässigt urval (OSU)
Systematiskt urval
Klusterurval/flerstegsurval
Stratifierat urval
Obundet slumpmässigt urval (OSU)
Varje enhet i populationen har samma chans/sannolikhet att komma med i urvalet.
Tex att lotta ut helt slumpmässigt från alla i populationen
Systematiskt urval
En variant av det obundna slumpmässiga urvalet är det systematiska urvalet, där man väljer enheter direkt från urvalsramen, det vill säga utan att använda någon slumptalstabell.
Ex. var femte, var sjunde enhet från en lista på populationen
Klusterurval/flerstegsurval
Slumpmässigt urval av kluster/grupper av enheter och i vissa fall även slumpmässigt urval av enheter i dessa kluster
Ex. Elever i skolor - ett antal skolor väljs och undersöks eller så gör s även ett urval av elever på dessa skolor
Stratifierat urval
Stratifierar populationen i olika strata (grupper) och gör OSU inom respektive strata
Ex. stratifiering utifrån boendetyp där man vill få 33% i villa, 33% i hyreslägenhet etc.
Problem i samband med urval
● Undertäckning = missar personer som ska vara med.
● Övertäckning = får med personer som inte ska vara med
● Bortfall! - tappar information
vad menas med externt och internt bortfall
- Externt bortfall = Valda enheter vill/kan inte delta.Vi kan i viss grad påverka det externa bortfallet: Antalet frågor och deras komplexitet om de är knepiga att svara på.
- Internt bortfall = Saknas vissa uppgifter om enheterna. Vi kan även i viss mån påverka det interna bortfallet: Frågornas ordning och ordalydelse. Pilotstudie där man testar.
Ex. Att individer som deltar i en studie inte vill/kan besvara vissa frågor i den enkät som används.
Vad menas med systematiskt bortfall?
Individer/grupper med specifika attribut/egenskaper som är mer benägna än andra att inte få/kunna/vilja delta. vi vill att urvalet ska vara representativt av populationen men om vissa faller bort kommer det inte vara representativt.
Vad är univariata analyser?
Vi analyserar EN variabel i taget. Kallas också beskrivande statistik eller deskriptiv statistik. Oftast är detta en första steget i en större analys och kan stå för sig själv. För att förklara vad det är för data vi har. Syftet med univariat analys är att beskriva data och hitta mönster som finns inom den. Detta kan inkludera att hitta medelvärde, median, mode, standardavvikelse, och andra statistiska mätningar.
För att illustrera variabeln använder vi oss av..
cirkeldiagram, stapeldiagram, histogram, frekvenstabell
För att beskriva variabelns tyngdpunkt använder vi oss av..
typvärde, median, medelvärde
För att beskriva variabelns spridning användr vi oss av
standardavvikelse (std), minsta och högsta värde
Vilka skalnivåer finns det?
Nominal, ordinal och intervall/kvot
Varför skalnivåer?
●Vilken analys som är lämplig bestäms främst av variabelns skalnivå, men också av antal variabelvärden
inte alla variabelämnen är inte lämpliga utan man mäter utifrån skalnivån.
●Variablernas skalnivå sätter gränser för hur vi kan beskriva en variabel samt vilka typer av analyser som är lämpliga att genomföra
Nominal - rangordna, gruppera, ekvidistans exempel
Gruppera = JA
Rangordna = NEJ
Dessa variabler kallas också för kategorivariabler och omfattar kategorier som INTE kan rangordnas. Kategorierna ges utan att ange någon inbördes ordning ex. ingen kan var mer kön för de är kvinna, inget kan vara mer stad för att det är Stockholm.
Ekvidistans = NEJ eftersom det finns ingen kontinuerlig distans mellan värdena.
Ordinal - gruppera, rangordna, ekvidistans, ex.
Kategorivariabler.
Gruppera = JA
Rangordnas = JA. Man kan säga att en högskoleutbildning är mer utbildning är grundskola och att på en nöjdhetsskala är “må bra” mer än att må dåligt.
Ekvidistans = NEJ. Man kan inte säga något om distansen för det finns ingenting som säger något om den exakta distansen. avståndet mellan två intilliggande mätvärden är inte lika stort man kan inte konkret/objektivt mäta kategorierna.
Intervall/kvot - gruppera, rangordna, ekvidistans, ex.
Gruppera = JA
Rangordna = JA
Ekvidistans = JA ¨
Det är variabler som innehåller lika stora avstånd mellan kategorierna (konstant) och man kan rangordna kategorierna, i längd är 1 cm alltid 1cm mer eller mindre. Här finns det också absolut nollpunkt om det finns en entydig betydelse som är en nollpunkt ex. inom grader (celsius).
Ex. Längd, Ålder, Vikt, Lön
Nominal - vad används för att beskriva variabeln?
Cirkeldiagram, stapeldiagram, frekvenstabell
Ordinal - vad används för att beskriva variabeln?
Stapeldiagram, frekvenstabell och histogram om det är många värden.
Intervall/kvot - vad används för att beskriva variabeln?
Histogram och frekvenstabell om det är få värden
Cirkeldiagram/Pie chart
●Främst för att beskriva variabler på nominal skalnivå.
●OBS: kräver få variabelvärden
●Kan presenteras med andelar och antal
Stapeldiagram
Främst för att beskriva variabler på ordinal skalnivå
– Undantag: nominal med många variabelvärden. Tex om man ska ange bostadsorter.
Kan användas för att redovisa åsikter om något.
Histogram
Främst för att beskriva variabler som är intervall/kvot. Ibland ordinala om det är många värden.
Enkelt ge en överblick hur spridningen ser ut i variabeln.
Kan ibland presenteras med en normalfördelningskurva
Frekvenstabell
● Fungerar egentligen för att beskriva variabler oavsett skalnivå. Inte ganske de exakta grupperna utan de karakteristiska hos grupperna
● Visar hur vanliga variabelvärden är i frekvens och procent
● Visar även andel/antal bortfall för varje variabel.
● Om frekvenstabell är lämplig för beskrivning avgörs främst av antal variabelvärden. Lämplig för nästan alla skalnivåer.
● Målet = beskriva variabeln så bra som möjligt.
● Många värden = svår att beskriva med en frekvenstabell. Tex ett åldersspann på 16-85 ger 69 rader
Statistiska fördelningar - Normalfördelning
En beskrivning av hur våra data varierar. Toppen indikerar medelvärdet.
Alltid symmetrisk, svansen till vänster alt. höger om medelvärdet motsvarar hälften av observationerna och ser likadana ut.
Vad betyder standardavvikelse?
genomsnittlig avvikelse från medelvärdet
Vad betyder stor respektive liten standardavvikelse
Stor standardavvikelse = värdena ligger mer ifrån varandra.
Liten standardavvikelse = värdena ligger närmare varann/medelvärdet.
Sneda fördelningar
● Sneda = asymmetriska = svansarna olika stora/långa.
● Skevheten kan vara positiv (högra svansen längre) eller negativ (vänstra svansen längre).
Positiv: stora summan först. “kullen” kommer först
Negativ: minsta summan först. “kullen” kommer sist
Vad är ett centralmått?
● Ett sammanfattande mått på tyngdpunkten i en fördelning
● Kallas även för lägesmått
● Svarar på frågan: Vad är genomsnittsvärdet på variabeln?
olika genomsittsvärden beroende på vilken skalnivå
● Val av lämpligt centralmått hänger samman med variabelns skalnivå
Vanliga centralmått
● Medelvärde (mean)
● Typvärdet (mode)
● Median
Medelvärde
Det genomsnittliga värdet. Beräknas genom att ta summan av alla värden och dividera med antalet observationer.
Typvärde
Kallas även för modalvärde (jfr eng. mode), Det vanligaste förekommande värdet. Gruppera värdena och se vilken grupp som är störst.
Median
mittvärdet, dvs. det mittersta värdet i fördelningen. Sorterar värdena i storleksordning från det lägsta till det högsta. Udda antal observationer= mittersta värdet
Jämnt antal observationer = medelvärdet av de två mittersta värdena
Vilka/vilken skalnivå passar typvärde?
Nominal, ordinal och intervall/kvot
Vilka/vilken skalnivå passar medelvärde?
intervall/kvot och kanske ordinal
Vilka/vilken skalnivå passar median?
Ordinal och intervall/kvot
vad betyder bivariata analyser?
● Bi=två. Studerar två variabler samtidigt. Analyserar sambandet dem emellan därför kallas det för sambandsanalyser. Olika variabler har olika egenskaper – skalnivå – därför behövs också olika typer av analyser för att vi ska kunna beräkna samband på ett meningsfullt sätt:
Val av analysmetod styrs alltså av de två variablernas skalnivå
Svarar mot syften och frågeställningar av beskrivande och förklarande karaktär
Mål att försöka förstå hur världen fungerar
Frågor med fokus på samband som gruppskillnader, samvariation eller korrelation
Samband, vad menas
variablerna korresponderar systematiskt med varandra, om de samvarierar. Om de påverkar varandra åt det ena eller det andra hållet. Koppla inte direkt till kausalitet, det är ett specifikt typ av samband.
X ↔ Y
Kausalitet/orsakssamband
Förändringar i en variabel orsakar förändringar i den andra då pratar man om effekt. Alltså om X → Y.
Skensamband
variablerna samvarierar på grund av en annan bakomliggande variabel (confounder) eller pga rena tillfälligheter. C → X, Y
Statistisk signifikans
● Handlar om frågan: Är sambandet man får fram i våra bivariata analyser i vårt urval ”verkligt”, dvs finns det också i populationen eller är det endast ett resultat av slumpen? Det är det statistiskt signifikans handlar om att klargöra det.
● Innebär enkelt uttryckt att ett samband som vi ser i vårt urval kan generaliseras till populationen (förutsatt att urvalet har gjorts slumpmässigt)
Hypotesprövning med två delar..
Nollhypotes: Mothypotes.
Nollhypotes
Nollhypotes: Inget samband (skillnad mellan grupperna) (H0). Utgångspunkten. Om vi anser att sambandet i urvalet kan förklaras av slumpen (det inte är statistiskt signifikant) håller vi fast vid nollhypotesen om att det inte finns något samband i populationen.
Mothypotes
Mothypotes: Finns ett samband (skillnad mellan grupperna) (H1). Om vi anser att sambandet i urvalet är tydligare än vad som rimligen kan förklaras av slumpen ( det är statistikst signifikant) så förkastar vi istället nollhypotesen
Signifikanstestning
Statistiska signifikanstest ger oss ett mått – p-värde – som anger hur sannolikt ett samband i ett urval är givet att det inte finns något samband i populationen.
Ju högre p-värde, desto större risk att sambandet i urvalet uppstått av slumpen
Om p-värdet är under en viss (i förväg bestämd) gräns är sambandet statistiskt signifikant om det är under det värdet, dvs tydligare än vad som rimligen kan förklaras med slumpen. Sambandet är tydligare än om det vore slumpen
p-värde = signifikansvärde/nivå (probability)
Signifikansnivåer - den viktigaste
P <0.05= sannolikheten lägre än 5 procent: 5-procentsnivån är den vanligaste. Sannolikheten att det beror på slumpen är mindre än 5%.
P <0.01= sannolikheten lägre än 1 procent
P <0.001= sannolikheten lägre än 0.1 procent/1 promille
Det ska vara under 0.05
Chi2-test
Chi2-testet bedömer om det finns ett samband mellan två kategoriska variabler Båda variablerna ska vara kategoriska (dvs. nominella eller ordinala) och bestå av två eller fler grupper. “Sig. (2-sided)” används för att se p-värdet för testet. Det ska vara under 0.05 för att vara statistiskt signifikant.
T-test
Intervall/kvot vs ordinal/nominal med två grupper
Används för att jämföra medelvärden mellan grupper och avgöra om skillnaden mellan dem är statistiskt signifikant.
Här är det viktigt om vilken rad man kollar på så kolla på det första p-värdet om det är över eller under 0.05.
**Mean difference → hur mycket mer/mindre i medelvärde den ena gruppen har är den andra. ex. Mean difference = 0,06, då har männen druckit 0,06 mer liter vin än kvinnorna (kolla tillbaka i grou statistics om vems medelvärde som är högst)
Korrelationsanalys Pearson
intervall/kvot vs intervall/kvot.
En korrelationsanalys testar sambandet mellan två kontinuerliga variabler utifrån hur starkt sambandet är, och i vilken riktning sambandet går. Styrkan i sambandet uttrycks som en korrelationskoefficient, som kan variera mellan -1 och 1. **Kolla vid raden om korrelationskoefficienten (pearson correlation/correlation coefficient), har värdet inte ett minustecken är det positivt.
Korrelationsanalys Spearman
Ordinal/ordinal och ordinal/intervall/kvot.
En korrelationsanalys testar sambandet mellan två kontinuerliga variabler utifrån hur starkt sambandet är, och i vilken riktning sambandet går. Styrkan i sambandet uttrycks som en korrelationskoefficient, som kan variera mellan -1 och 1. **Kolla vid raden om korrelationskoefficienten (pearson correlation/correlation coefficient), har värdet inte ett minustecken är det positivt.
Korrelationskoefficient
Ett mått som fås vid korrelationsanalyser och som anger ett sambands riktning och styrka, två olika typer. ● Om korrelationsanalys med Pearson (intervall/kvot vs intervall/kvot):
Produktmomentkorrelationskoefficienten (Pearson’s R)
Anger graden av linjärt samband mellan två variabler
● Om korrelationsanalys med Spearman (ordinal vs ordinal / intervall/kvot):
Rangkorrelationskoefficienten (Spearman’s Rho)
Anger graden av samstämmighet mellan två rangordningar
● Men de läses av på samma sätt
● Kan båda anta alla värden mellan +1 och -1
Riktning - pearson och spearman
Positivt = högt (X) och högt (Y) eller lågt (X) och lågt (Y)
Neutralt = värde på den ena variabeln (X) hänger inte samman med ett värde på den andra variabeln (Y)
Negativt = Högt (X) och lågt (Y) eller lågt (X) och högt (Y)
Styrka - inom Spearman och Pearson
● Ju närmare +1/-1 desto starkare samband
● Ju närmare 0 desto svagare samband. 0 = ingen styrka på sambandet.
● Inga exakta gränser för vad som ska räknas som ”starkt” respektive ”svagt”, men en vanlig tolkning är: se tabell
Varför regressionsanalys?
Regressionsanalyser är ett exempel på multivariata analyser som görs för att undersöka samband när bivariata analyser inte räcker till. Det är sällan bivariata räcker till, vi måste nästan alltid kontrollera bakomliggande. Korrelation och kausalitet: multivariata analyser är ett steg närmre möjligheten att dra slutsatser om kausalitet
Finns flera olika typer av regressionsanalys som vi kan använda utifrån vilken skalnivå vår beroende variabel har.
två typer av regressionsanalyser:
–Linjär (beroende variabel på intervall/kvot)
–Logistisk (beroende variabel med två värden, 0 och 1). –Regressionsanalyser tror att allt är kvot/intervall-variabler. lösningen på variabler som inte är intervall (ordinal/nominal) är dummyvariabler för man ska kunna stoppa in de.
Dummyvariabler
*Oberoende variabler på nominal-/ordinalskala måste kodas om innan de kan inkluderas i regressionen.
*Dummyvariabler används för att inkludera kvalitativa variabler i regressionsanalysen
*En dummyvariabel är en variabel som endast har två värden (0 och 1). det viktiga är itne att det är två värden de viktiga är att det är 0 och 1.
Dummyvariabler med två kategorier
Vill vi tex inkludera kategoriska variabel som kön som oberoende variabel i en regressionsanalys måste vi inkludera den som en dummyvariabel.
EXEMPEL:
Vi väljer att koda kvinna som ”1” och man som ”0” eftersom män är referenskategorin. I ett fall där alkoholkonsumtion är den beroende variabeln kommer regressionsanalysen visa hur mycket kvinnor dricker jämfört med referenskategorin män
Dummyvariabler med fler än två kategorier
Istället för en variabel med fler än två alternativ använder vi flera dummyvariabler. Vi använder antal kategorier minus 1. Om vi har en variabel med 3 alternativ gör vi 2, har vi 4 gör vi 3.
Vi använder k-1 dummyvariabler utifrån den ursprungliga variabeln (k=antal kategorier i ursprungsvariabeln)
Linjär regressionsanalys
Vid linjär regressionsanalys beräknas en rät linje som sammanfattar sambandet mellan variablerna så bra som möjligt. Predicerar värdet på den beroende variabeln utifrån förändringar i den oberoende variabeln. Med linjär regressionsanalys besvarar vi på frågan
”hur mycket förändras Y vid en enhets ökning av X”?. Oberoende/X-variablerna kan vara dummys för nominal/ordinal eller kvot/intervall. Beroende/Y är kontinuerlig (kvot/intervall)
Kan vara enkel eller multipel
Enkel linjär regressionsanalys
ENKEL Besvarar frågan: Hur mycket den beroende variabeln (Y) vid en enhets ökning av den oberoende variabeln (X). endast en x-variabel kallas det “enkel” linjär regression
Multipel linjär regressionsanalys
MULTIPEL Besvarar frågan: Hur mycket den beroende variabeln (Y) vid en enhets ökning av den oberoende variabeln (X) konstanthållet/kontrollerat för övriga oberoende variabler (X2,X3 etc)
Vid multipel regressionsanalys har vi två eller fler oberoende variabler. Även om vi bara är intresserade av sambandet mellan två variabler är det ofta nödvändigt att kontrollera om detta samband är ett skensamband. Kommer närmre kausala orsakssamband
Vad ska man kolla på i linjär regressionsanalys
B-koefficiententen som visar värdet på den beroende variabel.
Minskning/negativ linjär regression, hur uttrycks det?
Minustecken före B-koefficienten. Indikerar att den oberoende variabeln har en negativ effekt på den beroende variabeln. När värdet på den oberoende variabeln ökar, minskar värdet på den beroende variabeln.Om B-koefficienten är negativ (mindre än 0) säger man: “För varje enhets ökning i x minskar y med [B-koefficientens värde].”
Ökning/positiv linjär regression, hur uttrycks det?
INGET minustecken före B-koefficienten. innebär att den oberoende variabeln har en positiv effekt på den beroende variabeln. När värdet på den oberoende variabeln ökar, ökar också värdet på den beroende variabeln. Om B-koefficienten är positiv (större än 0) säger man: “För varje enhets ökning i x ökar y med [B-koefficientens värde].”
Logisk regressionsanalys
Logistisk regressionsanalys används för att studera binära/dikotoma fenomen, t.ex. arbetslös (ja/nej), förtidspensionär (ja/nej), sjukskriven (ja/nej) osv. Den beroende/Y variabeln är dikotom och kan bara anta värdena 0 och 1. Oberoende variabler på nominal/ordinalnivå kodas om till dummyvariabler. Logistisk regression används för att förutsäga “oddsen” för att vara ett “fall” baserat på värdena för x-variabel(n). besvarar frågan: hur mycket är oddset för att ha värde 1 på den beroende variabeln (Y) förändras vid en enhets ökning av den oberoende variabeln (X)
Enkel logistisk regression
- Antal variabler:
- En beroende (y)
- En oberoende (x)
- Variabelskalor:
- Beroende variabel: Binär/två
- Oberoende variabel: Kategorisk (nominal/ordinal) eller kontinuerlig (kvot/intervall)
Enkel besvarar frågan: hur mycket är oddset för att ha värde 1 på den beroende variabeln (Y) förändras vid en enhets ökning av den oberoende variabeln (X)
Multipel logistisk regression
- Antal variabler:
- En beroende (y)
- Minst två oberoende (x)
- Variabelskalor:
- Beroende variabel: Binär/två
- Oberoende variabler: Kategoriska (nominal/ordinal) och/eller kontinuerliga (kvot/intervall)
Multipel besvarar frågan: hur mycket är oddset för att ha värde 1 på den beroende variabeln (Y) förändras vid en enhets ökning av den oberoende variabeln (X1) kontrollerat för övriga oberoende variabler (X2,X3 etc)
Vad är odds?
hur sannolikt det är att en händelse/ett utfall inträffar. Regressionskoefficienten (sambandets styrka och riktning) anges i oddskvoter (OR) (ExpBi i SPSS). Oddskvoter tolkas som: vad en enhets förändring i den oberoende variabeln X ger för förändring i oddsen att ha värdet 1 i den beroende variabeln Y.
Hur tolkas OR som är mindre än 1.00. ex. OR: 0.20
OR som är mindre än 1.00 innebär ett lägre odds
OR = 0.20 = 80% lägre odds
Hur tolkas OR som är större än 1.00 ex. OR: 1.95.
OR som är större än 1.00 innebär ett högre odds
OR = 1.95 = 95% högre odds.