VF : Data & mäta de omättbara Flashcards
Hur vet du att datan är normalfördelad?
Redovisas med medelvärde och standardavvikelse - Standardavvikelsen är liten jämfört med medelvärdet Icke-normalfördelad data redovisas med median och kvartilavstånd
Hur redovisar man normalfördelad data?
Medelvärde och standardavvikelse
Hur redovisar man icke-normalfördelad data?
Median och kvartilavstånd
Hur kan du se på SD-storlek om datan verkligen är normalfördelad?
Om SD är halva medelvärdet eller högre så indikerar det på att det finns en sannolikhet att det inte är normalfördelat
Tre grupper, hur analyserar du datan?
Kvantitativ variabel som jämförs mellan tre grupper: - ANOVA/ variansanalys: om datan är normalfördelad - Kruskal-Willis: om datan inte är normalfördelad Om detta test är signifikant så går vi vidare med ett post-hoc test. Post-hoc innebär att man gör ett antal t-test (Mann-Whitney U om icke-normalfördelat) för att jämföra de olika grupperna två åt gången
vad är en mätning?
- Ett sätt att uttrycka någon storhet i siffror.
- En del saker är direkt mätbara:
–Antal figrar
–Längd
•En del saker är indirekt mätbara:
–Vikt
–Blodtryck
•En del saker är ännu svårare att mäta:
–Livskvalitet
–Depressiva symptom
hur vill vi att ett test ska utföras? vad vill vi uppnå`
- Resultatet på testet ska gå att använda på det sätt vi har tänkt använda det.
- Resultatet på testet ska inte påverkas av slumpfaktorer (tillfälliga luckor i koncentration t ex).
- Testet ska vara praktiskt lätt för patienten.
- Testet ska vara praktiskt lätt för undersökaren.
- Testet ska upplevas som meningsfullt.
- Testet ska gå att relatera till andra testresultat m. m.
- Testet ska vara teoretiskt sunt.
hur ser ett flödesschem över hur man utveckla ett test ut?
tänk även om testet inte är kopplat till svenska
när man gör ett frågeformulär för något - hur gör man då?
exempel om skurkar!
frågor, definationer, svarsalternatv.
Frågeformuläret ska bestå av ett antal frågor/påståenden (items) som tillsammans ska ge ett poängvärde som avgör personens elakhetsgrad.
behöver:
•Vi behöver en fungerande definition av den storhet vi avser mäta.
- •Färdiga definitioner från litteratur etc.
- Definitioner från expertgrupper.
- Kriteriebaserade definitioner.
- Vi måste kunna veta att testet är pålitligt.
Kolla vad som finns om forskingområdet innan.
svarasalternativ:
- Dikotom = Två svarsalternativ (ja/nej).
- Polytom = Fler än två svarsalternativ.
- Jämt eller udda antal svarsalternativ?
- Hur namnge svarsalternativen?
- Ska mittenalternativet vara neutralt eller inte?
vad är dimensionalitet vid testining av items?
vad är faktoranalys?
- Dimensionalitet handlar om huruvida frågorna mäter ett och samma bakomliggande koncept.
- Två frågor som mäter samma sak borde samvariera med varandra mer än två frågor som mäter olika saker.
- Vi kan göra upp en tabell som visar hur varje fråga samvarierar med varje annan.
faktor
- Faktoranalys är en statistisk metod som bygger på att leta efter underliggande ”faktorer” som förklarar variationen i våra data.
- Forskaren måste välja hur många faktorer han/hon tror finns, samt namnge dessa.
vad är reliabilitet?
vad påverkars de av? är de viktigt?
•Reliabiliteten är ett mått på hur stor del av variationen i hur folk besvarar itemet som beror på att de verkligen är olika med avseende på det testet mäter.
påverkas av:
- Ju högre reliabilitet, desto större del av variationen i hur folk svarar på frågeformuläret beror verkligen på att de är olika.
- Reliabiliteten för ett idealt test är 1, men det är den aldrig i verkligheten.
- Ju fler items, desto högre reliabilitet.
viktigt?
- Om reliabiliteten är låg blir den maximala korrelationen som är teoretiskt möjlig att uppnå också låg.
- Det blir svårare att tolka förändringar i testpoäng, och konfidensintervallen blir bredare.
- Reliabiliteten kan användas för att förbättra testet genom att identifiera problematiska items.
vad för olika empiriska reliabiliter finns?
•Parallella tester
–Om två tester mäter samma sak, och har samma felvarians, kan vi använda korrelationen mellan dem som ett mått på reliabilitet.
•Test-retestreliabilitet
–Vi gör samma test två gånger på samma personer och korrelerar resultaten från omgång 1 med omgång 2.
- Problem: ändrade omständigheter, inlärningseffekter m.m.
- Interbedömarreliabilitet
–Vi låter två oberoende bedömare bedöma samma testprestation och korrelerar deras bedömningar.
•Split half-reliabilitet
–Vi delar alla items i testet i två slumpvisa grupper, och låtsas att det är två olika tester. Sen korrelerar vi dem mot varandra.
•Cronbachs alfa
–Vanligaste reliabilitetsmåttet.
–Beräknas utifrån hur varje item samvarierar med varje annat item. Krångligt att räkna ut om man inte har dator.
–Har blivit kritiserat en del i psykometrisk metodlitteratur.
vad är itemsvårighet?
koppla till skurkar!
- Två items som mäter samma egenskap kan vara bra på att mäta olika grader av egenskapen. Vi säger att de är olika svåra.
- En person som har mycket av egenskapen vi mäter säger vi har en hög förmåga.
- Sannolikheten att svara poänggivande på itemet ”Jag bär vapen ibland”. (De allra flesta actionfigurer, både onda (Darth Vader, Vita häxan, Sauron) och goda (Luke Skywalker, Harry Potter, Kenny Starfighter) bär faktiskt vapen. Frågan är värdefull för att skilja ut jättesnälla (som Pippi) från övriga, men inte så mycket mer.
Detta medan frågan “har du sprängt en planet” är mycket mer rakt ond.
vad är validitet?
olika typer av de!
- Validitet avser till vilken grad det finns stöd för att resultatet på ett test kan tolkas på det sätt som det avses.
- Validiteten beskrivs ibland som att testet verkligen ”mäter det som det ska”.
Olika
- Begreppsvaliditet: är egenskapen vi vill mäta verkligen giltig?
- Innehållsvaliditet: Ingår alla relevanta delar av begreppet vi vill mäta i testet?
- Kriterievaliditet: Får personer som borde ha olika resultat på testet verkligen det?
- Uppenbar validitet: Verkar testet mäta det som det avser att mäta när man tittar på uppgifterna?
vad är begreppsvaliditet? och innehållsvaliditet?
Begreppsvaliditet•Mäts ofta genom att man korrelerar testet till resultatet på andra tester som antingen mäter samma egenskap, eller mäter egenskaper som enligt teorin borde samvariera med den avsedda egenskapen på ett tänkt sätt.
Innehållsvaliditet
- Bedöms ofta av expertgrupper eller liknande, som granskar innehållet i items.
- Målet är att:
–Alla aspekter av den mätta egenskapen ska fångas upp av testet.
–Testet ska inte fånga upp irrelevanta egenskaper.
–Ingen aspekt ska tillmätas orimligt stor eller liten betydelse.