3 Validita, reliabilita a chyba merania Flashcards
X=T+e
T- true score – skutočné skóre
X – raw score - hrubé skóre
E – error – chybové skóre (náhodné)
- Priemer chybových skóre je nulový
- Korelácia medzi pravým a chybovým skóre je nulová
- Korelácie medzi chybami paralelných testov je nulová
Reliabilita
- Reliabilita vypovedá do akej miery je výsledok meranie určitej
vlastnosti (IQ, miera depresie, prosociálne správanie) zaťažený
chybou. - Reliabilita vypovedá o vzťahu medzi pravými skóre k rozptylu
testových skóre
(Ritomský, 2012)
Reliabilita zodpovedá konzistencii skóre získaných od rovnakej osoby,
keď je opakovane testovaná rovnakým testom v dvoch rôznych
situáciách alebo súborom ekvivalentných položiek (Anastasi & Urbina,
1997).
Empirické overenie reliability
Prečo je nevyhnutné, aby bol test reliabilný?
- Paralelné formy Vnútorná konzistencia (Split half)
- Test – retest
- Zhoda posudzovateľov
Paralelné testy
- Testy, ktoré obsahujú dve formy
- Napríklad Test inteletového potenciálu od Říčana, alebo Eysenckove
osobnostné dotazníky - X1=T+E1
- X2=T+E2
- T1=T2=T
- Testy by mali mať rovnaké chybové rozptyly.
- Merajú obidve verzie naozaj rovnaké psychologické konštrukty?
- Overenie prostrednícvom korelačného koeficientu.
Vnútorná konzistencia
- Cronbachova alfa
- Korelácie položiek medzi sebou – inter-item
- Korelácia položky so zvyškom testu – item-total
- Meria test, ktorý používam len jeden konštrukt/schopnosť. Ako
potom interpretovať výsledky testu
pojebaný vzorec
Musia mať všetky testy vysokú test- retest
reliability?
- Kedy to nie je želené?
Zhoda posudzovateľov – Inter-rater reliabilita
? nejaké tabuľky
Zdroje chybovej variancie pri rôznych typoch
reliability
- Test – retest – Čas
- Alternatívne formy – Obsah testu
- Split - half – Obsah testu
Nakoľko sú výsledky psychodiagnostiky
presné?
- Od čoho všetkého to závisí?
- Reliabilita
- Validita
- Normy!!!
- Examináto
r - Typy noriem – IQ – deviačné skóre, T skóre, Z skóre, Percentilové normy,
Steny, Staníny a pod. - Dôsledky rozhodnutí na základe výsledkov testov – PDW, Stroopov test –
informácie v príručke a aktuálne výskumy
Reliabilita a Štandardná chyba merania
- Štandardná chyba merania
SEM= s𝑑 √1-r
(odmocnica nad 1 aj r) - SEM – štd. chyba merania; sd – štd. odchýlka; r – reliabilita testu
- Koeficient reliability, však priamo nehovorí o veľkosti chyby merania.
Veľkosť chyby merania je užitočná v interpretácii presnosti testových
skóre. - Skontrolujte si, či príručky k testom, ktoré používate obsahujú aj tento
údaj
Gaussova krivka – Normálne rozloženie
- Ako v diagnostike interpretujete výsledky napríklad WAIS-III?
- Ako pravdepodobnosť, alebo ako zaradenie do „výkonnostnej
skupiny“?
Nakoľko si môžem byť istý/á svojím
rozhodnutím
- Vo viacerých publikáciách sa odporúča uviesť v správach aj intervaly
spoľahlivosti (napr. 95%), v ktorých sa pravdepodobne skutočné skóre
nachádza. - SEM
- Presnosť merania naprieč distribúciou
- Merajú psychologické testy všetky skupiny rovnako presne?
- Akú validitu majú moje závery ak používam nereliabilné testy bez
noriem (so starými normami)?
Validita
- Samotný koncept validity prešiel v priebehu posledných 60 rokov výraznými
zmenami, ktoré sa odzrkadlili a pretavili do súčasného chápania tohto
konceptu, ktorý sa zmenil od chápania validity ako ukazovateľa testu (test
meria to, čo má merať) - Dnes sa na validitu nazerá ako na mieru, do akej empirické
poznatky/dôkazy a teória podporujú konkrétnu interpretáciu testových
skóre pri doporučenom spôsobe používania testu (AERA, APA, & NCME,
2014). - Validita v tomto poňatí teda nie je vlastnosť testu, ale charakteristika
významu, ktorý pripíšeme testovému skóre alebo aj výsledkom výskumu.
Podľa Zumba a Chana (2014, s. 9) validita vypovedá o kvalite záverov, hypotéz, tvrdení, rozhodnutí, ktoré vznikli na základe skóre v teste
Problémy súvisiace s validitou
- Nedostatočná reprezentácia konštruktu
- Variabilita irelevantná vzhľadom k meranému konštruktu
Typy validity alebo je len jedna validita?
- Napriek tomu, že v štandardoch pre testovanie je validita chápaná ako
jednotiaci konštrukt (existuje len jedna validita) a jednotlivé typy
validity skôr predstavujú spôsoby a postupy, akým môžu byť
akumulované poznatky o validite -
Normatívna interpretácia – porovnávanie výkonu testovanej osoby s
výkonom v referenčnej populácii. -
Kriteriálna interpretácia – Kritické skóre na stupnici (napríklad
MMSE) – rozdiel v interpretácii skóre nad a pod kritickou hodnotou –
existuje rozdiel vo funkčnej úrovni.