H3 Flashcards

1
Q

Gestandaardiseerde maten:

A
  • Ontwikkeld en gestandaardiseerd op gedefinieerde populaties
  • Vaak multiple-item vragenlijsten en cognitieve tests
  • Normatieve gegevens
    • Vastgesteld aan de hand van groot aantal mensen
    • Statistieken verdeling, gemiddelde, standaarddeviatie, bereik, betrouwbaarheid
    • Vaak weergeven in opzoektabellen achterin handleidingen
    • Meervoudige regressie
      § Bevat belangrijkste normcriteria
      § Voorspelde normatieve waarde op test en afwijking van voorspelde waarden
  • Zijn uiterst waardevol bij het beoordelen van verandering in afzonderlijke gevallen
  • Hiermee verwijzen naar bredere bevolking
  • Voordeel: Ontwikkelen normen
    • Daardoor bepalen of de eventuele verandering in gedrag tijdens een interventie alleen komt door ‘measurement error’ of dat deze verandering groter is dan dat
    • Kan helpen om de betekenis van de scores van een test te bepalen
    • Gemakkelijker uitsluiten dat verandering in gedrag wordt veroorzaakt door meetfouten
  • Langere testen, vaak in voor- en nameting
  • Betrouwbaarheid vaak goed, maar afvragen of het wel valide is
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Grondbeginselen gestandaardiseerde maten (2)

A
  • Instructies/protocol volgen, anders systematische fouten en verminderde validiteit
  • Expliciete instructie, zodat respondenten vragenlijst goed begrijpen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Normaalverdeling

A
  • Symmetrisch rond het gemiddelde
  • Gemiddelde, modus en mediaan allemaal zelfde waarde, dit ‘verkleint’ aan weerszijden van het gemiddelde
  • Positie van individu gemakkelijk vergelijken met z-scores
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

z-score & voordelen (4)

A
  • Aantal standaarddeviaties die een waarneming van het gemiddelde afligt
  • 0= Waarneming hetzelfde als het gemiddelde
  • Positieve z-score: de waarneming ligt boven het gemiddelde, bij negatieve score ligt het eronder
  • Bij (-)3 standaarddeviaties, dan is het een uitschieter
  • 95% waarnemingen ±1.96
  • Voordelen
    § Gestandaardiseerd: onafhankelijk van meetschaal
    § Kan je waardes met elkaar vergelijken met verschillende schalen
    § Kijken hoe extreem een waarneming is
    § Gemakkelijk om te zetten naar andere schalen (zoals IQ-schaal)
  • z=(x−x ̅)/s
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Omzetten nieuwe scores (Converted/aangepaste/getransformeerde score)

A

§ nieuwe score=z∗sd+x ̅
§ Z-score heeft een gemiddelde van 0 en een standaarddeviatie van 1. Dit is om te zetten in een eigen score
§ T-score: Gemiddelde 50, standaarddeviatie 10
§ IQ-score: Gemiddelde 100, standaarddeviatie 15
§ M-score: Gemiddelde 10, standaarddeviatie 3

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Klassieke test theorie: (X=T+E) & assumpties (2)

A
  • Meettheorie voor analyseren-ontwikkelen van testen
  • Traditionele theorie met lange geschiedenis
  • Geobserveerde score bestaat uit ware- & error score
  • Fundamentele assumpties klassieke theorie

1) De testscore wordt bepaald door de betrouwbare score en de meetfout (Xo=Xt+Xe)
* Betrouwbare score & meetfout zijn niet observeerbaar
* Gemiddelde testscore komt overeen met gemiddelde betrouwbare score (X ̅o=X ̅t)

2) De meetfout komt random voor (Xe=0 & Rte=0 & Ree=0)
* Meetfout die score betrouwbare score omhoog en omlaag kunnen halen
* Meetfout heeft de neiging zichzelf op te heffen over alle respondenten/middelt uit (X ̅e=0)
* Meetfout correleert niet met betrouwbare score (Rte=0)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Fundamentele concepten klassieke theorie (3)

A

1) Test/ruwe/waargenomen score (observed score) (Xo)
* Waarde verkregen uit de meting
* Testscore= Betrouwbare score + meetfout
* Enige score die we kunnen weten
* Hopen dat dit zoveel mogelijk afhangt van de betrouwbare score
* Variantie Xo = Variantie Xt + Variantie Xe

2) Betrouwbare score (true score) (Xt) –> systematisch deel
* Het daadwerkelijke niveau van het attribuut dat wordt gemeten
* Alles heeft een betrouwbare score
* Als er geen meetfout bij zit
* Gemiddelde score als een meting oneindig vaak wordt afgenomen
* Bevat ook systematische fouten (niet valide)
* Verwachte testscore van respondent
* Blijft constant bij replicaties

3) Meetfout (measurement error) (Xe)
a. (Systematische fout)
b. Willekeurige fout
- Gemiddelde van alle willekeurige fouten is 0
- Zijn onafhankelijk van werkelijke score
- Constante variantie van alle scores
- Normaal verdeeld
- Ruis

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Betrouwbaarheid

A
  • Mate waarin testscores gelijk blijven wanneer test tweemaal of vaker onder gelijkblijvende condities aan dezelfde persoon wordt voorgelegd (maat van precisie)
  • Rxx=(variance true)/(variance (observed))
  • Rxx=(variance (true))/(variance (true)+variance (error))
  • Tussen 0 (niet betrouwbaar) en 1 (perfect)
  • Als error 0 is, dan betrouwbaarheid perfect (1)
  • Betrouwbaarheid voorwaarde voor validiteit
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Betrouwbaarheid

A
  • Mate waarin testscores gelijk blijven wanneer test tweemaal of vaker onder gelijkblijvende condities aan dezelfde persoon wordt voorgelegd (maat van precisie)
  • Rxx=(variance true)/(variance (observed))=(variance (true))/(variance (true)+variance (error))
  • Tussen 0 (niet betrouwbaar) en 1 (perfect)
  • Als error 0 is, dan betrouwbaarheid perfect (1)
  • Betrouwbaarheid voorwaarde voor validiteit
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Betrouwbaarheid gebruiken bij (4)

A

1) Individuele diagnostiek
* significant verschil met criterium
* Significant verschil tussen 2 participanten

2) Onderzoek naar samenhang
§ Geeft bovengrens validiteit aan
§ Regressie
§ Correlatie

3) Onderzoek verschil in gemiddelde tussen groepen
* T-toets

4) Herhaalde metingen binnen personen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Methodes voor schatten van betrouwbaarheid: (3/3)

A

1) Paralleltestbetrouwbaarheid (alternate forms method)
* Stappen:
a) Neem 2 parallelle testen af
b) Bereken de correlatie tussen de 2 testscores
c) Correlatie=betrouwbaarheidschatting
* Vaak gebruikt bij speedtesten

2) Test-hertestbetrouwbaarheid
* Dezelfde test tweemaal afnamen
* Moment ertussen kan sterk variëren
* Stappen
a) Neem dezelfde test af op 2 verschillende momenten
b) Bereken de correlatie tussen de 2 testscores
c) Correlatie=betrouwbaarheidschatting
* Werkt wel bij medische dingen, zoals bloeddruk. Of juist om ontwikkeling te zien
* Wordt wel vaak gebruikt, maar meer index voor stabiliteit dan een schatter voor betrouwbaarheid (ontwikkeling zien)

3) Interne-consistentie betrouwbaarheid
* 1 test, verdeeld in subsets
* Mogelijk probleem: Carryover effects
* Zegt niks over dimensies, alleen hoe nauwkeurig het gemeten is
* Zijn ondergrenzen van betrouwbaarheid

A) Splitsingsbetrouwbaarheid
- Stappen
a) Splitst test in 2 subtesten (bijv. even en oneven items)
b) Bereken correlatie tussen twee subtesten
c) Betrouwbaarheidsschatting met Spearman-Brown splitsingsformule
- rhh= correlatie tussen 2 helften
- Wordt weinig gebruikt, want er zijn betere schatters

B) Cronbachs alfa (α)
- Meest gebruikte methode
- Item-level benadering: Correlatie tussen alle items gebruikt voor betrouwbaarheid schatting
- Elk item als subtest
- Kan gebruikt worden voor betrouwbaarheidsinterval
- Weinig inspanning
- Alfa kan negatief zijn, maar dan is er iets mis gegaan
- ‘De betrouwbaarheid werd geschat met Cronachs alfa’
- α≤R_xx (behalve soms bij (kleine) steekproeven dan α>R_xx)
- Hoe hoger r ̅, hoe hoger α
- Hoe hoger N, hoe meer variantie meetfouten

C) Gestandaardiseerde alfa
- Gebruikt als testscores worden gestandaardiseerd (z-score), voordat ze worden opgeteld/gemiddelde wordt berekend (bij standaardscores gem. 0, standaarddeviatie 1)
- Als bijvoorbeeld varianties dramatisch van elkaar verschillen
- Betrouwbaarheidsschatting (cronbachs alfa)
- Word afgeraden, vanwege ongelijke antwoordcategorieën

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Mogelijke problemen Paralleltestbetrouwbaarheid (5)

A

a) Ongelijke ware scores, omdat ze net iets verschillen in doel
b) Overdrachtseffecten (carryover effects), omdat eerste test invloed heeft op tweede test
c) Nooit met zekerheid kunnen zeggen of ze volledig parallel zijn
d) Er zijn (vrijwel) geen parallelle tests
e) Lastig en intensief 2 testafnames

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Mogelijke problemen Test-hertestbetrouwbaarheid (3)

A

a) Ongelijke ware scores, door groei participant –> Lage betrouwbaarheid, behalve voor niet veranderende constructen (intelligentie)

b) Overdrachtseffecten (carryover effects), vooral als ze redelijk vlak achter elkaar worden afgenomen

c) Moeite om respondenten twee keer te laten deelnemen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Mogelijke problemen splitsingsbetrouwbaarheid (3)

A

a) Betrouwbaarheid alleen accuraat als subtesten parallel zijn (gelijke betrouwbare scores en foutvarianties)

b) Manieren van splitsen is willekeurig en kan leiden tot verschillende betrouwbaarheidsschattingen

c) Je schat de betrouwbaarheid voor de helft, niet voor de gehele test

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Spearman-Brownformule

A
  • Testverlenging Morley
  • Manier om betrouwbaarheid van de testlengte in te schatten
  • Voorspelt de betrouwbaarheid van een herziende test
  • n= hoeveel keer zo lang de test is geworden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Standaardmeetfout

A
  • Maat van meetprecisie van een testscore
  • Spreiding (SD) als je 1 observatie hebt
  • SEM=SD√(1−r)
  • Als betrouwbaarheid toeneemt, dan neemt standaardfout af
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Betrouwbaarheidsinterval

A
  • Als we de betrouwbaarheid en standaarddeviatie van een test kennen, dan bepalen binnen welk bereik het ‘juiste’ antwoord waarschijnlijk zal vallen. Dit omvat het berekenen van de standaardmeetfout (SEM) om betrouwbaarheidsintervallen (CI) rond een bepaalde waarneming in te stellen
  • Geldt voor 1 individu
  • Tweezijdig toetsen
  • Betrouwbaarheidsinterval 95%: X ̅ ±1.96(SEM)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Jacobson’s Reliable Change Index (RCI)

A

95%-betrouwbaarheidsinterval rond de baselinescore

RCI=(pre−treatment score − post−treatment score) /SE_diff

19
Q

Clinically significant change (CSC)

A
  • Klinisch significant
    • Het kan wel statistisch relevant zijn, maar als het ‘probleem’ voor persoon verholpen is dan pas klinisch significant
  • Geeft verdeling van scores van klinische groep en niet-klinische contrastgroep (referentiegroep) weer
  • Cutscore vraagt enig denkwerk
20
Q

Criteria Clinically Significant Change (CSC) (3)

A

a. Criteria a
- De cut-score zo bepaald dat functionele scores na therapie buiten bereik van disfunctionele populatie moeten vallen, gedefinieerd als het uiterste einde van de disfunctionele verdeling, meer dan 2 standaarddeviaties in de richting van de normale referentiegroep
- 2 SD meer conservatief dan 1.96
- Kiezen voor a: Bij veel overlap
§ Je wil weten of iemand verbeterd is
- Bepalen aan de hand van disfunctionele klinische groep (zit in staart van klinische groep)
- Als je voldoet: Uitkomstmaat buiten klinische range
- Criterium B is niet sterk genoeg
- Piekeren: Milde symptomen en veel overlap.

b. Criterium b
- Functioneringsniveau moet binnen het bereik van niet-disfunctionele groep vallen
- Cut-score zo bepaald dat score na therapie binnen bereik functionele populatie vallen, met uiterste einde functionele groep in richting disfunctionele groep
- Criterium score op nameting in de range van de non-klinische groep moet vallen om te spreken van een klinisch significant effect
- Kiezen voor b: Bij heel weinig over overlap
- Bepalen aan de hand van functionele groep (zit in staart van niet-klinische groep)
- Als je voldoet: Binnen niet-klinische range
- PTSS-problemen: 1 groep heeft er last van en 1 grote groep niet. Weinig overlap in symptomen. Je wil functioneren om niet-klinisch (functioneel niveau)

c. Criterium c
- Cliënt dichter bij het gemiddelde van de functionele groep zou plaatsen dan bij het gemiddelde van de disfunctionele groep
- Komt meeste voor
- Kiezen voor c: Als groepen enige overlap hebben (helft beide groepen)
- Bepaald op basis van disfunctionele (klinische) en niet-klinische groep
- Als je voldoet: Beter bij niet-klinische range dan bij klinische
- Slaapproblemen: heeft iedereen wel eens last van

21
Q

Target measure:

A
  • Dicht bij wat je wil meten (idiografisch)
  • Herhaald meten
  • Gemakkelijke/korte test
  • Validiteit vaak goed, maar betrouwbaarheid goed in de gaten houden
22
Q

Meta-analyse:

A
  • Vereist technische kennis
  • Fixed effect model
    • Gaat ervan uit dat eventuele verschillen tussen steekproeven het gevolg zijn van steekproeffouten
    • Zonder enige steekproeffout zouden de schattingen van elk onderzoek exact hetzelfde zijn
    • X^2−verdeling, met vrijheidsgraden (k): N-1
  • Random effect model
    • Gaat ervan uit dat variatie in schattingen tussen steekproeven bestaat uit steekproeffout en andere willekeurige effecten die variëren tussen steekproeven en die kunnen worden verklaard door verschillen in andere parameters, bijv. percentage mannen, leeftijd en rekruteringsbron (kliniek, gemeenschap)
  • De artikelen moeten gemiddelden (M), standaarddeviaties (SD) en steekproefomvang (n) en betrouwbaarheidscoëfficiënten rapporteren: testhertest (r) of bij voorkeur Cronbach’s alpha (a).
23
Q

Kiezen modellen vaste en willekeurige effecten

A

1 Vaste effecten
- Brute emirie
- Priori-hypothese
- Fixed-effect model
- Kiezen als alle onderzoeken die in de analyse zijn opgenomen, equivalent zijn
- Gemeenschappelijke effectgrootte willen schatten voor een voorgeschreven populatie, en wat nog belangrijker is, we niet willen generaliseren naar andere populaties
- Bij bijv. meerdere herhalingen hebben van een onderzoek met steekproeven uit dezelfde populatie

2 Willekeurige effecten
- Random effect model
- Bij verschillende onderzoeken
- Verschillen kunnen gegevens beïnvloeden, waardoor geen gemeenschappelijke effectgrootte

24
Q

Manieren van observeren (4)

A

1 Real-time recording
- Waarnemer noteert begin en einde gebeurtenis die van belang is in bepaalde tijdsperiode
- Doel: ononderbroken stroom van gedrag vastleggen
- Oorzakelijk verband achterhalen
- Tijdlijn creëeren
- Nadelen
* Kostbaar
* Vereist apparatuur en gespecialiseerde software
* Vermoeiend voor waarnemers
- Wordt zelden gebruikt in onderzoeken naar behandelresultaat, behalve in beginfase waarin het probleem zich voordoet worden afgebakend en gedefinieerd

2 Event recording
- Geïnteresseerd in frequentie van gedrag gedurende bepaalde periode
- Tellen aantal keren doelgedrag binnen bepaalde observatieperiode voorkomt
- Gebruik intra klasse correlatiecoëfficiënt
- Relatief eenvoudig en minimale apparatuur
- Doel: Frequentie van gedrag in bepaalde tijd
- Nadelen:
* Moeilijk om bronnen overeenstemming en onenigheid te bepalen (overlap van gedrag)
* Waarnemers voortdurend aandacht bij individu (vermoeiend)
* Vereist meerdere sessies om betrouwbaarheidscoëfficiënt te berekenen

3 Momentary time/scan sampling
- Observatoren worden gehint (meestal door elektronische timer) om een enkele observatie te doen en noteren of bepaald gedrag wel of niet voordoet op dat moment
- Met timer kijken of het op dat moment wel of niet voorkomt
- Ja/nee antwoord
- Flexibele methode
- Kan worden toegepast op situaties waarin meerdere gedragingen/individuen moeten worden geobserveerd
- Bepalen hoe vaak observeren

4 Partial interval recording
- Komt gedrag voor in bepaald interval
- Observatieschema opgesplitst in perioden van observatie/registratie
- Bepaalde tijd, bijv. 10s, observeren
- Schatting van aandeel (percentage) van registratie-intervallen waarin doelgedrag aanwezig is
- Niet registeren frequentie of duur, anders real-time of event-sampling

25
Factoren die observaties kunnen beïnvloeden (alternatieve oorzaken): (3)
* Reactiviteit - Vindt plaats wanneer cliënt zich ervan bewust is dat hij wordt geobserveerd en zijn gedrag dienovereenkomstig aanpast - Sociaal gewenst gedrag - Leidt tot onderschatting probleem - Gebeurt sneller als waarnemers opvallen of nieuw zijn - Reageren als iemand aanwezig is - Na loop van tijd wordt dit vaak minder * Observer drift - Bedreiging validiteit door instrumentatie - Tijdens observeren gedurende meerdere sessies consistentie van waarnemer kan veranderen - Goed geheugen waarnemers tussendoor opfrissen * Waarnemersmoeheid (observer fatique) - Tegengaan door niet te lange observatiesessies
26
Nomological net
Theoretisch netwerk van associaties afgeleid van theorie en gesteld op abstract niveau. Startpunt voor operational defenitions
27
Construct validiteit & Onderdelen (2/2)
* Centrale pijler meetvaliditeit * Mate waarin een meting het construct beoordeelt dat het geacht wordt te meten * Construct vaak niet direct waarneembaar Onderdelen constructvaliditeit: 1) Content validiteit (inhoudsvaliditeit) - Mate waarin items in een meting het volledige bereik vertegenwoordigen van het construct dat men probeert te beoordelen - Relevante aspecten van construct vastleggen - In termen van theorie - Wordt construct in de gehele breedte gepresenteerd? - Alle gedragingen en alle gedachten die bij het construct horen in kaart te brengen. Te definiëren. 2) Criterium validiteit - Mate waarin er een verband is - Waarin maatregel betrekking heeft op specifiek criterium - In termen van empirie - Relatie met relevante uitkomst - Gaat niet om de meting zelf, maar om het verband met andere variabele. - Een variabele die theoretisch een verband zou moeten hebben. - Betekent niet dat de voorspellende scores nauwkeurig weerspiegeld zijn met het bedoelde construct - Instrument voorspelt relevante eigenschap, maar niet per se het bedoelde construct --> Criterium is ook imperfecte meting van het construct - Soorten: a) Predictieve validiteit (toekomst) § Of de relevante andere uitkomst in de toekomst ligt § Is wat je nu hebt gaat gebruiken om wat er in de toekomst gaat gebeuren. § Vergelijking over jaren heen § Citotoets. Je gebruikt die toets om het niveau te voorspellen van de middelbare school b) Concurrent validiteit (tegelijkertijd/gelijktijdig) § Meting die je tegelijkertijd doet § Dat je meet met iets wat vergelijkbaar is met wat je meet. § Hoeft nooit precies hetzelfde te zijn § Dyslexiediagnose. Je kijkt of iemand hoog scoort tijdens die screener, is dat zo dan ga je het verder onderzoeken.
28
Beoordeling van overeenstemming tussen waarnemers, stappenplan (4)
* Niet altijd mogelijk vanwege hoge eisen * Om fouten te beheersen, stappenplan: - Ontwikkelen direct observatieprotocol in eerste consultatie met betrokkenen - Informele observatie voor probleemverkenning en haalbaarheid doen observatie beoordelen - Zorgvuldige definitie beoogde gedrag opgesteld met kenmerken - Opleiden om schema te gebruiken
29
Stappen directe waarneming (8)
1) Zorg voor voorlopige gedragsbeschrijving voor cliënt, verzorgers en relevante anderen § Wat is het gedrag, hoe vaak/wanneer/waar komt het voor § Verkrijg pilootobservatie door directe of video-opname. 2) Definieer het doelgedrag § Definitie moet verwijzen naar waarneembaar gedrag dat duidelijk, ondubbelzinnig, uitputtend en begrensd is, zodat waarnemer onderscheid kan maken tussen verschillende gedragingen 3) Schrijf codeboek met daarin definitie en voorbeelden. 4) Bepaal waarnemingsstrategie, bijvoorbeeld vastleggen gebeurtenissen of tijdsbemonstering procedure 5) Train waarnemers: § Codeboek uit hoofd leren § Oefenen met coderen op voorbeelden – video-opnamen van het gedrag zijn hier nuttig. 6) Selecteer instelling waar de waarnemingen zullen plaatsvinden en beslis wanneer te observeren 7) Voer proefsessies uit voor verdere training en om waarnemers aan omgeving te wennen 8) Voer observaties uit
30
Overeenkomsten berekenen interbeoordelaarsbetrouwbaarheid mogelijkheden (4)
a. Proportie keren dat waarnemers het eens waren dat gedrag aanwezig was b. Proportie niet eensgezind c. Proportie niet eensgezind d. Proportiekeren dat waarnemers het eens waren dat gedrag afwezig was
31
Overeenstemmingscoëfficiënt
- Verhouding tussen het aantal keren dat de beoordelaars het eens waren (a + d) en het totale aantal waarnemingen (a + b + c + d) - Overall agreement=(a+d)/(a+b+c+d) - Positive agreement=a/(a+b+c) - Negative agreement=d/(b+c+d) - Voordeel: Gemakkelijk en snel te berekenen; betekenis is snel duidelijk - Nadeel: Misleidend, door toeval (bij binaire beslissing, is de kans 25% dat beide observatoren hetzelfde zeggen) - Rekening houden met kans op overeenstemming
32
Cohen's Kappa overeenstemmingscoëfficiënt
* Ontwikkeld voor het geval waarin twee waarnemers binaire beslissingen nemen * K=(Po−Pc)/(1−Pc ) § Po=Proportie overall agreement § Pc=(P1∗P2 )+(q1∗q2 ) (q_1∗q_2 ) (proportie gebaseerd op kans) P1= (Observator 1, wel aanwezig)/totaal P2= (Observator 2, wel aanwezig)/totaal Q1= (Observator 1, niet aanwezig)/totaal Q2= (Observator 2, niet aanwezig)/totaal * K=(Fa−Ea)/(1−Ea ) § F_a=Som observaties diagonaal § E_a=Som van diagonaal indien tijen en kolommen onafhankelijk zijn;(product randtotalen)/n) - Loopt van -1 tot 1 (perfect) § .00-.20: Geringe overeenstemming § .21-.40: Redelijke overeenstemming § .41-.60: Matige overeenstemming § .61-.80: Substantiële overeenstemming § >.80: Bijna perfecte overeenstemming
33
Intra-klasse correlatiecoëfficiënt (ICC) & Soorten (3)
* Maat overeenstemming tussen beoordelaars op kwantitatieve variabelen * Bijvoorbeeld aantal of duur * Gemakkelijk te interpreteren * Soorten 1) Model 1 - One-way random effects-model - Elke sessie verschillende beoordelaars - Niet toepasbaar in single-case onderzoek 2) Model 2 - Two-way random effects-model - Zelfde groep waarnemers in grote populatie waaruit wordt geselecteerd - Willekeurige beoordelaars 3) Model 3 - Two-way mixed effect model - Zelfde waarnemers beoordelen alle sessies
34
Overwegingen voor berekening ICC (2)
a) Consistent: - In hoeverre komt de rangorde van de scores met elkaar overeen - Alleen willen weten of waarnemers de sessies in dezelfde volgorde beoordelen - Bij selecteren 10 besten b) Absoluut: - In hoeverre komen absolute scores met elkaar overeen - Geïnteresseerd in de vraag of de beoordelaars het met elkaar eens zijn (zoals bij single case) - Zelfde gegevens observanten - Vaak meest relevant
35
Methoden persoonlijke vragenlijsten (3)
1) Bij 'Idiographic measurement' * Interbeoordelaars betrouwbaarheid * Meerdere beoordelaars 2) 'Shapiro's personal questionnaire' * PQ (personal questionnaire) * Gebaseerd op specifieke klachten op basis van onderlinge afstemming * In overleg besluiten welke uitspraken relevant zijn * Betrouwbaarheid kan worden geschat * Cliënt bepaalt inhoud items (statements) * Voordelen: - Hoge validiteit - Betrouwbaarheid bepalen mogelijk * Scoren - Ziekte (iii) VS verbetering (ii) - Herstel (iii) VS verbetering (i) - Herstel (ii) VS verbetering (i) * Betekenis: - Q2 iii/ii ziekteverklaring bovenaan, verbeteringsverklaring onderaan - i pr ii: cliënt i boven ii verkiest als de betere beschrijving van hun huidige toestand: ze kiezen i (herstel) boven ii (verbetering) 3) 'Phillips's personal questionnaire' * Probleemgedrag wordt gemeten door cliënten stellingen op verschillende niveaus van het probleemgedrag te laten vergelijken met hun eigen staat. * PQ (personal questionnaire) * Beter (B) of slechter (W) aangeven * Aantal W's optellen voor score item * Betrouwbaarheid bepalen
36
Voorbereidingsfasen 'Shapiro's personal questionnaire'
1) Interview clinicus-onderzoeker van cliënt om uitspraken te verkrijgen over leed - Essentiële klachten vastleggen - 2 uitspraken ziekteverklaringen (Q1 & Q2) 2) Ontwikkelen van 2 andere uitspraken - Herstelverklaring: Eindpunt behandeling - Verbeterverklaring: Halverwege ziekte- en herstelverklaring in 3) Stellingen met combineren van uitspraken voor elke vraag i. Herstel (recovery) ii. Verbetering (improbement) iii. Ziekte (illness) 4) Presenteren aan cliënt en deze laten sorteren - Dichtst bij huidige status - TOP en BOTTEM stapels - Cliënt steeds laten kiezen
37
Real-time recording
- Waarnemer noteert begin en einde gebeurtenis die van belang is in bepaalde tijdsperiode - Doel: ononderbroken stroom van gedrag vastleggen - Oorzakelijk verband achterhalen - Tijdlijn creëeren - Nadelen * Kostbaar * Vereist apparatuur en gespecialiseerde software * Vermoeiend voor waarnemers - Wordt zelden gebruikt in onderzoeken naar behandelresultaat, behalve in beginfase waarin het probleem zich voordoet worden afgebakend en gedefinieerd
38
Event recording & Nadelen (3)
- Geïnteresseerd in frequentie van gedrag gedurende bepaalde periode - Tellen aantal keren doelgedrag binnen bepaalde observatieperiode voorkomt - Gebruik intra klasse correlatiecoëfficiënt - Relatief eenvoudig en minimale apparatuur - Doel: Frequentie van gedrag in bepaalde tijd - Nadelen: * Moeilijk om bronnen overeenstemming en onenigheid te bepalen (overlap van gedrag) * Waarnemers voortdurend aandacht bij individu (vermoeiend) * Vereist meerdere sessies om betrouwbaarheidscoëfficiënt te berekenen
39
Momentary time/scan sampling
- Met timer kijken of het op dat moment wel of niet voorkomt - Ja/nee antwoord - Flexibele methode - Kan worden toegepast op situaties waarin meerdere gedragingen/individuen moeten worden geobserveerd - Bepalen hoe vaak observeren
40
Partial interval recording
- Komt gedrag voor in bepaald interval - Observatieschema opgesplitst in perioden van observatie/registratie - Bepaalde tijd, bijv. 10s, observeren - Schatting van aandeel (percentage) van registratie-intervallen waarin doelgedrag aanwezig is - Niet registeren frequentie of duur, anders real-time of event-sampling
41
Meta-analyse: Stappen (4)
1) Uitgebreid literatuuronderzoek 2) Bepalen welke onderzoeken opgenomen moeten worden 3) Extraheer relevante gegevens 4) Bereken effectgrootte
42
Meta-analyse: Rekening houden met (3)
1) Gebruik van een fixed of random effect-model 2) Hoe de gewichten voor elke waarneming te verkrijgen 3) Wanneer we afzonderlijke analyses moeten uitvoeren voor verschillende soorten monsters
43
Betrouwbaarheid getallen (5)
§ .00-.20: Geringe overeenstemming (slight) § .21-.40: Redelijke overeenstemming (fair) § .41-.60: Matige overeenstemming (moderate) § .61-.80: Substantiële overeenstemming § >.80: Bijna perfecte overeenstemming