thema 1 Flashcards

Question 1

Q

experimenteren:

de enige manier om causaliteit te toetsen, is nodig om validiteitsbedreigers onder controle te houden.

Answer

A

Experimenteren kunnen we omschrijven als een gecontroleerde methode van waarnemen waarbij de waarde van een of meer onafhankelijke variabelen/de predictor (bijvoorbeeld informatieverschaffing) door de onderzoeker worden gemanipuleerd (het al dan niet laten zien van een voorlichtingsfilm) met het oogmerk het oorzakelijke of causale effect daarvan vast te stellen op één of meer afhankelijke variabelen (bijvoorbeeld het rook-, eet-, werk- of rijgedrag). Experimenteren verwijst niet zozeer naar een plaats waar experimenten plaatsvinden zoals een laboratorium, werkplaats of veld, maar naar de logica van de daarbij gehanteerde procedure.

Bij experimenteel onderzoek gaat het om een door de onderzoeker gecreëerde situatie, die een min of meer kunstmatig karakter heeft. Daarin heeft de onderzoeker controle over wie er deelnemen aan het experiment, wat er precies gebeurt tijdens het experiment en onder welke omstandigheden dat gebeurt. De onderzoeker manipuleert de onafhankelijke variabele (informatieverschaffing), ook wel de experimentele of oorzaakvariabele genoemd, door een bepaalde categorie mensen bloot te stellen aan een experimentele stimulus of experimentele ingreep (de voorlichtingsfilm) en een andere categorie mensen daar niet aan bloot te stellen. Door deze manipulatie kan de onderzoeker nagaan of en zo ja, in welke mate de onafhankelijke variabele (het beoogde) effect heeft op de afhankelijke variabele: het gedrag of houdingen van de deelnemers (rook-, eet-, werk- of rijgedrag). Hij kan vaststellen of er een causaal verband is tussen de onafhankelijke en afhankelijke variabele.

Question 2

Q

causaliteit

Answer

A

Het begrip ‘causaliteit’ speelt dus een belangrijke rol bij experimenteel onderzoek en krijgt in de cursus veel aandacht.

Strikt genomen moet er aan drie voorwaarden worden voldaan om te kunnen spreken van een causale relatie:

1 Er moet een statistisch significant verband zijn tussen de onafhankelijke variabele/predictor en de afhankelijke variabele. Betekent in het algemeen dat de samenhang waarschijnlijk ongelijk is aan 0. Zo een resultaat zegt niets over de grootte van het verband en dus ook niet over het belang/relevantie van het verband.
2 De predictor moet in de tijd voorafgaan aan de meting van de afhankelijke variabele.
3 De relatie tussen de predictor en de afhankelijke variabele wordt niet veroorzaakt door een derde, mogelijk onbekende, variabele. (randomisatie helpt hierbij)
Bekende storende variabelen kunnen eventueel worden gemeten en statistisch onder controle worden gehouden door deze variabele als covariaat in de analyse te betrekken. Bij een zuiver experiment kan men daarom vrij zeker zijn dat aan voorwaarde 3 is voldaan.

Question 3

Q

het zuivere experiment

Answer

A

Een geschikte methode van dataverzameling om causale relaties te onderzoeken is een zuiver experiment. In een experiment kunnen we voorwaarde 1 toetsen via een statistische toets. De opzet van een experiment is zo dat de manipulaties die leiden tot de condities van het experiment (die de waarden van een predictor voorstellen) voorafgaan aan het meten van de afhankelijke variabele, waarmee aan voorwaarde 2 wordt voldaan. Door de subjecten willekeurig aan de condities toe te delen (randomisatie) wordt geprobeerd de invloed van onbekende variabelen te reduceren. Bekende storende variabelen kunnen eventueel worden gemeten en statistisch onder controle worden gehouden door deze variabelen als covariaat in de analyse te betrekken. Bij een goed uitgevoerd zuiver experiment kan men daarom vrij zeker zijn dat ook aan voorwaarde 3 is voldaan.

Question 4

Q

ethiek minimized harm

Answer

A

Ethische richtlijnen bij het doen van onderzoek zijn opgesteld om psychologen te doen realiseren dat zij de plicht hebben om de rechten en waardigheid van de deelnemers aan hun onderzoek te respecteren en te bewaken. Sommige richtlijnen zijn vastgelegd in wetgeving, terwijl de meeste richtlijnen een groot grijs gebied kennen waar per situatie een oordeel zal moeten worden gevormd. In het geval van experimenteel onderzoek zijn er een aantal ethische kwesties die met name van belang zijn. De belangrijkste overkoepelende richtlijn is dat onderzoek zo moet zijn opgesteld dat het de proefpersoon zo min mogelijk belast, ook wel het principe van minimized harm genoemd. Het is soms erg lastig om de juiste ethische afweging te maken, en er zijn geen gouden regels om vast te stellen of de kosten van onderzoek in termen van belasting opwegen tegen de baten ervan. Om dit soort vragen te toetsen is het daarom vereist dat onderzoekers zo veel mogelijk hun onderzoek vooraf laten toetsen door een ethische commissie.

Question 5

Q

informed consent

Answer

A

Deze combinatie van informatie verstrekken en toestemming vragen heet informed consent. Wanneer de deelnemer een handeling moet verrichten om toestemming te verlenen, zoals het ondertekenen van een informed consent-formulier dan heet dit active informed consent. Wanneer de deelnemer een handeling moet verrichten om niet deel te nemen aan een onderzoek dan heet dit passive informed consent; in wezen een vorm van ‘wie zwijgt, stemt toe’. Een voorbeeld van passive informed consent kan bijvoorbeeld een situatie zijn waarbij een deelnemer een vragenlijst krijgt waar de eerste bladzijde informatie geeft over het hoe en waarom van de vragenlijst. Verwacht kan worden dat als de deelnemer niet mee wil doen, de deelnemer de vragenlijst gewoon niet invult. Het invullen van de vragenlijst kan dan worden beschouwd als een vorm van passive consent. Een voorbeeld van active informed consent is wanneer ouders een brief van school krijgen waarin wordt toegelicht dat er in de klas een vragenlijst aan hun kinderen worden uitgedeeld. Als de deelname van het kind alleen kan plaatsvinden na expliciete toestemming van de ouders, bijvoorbeeld door een handtekening te zetten op een formulier voor deelname, dan is er sprake van active consent.
Consent kan slechts informed zijn wanneer deelnemers geïnformeerd zijn over de volgende zaken.

Vrijwillige deelname en dat het weigeren van deelname geen negatieve consequenties met zich meedraagt.

Recht op deelname beëindigen op ieder moment deelname aan het onderzoek te staken, toegelicht wat er gebeurt met eventuele verzamelde gegevens tot het punt van stoppen.

Doel van onderzoek: waar mogelijk

Onderzoeksprocedure: gaat de deelnemer alleen vragenlijsten invullen na het lezen van krantenartikelen, of moet de deelnemer tussendoor ook nog puzzels maken?

Alle voorzienbare risico’s en ongemakken die de deelnemers kunnen treffen moeten vooraf bekend zijn. Dit hoeft niet alleen betrekking te hebben op lichamelijke ongemakken (bijvoorbeeld, injecties, afname van speeksel, of elektrische schokken), maar ook psychologische (bijvoorbeeld het zien van schokkend of pornografisch materiaal).

Maatschappelijk nut van onderzoek maar kan ook een nut zijn voor de deelnemers zelf.

De duur van de belasting van het onderzoek moet vooraf bekend zijn. Gaat de deelnemer een uur lang ononderbroken computertaken uitvoeren, of wordt van de deelnemer verwacht dat er over de periode van een half jaar iedere week een volledige dag in het ziekenhuis onderzoek wordt verricht? Dit alles moet zo helder mogelijk worden gecommuniceerd.

Contactinformatie van de persoon die benaderd kan worden voor eventuele vragen of in het geval van letsel of noodgevallen.

Anonimiteit: het moet voor de deelnemers absoluut helder zijn hoe hun gegevens worden verwerkt. Dit hoeft niet in detail, maar de deelnemer moeten weten of hun gegevens anoniem worden verwerkt, en zo ja, hoe? Worden codes toegewezen? Als er persoonsgegevens worden gekoppeld aan het onderzoek, hoe wordt anonimiteit vervolgens afgehandeld?

Question 6

Q

Debriefing

Answer

A

Na afloop van het onderzoek is het ethisch om de deelnemers de gelegenheid te geven om de onderzoeksprocedure te kunnen bespreken of vragen te stellen. Deelnemers moeten een algemeen idee krijgen van wat de onderzoeker wilde weten en waarom en wat hun aandeel in het onderzoek was. Als zij in een van meerdere onderzoekscondities waren ingedeeld, zoals de controlegroep, dan is de debriefing het moment waarop de deelnemer dit verneemt. Als de deelnemer voorgelogen moest worden over de aard van het onderzoek dan geeft de onderzoeker in de debriefing openheid van zaken en legt de deelnemer ook de redenen voor die deceptie uit. Eventuele vragen van deelnemers moeten zo openlijk en eerlijk mogelijk beantwoord worden.

Een ethische debriefing laat niet te lang op zich wachten, deze dient zo snel mogelijk plaats te vinden. Ook moet de onderzoeker zo goed als redelijkerwijs mogelijk is zorgen dat de deelnemers de debriefing kunnen begrijpen.

Het doel van de debriefing is het wegnemen van misconcepties of onzekerheden die deelnemers kunnen hebben over het onderzoek. Een goede debriefing laat de deelnemers achter met het gevoel dat hun tijd niet verspild is. Het doel van de debriefing is niet slechts het informeren van de deelnemer, maar om de deelnemer de experimentele situatie te doen verlaten in een vergelijkbare stemming met hoe ze het experiment binnenkwamen.

Question 7

Q

bedrog

Answer

A

In de regel is het ongeoorloofd om deelnemers te bedriegen, tenzij de onderzoeker aannemelijk kan maken dat dit noodzakelijk is. Hoewel er geen harde regels zijn, is de algemene richtlijn dat wanneer deelnemers hoogstwaarschijnlijk aanstoot zouden nemen aan het bedrog of hoogstwaarschijnlijk geëmotioneerd gaan raken na debriefing dan is er sprake van onacceptabel bedrog.
De drie bekendste vormen hiervan zijn:

1 Het gebruik van handlangersconfederaties:
de onderzoeker kan acteurs of onderzoeksassistenten inzetten die zich voordoen als respondenten. Een bekend voorbeeld hiervan betreft het onderzoek van Asch naar het Asch-effect. Asch liet proefpersonen lijnstukken van verschillende lengte beoordelen. De proefpersonen dachten dat ze in een groep van zeven proefpersonen samenwerkten. De handlangers waren geïnstrueerd om expres overduidelijk foute antwoorden te geven, zodat de onderzoeker kon zien of de proefpersoon zich liet verleiden om met de meerderheid mee te gaan.

2 Staged manipulations in field settings: de omstandigheden waarin de proefpersoon zich bevindt, kunnen gemanipuleerd worden, om zo een effect op de proefpersoon te hebben. Zo kunnen proefpersonen bijvoorbeeld na het maken van een eenvoudige puzzeltaak gefingeerde negatieve terugkoppelingen van hun prestaties krijgen om zo een laag gevoel van zelfvertrouwen te induceren. In sociaalpsychologisch onderzoek wordt wel eens gefingeerd dat proefpersonen met andere deelnemers gaan samenwerken door op het computerscherm een nepcode te vertonen die de illusie moet wekken dat er een connectie met andere computers wordt gelegd.

3 Misleidende instructies: de aard van het onderzoek kan van meet af aan misleidend worden voorgesteld. Een van de bekendste voorbeelden hiervan betreft het Milgram-experiment. Milgram vertelde de respondenten dat ze meededen aan een experiment naar een nieuwe leermethode middels het toedienen van elektrische schokken bij foute antwoorden. Als onderdeel van de instructie werden de deelnemers zelf blootgesteld aan een kleine schok van 45 volt, zodat zij konden voelen wat voor straf ze zelf later zouden gaan uitdelen. In werkelijkheid werden er geen schokken toegediend en ging het onderzoek over de bereidheid van de deelnemers om gehoor te geven aan opgedragen taken van een gezaghebbende ook als die strijdig waren met hun eigen geweten.

Question 8

Q

het schrijven van een procedure in een methodensectie

Answer

A

De proceduresectie in een experimenteel onderzoek is vaak vele malen uitgebreider dan die in niet-experimentele onderzoeken. Waar de schrijver de lezers informeert over ethische aspecten van de experimentele manipulatie. De proceduresectie moet enerzijds bondig zijn geschreven, maar tegelijkertijd voldoende gedetailleerd zodat andere onderzoekers het experiment na zouden kunnen doen. Daartoe dient de informatie logisch geordend te zijn en voldoende structuurwoorden bevatten. Het is de kunst om de balans te vinden tussen een overdaad aan detail en een tekortschieten in detaillering; doel is dat de lezer goed kan volgen hoe het experiment is gedaan.

De volgende informatie dient in een goede proceduresectie te staan.

Als er niet al eerder in de methodensectie een aparte subkop design was, dan kan het experimentele design in de procedureparagraaf besproken worden.

Een samenvatting van de instructies die proefpersonen ontvangen hebben. Dit is bij voorkeur niet een volledig transcript; als dit van belang is dan kan naar een appendix worden verwezen. Hier komt ook de informatie over de informed consent.
Een beschrijving van de specifieke experimentele manipulaties. Hoe zijn de onafhankelijke variabelen in experimentele scenario’s geoperationaliseerd en hoe zijn de proefpersonen hieraan blootgesteld?
Als er eventuele counterbalancing of andere methoden van experimentele controle is toegepast dan wordt dit ook in de proceduresectie toegelicht.
Duur van het experiment.
Eventuele beloningen voor het participeren in het onderzoek.

Question 9

Q

validiteit vs betrouwbaarheid

Answer

A

Betrouwbaarheid en validiteit zijn twee van elkaar losstaande concepten. Betrouwbaarheid is synoniem aan ruis of error. Alle inconsistenties die in onze metingen ontstaan om puur willekeurige redenen, zijn problemen van betrouwbaarheid. Wanneer er systematische redenen zijn waarom metingen van elkaar afwijken dan spreken we van bias, en dit is een kwestie van validiteit: meten we wel wat we willen meten? Als men spreekt over betrouwbaarheid dan vraagt men zich af in hoeverre metingen vrij zijn van error. Als men spreekt over validiteit dan vraagt men zich af in hoeverre het onderzoek vrij is van bias. Betrouwbaarheid is een statistisch probleem, validiteit is meer een filosofisch probleem. Bij betrouwbaarheid poogt men te kwantificeren in welke mate de meetinstrumenten tot consistente resultaten leiden. Het is mogelijk om met statistische informatie bewijs te vergaren die helpt bepalen of onderzoek valide is, maar uiteindelijk blijft het gis- en denkwerk. Validiteit komt in veel smaakjes. In het kader van experimenten behandelen wij in deze module in het bijzonder twee categorieën van validiteit: interne en externe validiteit.

Question 10

Q

interne validiteit

Answer

A

De interne validiteit betreft de vraag of er voldoende bewijs is dat X veranderingen op Y veroorzaakt, met andere woorden: of de causale relatie tussen twee variabelen voldoende is aangetoond. Een causale inferentie kan enkel bestaan wanneer aan drie condities is voldaan:

1De oorzaak doet zich voor voorafgaand aan het effect (tijdsvolgorde, of temporeel precedent).
2De oorzaak en het gevolg zijn aan elkaar gerelateerd (covariatie).
3Er zijn geen plausibele alternatieve verklaringen voor de geobserveerde covariatie (geen schijnverband).

In experimentele proefopzetten proberen onderzoekers deze drie randvoorwaarden voor causale inferenties veilig te stellen door zo veel mogelijk verstorende factoren onder controle te houden en puur de experimentele (onafhankelijke) variabele te manipuleren om zo te zien wat het effect ervan is op een afhankelijke variabele. Wanneer een onderzoeker erin slaagt om de manipulatie zo goed te isoleren dat andere verklaringen of rivaliserende hypothesen worden uitgesloten dan wordt gesteld dat de causale inferentie intern valide is.

Question 11

Q

externe validiteit

Answer

A

Externe validiteit betreft de vraag in hoeverre resultaten uit onderzoek gegeneraliseerd kunnen worden naar de doelpopulatie. Eigenlijk betreft dit twee soorten van generaliseerbaarheid:

*de mate waarin situaties in het experiment gegeneraliseerd kunnen worden naar real-life situaties: de generaliseerbaarheid tussen situaties. Dit wordt ook wel de ecologische validiteit genoemd.
*de mate waarin de mensen die aan het onderzoek hebben deelgenomen een weergave zijn van de doelpopulatie in het algemeen: de generaliseerbaarheid tussen mensen.

Het is van belang om te benadrukken dat het generaliseren naar de populatie niet betekent dat er gegeneraliseerd moet kunnen worden naar andere populaties, of de mensheid in het algemeen. Als onderzoekers willen weten hoe ADHD-patiënten reageren op een behandeling dan is het vraagstuk van de externe validiteit alleen gericht op de vraag of de onderzoeksresultaten generaliseren naar ADHD-patiënten,

Question 12

Q

ecologische validiteit

Answer

A

Ecologische validiteit kan wel eens verkeerd begrepen worden omdat deze te letterlijk wordt geïnterpreteerd. Experimenteel onderzoek is altijd op een of andere manier onrealistisch. Ecologische validiteit is niet synoniem aan realisme. Er zijn meerdere wijzen waarop een experiment ecologisch valide kan zijn. Vaak als men het over een realistisch experiment heeft dan bedoelt men: psychologisch realistisch, oftewel de mate waarin psychologische processen die door het experiment worden opgeroepen vergelijkbaar zijn met hoe deze psychologische processen worden opgeroepen in het dagelijks leven.

Question 13

Q

bedreigers van interne validiteit

Answer

A

1 Tussentijds extern voorval (history)
specifieke gebeurtenissen die plaatsvinden tussen de eerste en de tweede meting.
Bijv nieuws wat effect heeft op het gedrag of de attitude van proefpersonen.

2 Rijping of groei (maturation) veranderingen die binnen proefpersonen optreden door het verloop van tijd (bijv verlies concentratie of puberteit).

3 Testeffect
de effecten die de voormeting heeft op de uitkomsten van de daaropvolgende testen daarom vaak zonder voormeting of groepen toevoegen die geen voormeting hebben gehad om te vergelijken.

4 Instrumentatie
veranderingen in meetinstrumentaria of beoordelaars die veranderingen in onderzoeksresultaten in gang zetten. Soms is het onvermijdelijk om van meetinstrument te veranderen. Als een onderzoeker de intelligentie van kinderen wil meten gedurende hun basisschoolcarrière, dan kan de onderzoeker niet steeds dezelfde test afnemen, omdat de test in de vroegste basisschoolgroep te eenvoudig is geworden zodra deze in de laatste basisschoolgroep komen. Ongeacht de reden: zodra de meetinstrumenten of de beoordelingscriteria veranderen, dan is de interne validiteit bedreigd. Een van de mogelijke oplossingen is het toepassen van een retrospectieve voormeting. In plaats van een echte voormeting worden proefpersonen gevraagd naar hun begrip of vaardigheid voorafgaand aan de treatment, na afloop van het onderzoek.

5 Statistische regressie (regression to the mean)
geen statistische toets maar extreme proefpersoon kenmerken bij voormeting die natuurlijk terugzakken/-groeien naar een minder extreem niveau.
Je zoekt vaak pas hulp bij ernstige klachten dus vanaf daar zal het sowieso beter gaan ook zonder de behandeling.

6 Selectie (selection bias)
de vergeleken condities zijn niet vergelijkbaar door verschillende steekproefkenmerken op voor het onderzoek relevantie eigenschappen. Structurele afwijkingen voorafgaand aan het onderzoek die interacteren met de onafhankelijke variabele en daardoor verantwoordelijk kunnen zijn voor verschillen in de afhankelijke variabele.

7 Uitval (experimental mortality)
proefpersonen die niet meer meewerken aan latere metingen in het experiment om redenen die relevant kunnen zijn voor de steekproefkenmerken van het experiment. Er is sprake van een validiteitsbedreiging door uitval wanneer conclusies worden getrokken op basis van de ‘overlevers’ in een dataset.
Hoewel uitval soms willekeurig is, kan een grote uitval ook een structurele reden hebben. In een onderzoek naar majeure depressie kan het zijn dat de proefpersonen met de zwaarste depressie hun medewerking aan het onderzoek staken omdat ze de energie er niet meer voor kunnen opbrengen. Resultaten uit het onderzoek worden vervolgens gebaseerd op proefpersonen met relatief minder ernstige depressie, waardoor de resultaten van het onderzoek niet meer duidelijk zijn toe te schrijven aan de experimentele behandeling. Onderzoek naar controversiële onderwerpen kan ook tot het gevolg hebben dat proefpersonen uitvallen. Bijvoorbeeld een vooringenomen vragenlijst naar negatieve stereotypen over buitenlandse leerlingen uitgezet onder docenten kan ertoe leiden dat sommige docenten zich geschoffeerd voelen en weigeren dit onderdeel van de vragenlijst in te vullen.

Soms heeft de uitval structurele gevolgen voor het onderzoek zelf. Bijvoorbeeld in een onderzoek naar een programma dat mensen moet helpen stoppen met roken kan het zijn dan meer dan de helft van de proefpersonen het programma niet afrondt, omdat ze voor de afronding al gestopt waren met roken. Uitval wordt een bedreiger van validiteit zodra de uitval toe te schrijven is aan een systematisch kenmerk van het onderzoek zelf, het toedienen van de treatment, of de aard van de meetinstrumenten.

8 Interactie tussen bedreigers
een combinatie van bedreigers die elkaar versterken bv selectie en groei.

9 Verspreiding van de ingreep
informatie/uitleg in de ene conditie wordt ook bekend onder deelnemers in de andere conditie.
Bij een experiment krijgt in de regel de experimentele groep een experimentele stimulus of treatment en de controlegroep niet. Echter een (quasi-)experimenteel ontwerp is op zichzelf geen garantie dat de desbetreffende groepen daadwerkelijk de ingreep respectievelijk wel en niet ontvangen. Informatie over de ingreep of (onderdelen van) de experimentele ingreep kunnen zelfs worden doorgegeven naar de controlegroep. Deelnemers in de onderscheiden condities van een experiment kunnen met elkaar praten over het experiment, hun ervaringen uitwisselen en dergelijke.

10 Compenserende rivaliteit
de deelnemers in verschillende onderzoekcondities gaan in competitie met deelnemers in de andere condities. Ook bekend als het John Henry-effect (John Henry was een arbeider die beter dan een machine ging presteren in een experiment, omdat hij zich ervan bewust was dat zijn prestaties met die van de machine vergeleken gingen worden).

Of de storende factor ‘compenserende rivaliteit’ al dan niet optreedt, is afhankelijk van de mate waarin het bekend is aan alle deelnemers in de onderscheiden condities dat er bij de experimentele condities een ingreep plaatsvindt en wat de aard van de ingreep is. Afhankelijk van de wijze waarop de ingreep wordt geïnterpreteerd kan er rivaliteit en concurrentie ontstaan tussen de deelnemers in de verschillende condities.

Als het duidelijk is dat van de deelnemers in de controlegroep wordt verwacht dat zij het iets minder ‘goed’ doen dan de experimentele groep, bestaat de mogelijkheid dat zij extra hun best gaan doen om daarmee de voorspelling van de onderzoekers te falsifiëren. Dit is vooral het geval als er banen of subsidie op het spel staan. Dit effect kan ook gemakkelijk optreden wanneer bijvoorbeeld een nieuwe of een andere onderwijsmethode of methode van hulpverlening wordt ingevoerd en onderzoek wordt gedaan waarmee de effectiviteit van de nieuwe methode moet worden aangetoond.

Question 14

Q

bedreigers externe validiteit

Answer

A

11 Interactie voormeting en experimentele stimulus.
Het probleem van een voormeting is niet alleen een probleem van interne validiteit. Bij de interne validiteit was het probleempunt dat proefpersonen kunnen leren van de voormeting.
Er is ook een ander probleem met voormeten: mensen worden in de werkelijke wereld niet gemeten voordat ze natuurlijk gedrag vertonen. Wanneer mensen een experimentele stimulus krijgen toegediend en voorafgaand daaraan zijn gemeten dan zijn deze mensen niet meer een realistische weergave van de doelpopulatie. We generaliseren immers mensen-die-een-voormeting-hebben gehad naar mensen die in hun dagelijks doen en laten geen voormeting bij hun ontbijt hebben gehad.

Of dit interactie-effect een bedreiging vormt voor de generaliseerbaarheid van de resultaten van een experiment hangt af van de specifieke variabelen die bij het onderzoek worden betrokken en vooral de manier waarop die worden gemeten. Omdat het onderzoek zelf van invloed is op hetgeen wordt onderzocht, is er sprake van reactiviteit. Bij het afnemen van een vragenlijst over motivatie voor het volgen van een cursus zal er eerder sprake zijn van reactieve effecten van de voormeting, dan bijvoorbeeld bij het observeren van het gedrag van mensen zonder dat zij zich daarvan bewust zijn.

De voormeting creëert een situatie die zich buiten het experiment niet voor zou doen; bijvoorbeeld de voormeting maakt mensen meer bewust van waarnaar ze worden gevraagd.

Om reactiviteit te voorkomen kan de onderzoeker de voormeting weglaten, kiezen voor een retrospectieve voormeting, of ervoor kiezen om proefpersonen te misleiden: als proefpersonen niet weten dat ze worden onderzocht, of zich niet realiseren dat ze een experimentele stimulus hebben ontvangen, dan kunnen zij zich ook niet bewust zijn van het bestaan van een controlegroep.

12 Niet-representatieve steekproeven

Selectie van proefpersonen wijkt af van de populatie waar het effect in plaats zou moeten vinden.

Representativiteit houdt in dat de steekproef wat betreft belangrijke kenmerken (bijvoorbeeld leeftijd, geslacht, opleidingsniveau) een goede afspiegeling vormt van de populatie. Om te kunnen concluderen of een steekproef representatief is, zal de onderzoeker de samenstelling van de populatie moeten kennen. Als een experiment bij bepaalde personen, op een bepaalde plaats, op een bepaald tijdstip en onder bepaalde omstandigheden heeft plaatsgevonden, blijft het de vraag of de resultaten van een dergelijk experiment zonder meer gegeneraliseerd kunnen worden naar andere plaatsen, andere tijdstippen en andere omstandigheden. Als dat wel mogelijk is, zijn de resultaten extern valide. Veel psychologisch onderzoek is verricht met studenten als proefpersonen. Volgens veel psychologen zijn de psychische functies of de sociale mechanismen die onderzocht worden zo algemeen van aard dat ze niet samenhangen met de variabelen waarop de selectie van proefpersonen afwijkt van welke populatie van volwassenen of kinderen dan ook. Strikt genomen is dat echter alleen proefondervindelijk vast te stellen.

13 Reactieve experimentele locatie

De proefleider, of kennis van de experimentele toewijzing maakt dat proefpersonen zich anders gedragen, vaak in lijn met wat proefpersonen denken wat van hen verwacht wordt.

Naast het reactieve effect van de voormeting kan ook de experimentele omgeving of locatie en daarin vooral degene die het experiment leidt, de proefleider, een reactief effect hebben. Het blijkt namelijk dat proefpersonen in experimenten zich in de regel zeer coöperatief opstellen jegens de proefleider en het hem of haar naar de zin willen maken. Het blijkt dat verwachtingen die proefleiders zelf hebben over de resultaten van het experiment soms een aantoonbaar effect hebben op die resultaten, ook wel experimenter bias genoemd. Proefleiders kunnen, bewust of onbewust, op heel subtiele wijze signalen uitzenden naar hun proefpersonen waardoor die zich gaan gedragen zoals ze denken dat de proefleider van hun verwacht. Het is ook mogelijk dat proefleiders op grond van hun ideeën over de uitkomsten van het experiment, bepaalde reacties of gedragingen die in strijd zijn daarmee, niet opmerken of signaleren. Dat is een vorm van selectieve perceptie.

Experimenter bias is lastig te kwalificeren als een bedreiger van interne of externe validiteit. Het hoort eigenlijk een beetje thuis in beide lijsten van bedreigingen. De redenen om het bij externe validiteit te plaatsen zijn bijzonder subtiel verschillend van de redenen om het bij de interne validiteit te plaatsen. Waarom experimenter bias toch als een bedreiging van externe validiteit wordt genoemd is dat de aanwezige proefleider een bijzondere omgeving schept met de eigen aanwezigheid en eigen biases. Dezelfde groep personen met dezelfde experimentele manipulaties zouden zich bij een andere proefleider anders gedragen. Omdat dit heel dicht aanschuurt tegen het concept van de ecologische validiteit wordt experimenter bias ingedeeld bij de externe validiteitsbedreigers. Consensus hierover ontbreekt. In sommige boeken staat het alleen bij de interne validiteit, en in een klein aantal andere boeken staat experimenter bias in beide lijsten.

Reactieve experimentele locatie kan voorkomen worden door te voorkomen dat proefpersonen weten in welke experimentele conditie zij zitten (zoals het niet weten of men een placebo ontvangt of niet), of door te voorkomen dat de proefleider weet in welke condities proefpersonen zijn ingedeeld. Het eerste zou dan een blind experiment heten, en wanneer proefpersonen en proefleider blind zijn: een dubbelblind experiment.

Question 15

Q

een zuiver experiment versus een quasi experiment

Het gros van psychologisch onderzoek betreft de ‘waarom’-vraag: waarom doet een bepaald fenomeen zich voor? Onderzoekers hebben theorieën over onderliggende mechanismen die de werkelijke veroorzakers zijn van het te onderzoeken fenomeen in kwestie. Zo’n theorie is bijvoorbeeld dat een studietaak leuk vinden alleen kan plaatsvinden als studenten zichzelf competent achten tot die studietaak. Het probleem in observaties is dat we wel kunnen zien dat B na A komt (interesse na competentiebeleving), maar we niet zondermeer weten dat A tot B heeft geleid (is het daadwerkelijk de competentiebeleving die eerst moet optreden?).
De enige manier om de causaliteit vast te stellen is om een experiment uit te voeren. Experimenten dienen er over het algemeen toe om ons te vertellen hoe verschillende observaties en uitkomsten aan elkaar gerelateerd zijn. Om preciezer te zijn, het doel van experimenten is om causale relaties empirisch te observeren en evalueren.
Alle typen experimenten hebben met elkaar gemeen dat condities of procedures onder strenge controle worden gehouden of gemanipuleerd. Deze controles of manipulaties worden treatments genoemd. Er zijn grofweg twee families van experimenten, zuivere experimenten en quasi-experimenten en twee families van designs, tussenproefpersonendesigns en binnenproefpersonendesigns.

Answer

A

In een zuiver experiment wordt randomisatie toegepast om proefpersonen aan experimentele condities of manipulaties toe te wijzen. In quasi-experimentele experimenten niet. Op papier is dit verschil soms duidelijker dan in de realiteit. De kern van de randomisatie is dat iedere eenheid die geobserveerd wordt, meestal de proefpersoon, in het experiment evenveel kans moet hebben gehad om in een van de experimentele condities terecht te komen. Als een onderzoeker wil weten of meer uren studeren zich vertaalt in betere cijfers en daartoe slechts proefpersonen werft in de eigen familie dan is de steekproef wellicht ongelukkig gekozen, maar als die proefpersonen nog steeds random aan condities worden toegewezen betreft het nog steeds een zuiver experiment. Van belang is dus niet hoe proefpersonen in de steekproef terecht zijn gekomen, maar hoe ze in hun experimentele conditie terecht zijn gekomen.

Randomisatie zou de grote gelijkmaker moeten zijn die zuivere experimenten hun verklarende kracht geven. Hoewel randomisatie niet garandeert dat iedereen hetzelfde is in alle experimentele condities, maar zolang iedere persoon evenveel kans heeft om in alle condities terecht te komen zou de randomverdeling redelijk in de buurt moeten komen van het gelijk spreiden van proefpersooneigenschappen die de causale inferentie zouden kunnen verstoren.

In een quasi-experimenteel experiment wordt geobserveerd en gemanipuleerd in zogenaamde bestaande groepen. Er wordt niet gerandomiseerd. Een voorbeeld van een quasi-experiment is wanneer een onderzoeker een nieuwe lesmethode wil toetsen en een school onderzoekt waar de onderwijsvernieuwing plaatsvindt, en deze school vergelijkt met een school die in vrijwel alle opzichten (aantal leerlingen, pedagogische visie) lijkt op de experimentele school, maar waar de onderwijsvernieuwing niet plaatsvindt. De leerlingen zitten niet random op de ene of de andere school, en vervelender, er zijn waarschijnlijk structurele redenen waarom leerlingen op de ene school zitten en niet op de andere. Dit maakt quasi-experimentele designs iets zwakker dan zuivere experimenten. Bij zuivere experimenten hield de randomisatie de structurele verschillen tussen proefpersoonkenmerken onder controle. Bij quasi-experimenten is dit niet onder controle, en rest ons alleen nog om deze problematiek statistisch onder controle te krijgen. Onderzoekers kunnen variabelen meenemen in hun onderzoek waarvan ze een theoretisch onderbouwd vermoeden hebben dat dit verstorende achtergrondkenmerken kunnen zijn. De variabelen worden covariaten genoemd, en kunnen in specifieke statistische analyses gebruikt worden om proefpersonen op die variabelen ‘gelijk te trekken’, in de hoop de kracht van randomisatie te benaderen.

Question 16

Q

between subjects design

Answer

A

in het Nederlands tussenproefpersonendesigns genoemd, betreffen studies waar iedere proefpersoon aan slecht een enkele experimentele conditie wordt blootgesteld. Hierdoor ontstaan groepen van proefpersonen die als groepen vergeleken kunnen worden. In een medisch onderzoek kunnen proefpersonen bijvoorbeeld worden toegewezen aan de treatment-conditie waarin een nieuw medicijn wordt toegediend, of aan de controleconditie waarin een placebo wordt toegediend. (Een placebo is een stof zonder pharmacologisch voordeel dat als een pseudomedicijn aan een controlegroep wordt toegediend).

Question 17

Q

within subjects design

Answer

A

in het Nederlands binnenproefpersonendesigns genoemd, worden alle proefpersonen juist aan alle experimentele en controlecondities blootgesteld. Als in een sociaalpsychologisch onderzoek de onderzoeker wil weten of mensen meer lachen wanneer ze pizza eten of hutspot kan de onderzoeker de proefpersonen eerst gezamenlijk pizza te eten geven, tellen hoe vaak eenieder lacht, en dezelfde proefpersonen vervolgens hutspot serveren om wederom te tellen hoe vaak gelachen wordt. Omdat bij binnenproefpersonendesigns de reacties van proefpersonen wordt gemeten na het toedienen van ieder treatment wordt er ook wel van repeated-measures designs gesproken (herhaalde-metingendesigns). Het probleem van binnenproefpersonendesigns kan zijn dat er volgorde-effecten optreden. Misschien vindt de onderzoeker dat mensen minder lachen bij het eten van hutspot, maar dat kan wellicht komen omdat ze dan al vol zijn van de pizza. In binnenproefpersonendesigns wordt in sommige gevallen de volgorde waar condities in worden aangeboden gevarieerd, zodat er bijvoorbeeld niet alleen respondenten zijn die eerst pizza eten en dan hutspot, maar dat er ook een groep eerst hutspot eet en dan pas pizza. Deze vorm van controle wordt dan counterbalancing genoemd.

Het is uiteraard ook mogelijk om een mix te hebben van tussen- en binnenproefpersonendesigns, bijvoorbeeld wanneer in een klinisch onderzoek twee groepen patienten op drie verschillende tijdstippen hun vorderingen worden gemeten. Deze designs heten dan mixed-designs.

Question 18

Q

controle groep/Mill’s method
exp groep als x dan y
contr groep als -x dan -y

Answer

A

Onderzoekers die willen toetsen of een dagje op de stormbaan werknemers tot een team smeedt, kunnen niet volstaan met een randomgroep mensen op de stormbaan zetten en dan observeren hoe ze als team vooruit zijn gegaan. Uiteindelijk zal iemand toch de vraag hebben of werknemers een dag in de bus zetten op weg naar de stormbaan, zelfs als dit effectief blijkt, beter is dan de werknemers met rust laten en de samenwerking zijn natuurlijke beloop laten gaan. Zulke controles zijn populair gemaakt door de filosoof John Stuart Mill, en het concept van de controlegroep is sinds zijn werken ook wel de Mill’s methode gaan heten. Het concept van de controle is namelijk een concept van logische bewijsvoering. Het is namelijk niet voldoende dat een experiment kan aantonen dat als men gaat stormbaanrennen dat er dan meer teamgevoel ontstaat, maar een experiment moet ook kunnen aantonen dat als men niet gaat stormbaanrennen dat er dan niet meer teamgevoel ontstaat.

Mill vatte de eisen samen in de taal van logica, en stelde dat experimenten twee vormen van bewijs moesten leveren.

De eerste, method of agreement, stelt dat een experiment allereerst moet aantonen dat als X zich voordoet, Y zich ook voordoet. Dit betekent dat als er minstens twee situaties zijn waarin Y zich voordoet, en X is in ieder van die gevallen aanwezig, dan is X een sufficient condition voor Y. In andere woorden, X is dan voldoende om het effect in Y in gang te zetten.

Als tweede stelde Mill middels de method of difference dat als X zich niet voordoet (-X) dat Y zich dan ook niet voor dient te doen (-Y). Dit betekent dat als het vermoede effect Y afwezig is als het vermoede effect X afwezig is dan is X een necessary condition voor Y. In andere woorden, X is dan absoluut onmisbaar om het effect in Y in gang te zetten. Om de causaliteit van sommige vragen te beantwoorden is het daarom soms noodzakelijk om een controlegroep waar een treatment niet optreedt (-X) aan het experiment toe te voegen. Schematisch is een simpel voorbeeld van Mill’s methode:

Experimentele groep: Als X, dan Y

Controlegroep: Als -X, dan -Y.

Een belangrijk punt om in het achterhoofd te houden is dat Mill’s method voorkomt dat experimenteel onderzoek de vorm van een rechtbank aanneemt, waarbij een stelling ‘onschuldig is tot schuldig bewezen’. Het gebeurt weleens dat een onderzoeker een sterke claim doet op basis van een observatie en critici worden uitgedaagd om dan maar te bewijzen dat deze claim niet waar is. Een goed onderzoeker test dus zelf beide claims.

Het is niet altijd mogelijk om ethische of praktische redenen om een controlegroep aan het experiment toe te voegen. Onderzoekers kunnen niet zondermeer een groep terminale patiënten een experimenteel geneesmiddel toedienen en de controlegroep maar aan haar lot over laten. In zulke gevallen kunnen onderzoekers soms de wachtlijst als een soort controlegroep gebruiken, maar mensen kunnen niet eeuwig kunstmatig op een wachtlijst worden gezet.

Question 19

Q

matchen en homogeniseren

Answer

A

Het is mogelijk allerlei externe factoren die, naast of in plaats van de experimentele variabele, effect kunnen hebben op de afhankelijke variabele, met behulp van randomisatie onder controle te houden. Naast randomiseren zijn matchen en homogeniseren andere toewijzingsprocedures waarmee dat kan.

Met matchen of homogeniseren wordt geprobeerd de experimentele en de controlegroep gelijk te maken op een aantal externe bekende kenmerken waarvan men denkt dat ze in belangrijke mate van invloed zijn op de afhankelijke variabele. Als we ervan uitgaan dat sekse, leeftijd en opleiding van invloed zijn op de mening over asielzoekers, moeten we ervoor zorgen dat de experimentele en controlegroep op deze kenmerken aan elkaar gelijk (gemaakt) zijn. Er zijn twee manieren om dat te doen, namelijk door precisiecontrole en globale controle.

Question 20

Q

precisie controle

Answer

A

Bij precisiecontrole probeert men voor elke proefpersoon in de experimentele groep een proefpersoon te vinden voor de controlegroep, die op de aangegeven variabelen gelijk is aan eerstgenoemde eenheid. Idealiter zouden we een kloon van iemand willen hebben in iedere conditie, maar omdat dit (vooralsnog) onmogelijk is vormt matchen op belangrijke achtergrondskenmerken een aardige vervangende oplossing. De kunst van goed matchen is om paren van proefpersonen te identificeren die zoveel mogelijk bij ons ideaal van een ‘kloon’ in de buurt komen. Bijvoorbeeld een paar van proefpersonen die beiden vrouw zijn, een modaal inkomen hebben, wonen in de randstad, een wetenschappelijke opleiding hebben gevolgd, enzovoorts. Nadat op deze wijze paren zijn gevormd, wordt op toevalsbasis bepaald wie van elk paar in de experimentele groep terechtkomt en wie in de controlegroep. Als men op een groot aantal variabelen wil matchen, moet men over een grote steekproef beschikken om tot gelijke paren te kunnen komen.

Question 21

Q

globale controle

Answer

A

Een tweede methode om te matchen is globale controle. Hierbij wordt ernaar gestreefd dat de frequentie van een aantal belangrijke kenmerken in de experimentele groep en controlegroep aan elkaar gelijk zijn. Dit is algemener dan matchen met precisiecontrole. Bij precisiecontrole werd gezocht naar een zo goed mogelijk gelijkende kopie van iedere proefpersoon; zoveel mogelijk individuen met gelijke kenmerken gelijk verdeeld over de condities. Bij globale controle wordt getracht om ieder kenmerk van individuen gelijk te verdelen over condities en zijn we al tevreden als we losse kenmerken van de proefpersonen in alle condities vertegenwoordigd hebben. Er zitten dan zowel in de experimentele als in de controlegroep net zoveel mannen als vrouwen, net zoveel laagopgeleiden als hoogopgeleiden en net zoveel jongeren als ouderen. Omdat de condities slechts per afzonderlijk kenmerk aan elkaar gelijk zijn en niet wat betreft de kenmerken-in-combinatie betreft globale controle een grovere wijze van matchen dan precisiecontrole.

Bij homogeniseren en matchen moet men zich beperken tot die externe kenmerken waarvan bekend is of het vermoeden bestaat dat ze invloed hebben of zouden kunnen hebben op de afhankelijke variabele. Deze procedures kunnen dus niet worden opgevat als vervanging voor randomiseren, maar ze kunnen gebruikt worden in combinatie daarmee, als dat tenminste mogelijk is. Bij echt of zuiver experimenteel onderzoek is randomiseren essentieel; de andere procedures kunnen daaraan toegevoegd worden.

Question 22

Q

gerandomiseerd blokdesign

Answer

A

Gerandomiseerd blokontwerp
Wanneer bij een experiment de groepen in de verschillende (experimentele en controle)condities even groot zijn en de toewijzing van de proefpersonen plaatsvindt op toevalsbasis, dan is er sprake van een volledig gerandomiseerd ontwerp. Vaak wordt bij de opzet van een experiment gebruikgemaakt van een zogenoemd gerandomiseerd blokontwerp. Daarbij worden de proefpersonen, voorafgaand aan het eigenlijke experiment, ingedeeld in homogene categorieën, bijvoorbeeld mannen en vrouwen. Als groepen worden gevormd op basis van sekse en leeftijd (met de categorieen man, vrouw en jong, middelbaar, senior en bejaard) resulteert dat in acht groepen. Deze groepen worden blokken genoemd. Onderzoekers gaan bij vorming van dergelijke blokken uit van de variabelen die zij onder controle willen houden, omdat zij veronderstellen dat er een verband bestaat tussen respectievelijk sekse en leeftijd aan de ene kant en bijvoorbeeld de houding jegens asielzoekers aan de andere kant. De proefpersonen worden op basis van het toeval toegewezen aan de experimentele dan wel aan de controleconditie. Er is sprake van een gerandomiseerd blokontwerp wanneer ten eerste aan elk blok in beginsel evenveel onderzoekseenheden of proefpersonen worden toegewezen, ten tweede binnen elk blok evenveel eenheden worden toegewezen aan de experimentele en aan de controlegroep en ten derde als de toewijzing van de proefpersonen gebeurt op basis van toeval.

Via deze procedure kan ervoor worden gezorgd dat de experimentele en controlegroep volledig aan elkaar gelijk zijn op de kenmerken (geslacht en leeftijd) die de basis vormden voor de indeling in blokken. Doordat de selectie van de proefpersonen uit de blokken en de toewijzing aan de experimentele of aan de controleconditie gebeurt op toevalsbasis, kunnen we ervan uitgaan dat de experimentele en controlegroep ook aan elkaar gelijk zijn op allerlei kenmerken die in het onderzoek niet worden gemeten. Daardoor schakelen onderzoekers het systematische effect van sekse en leeftijd uit en minimaliseren zij door randomisatie de invloed van eventuele andere - onbekende - storende variabelen. Het gerandomiseerd blokontwerp is een vorm tussen precisiecontrole en globale controle. Deze manier van toewijzing van proefpersonen wordt daarom soms ook wel groepsgewijs matchen genoemd.

Question 23

Q

causaliteit
In veel psychologisch onderzoek wordt verondersteld dat variabelen een causale relatie met elkaar hebben. Dat wil zeggen dat wordt verondersteld dat er sprake is van een of meer onafhankelijke variabelen (predictoren) en een of meer afhankelijke variabelen, waarbij een onafhankelijke variabele effect heeft op de afhankelijke.

Answer

A

Strikt genomen moeten er aan drie voorwaarden worden voldaan om te kunnen spreken van een causale relatie. Deze voorwaarden zijn:
1 Er moet een statistisch significant verband zijn tussen de predictor de afhankelijke variabele.
2 De predictor moet in de tijd voorafgaan aan de afhankelijke variabele.
3 De relatie tussen de predictor en de afhankelijke variabele wordt niet veroorzaakt door een derde, mogelijk onbekende, variabele.

Een statistisch significant (voorwaarde 1) resultaat betekent in het algemeen dat de samenhang waarschijnlijk ongelijk is aan nul. Zo’n resultaat zegt niets over de grootte van het verband en dus ook niet over het belang of de relevantie van het verband. Een klein verband kan bij een grote steekproef namelijk ook statistisch significant zijn. Als de steekproef maar groot genoeg is dan wordt elke afwijking van nul, hoe klein ook, in de steekproef significant. Een verbad kan ook causaal zijn zonder dar er statistische significantie is (een kleuine n) Om te zien of een verband voldoende sterk of relevant is moet er naar de grootte van het effect worden gekeken (Engels: effect size). Bij een regressieanalyse kan de grootte van het effect worden afgelezen aan de gestandaardiseerde regressiecoëfficiënt (beta).

Ten tweede betekent statistische significantie van een verband niet dat er sprake is van een causaal verband. Het causale proces kan namelijk ook omgekeerd zijn of worden veroorzaakt door een derde variabele.

Aan de andere kant zou er wel een causaal verband kunnen bestaan tussen twee variabelen, terwijl er in de analyse geen sprake is van statistische significantie. De belangrijkste reden hiervoor is dan een te kleine steekproef, m.a.w. de toets heeft te weinig power om de samenhang te ontdekken. Ook kan er sprake zijn van een derde variabele die het verband maskeert. Het probleem van een te kleine steekproef, en dus van te weinig power om een effect te vinden, doet zich vooral gelden bij de typen verbanden die in Thema 2 aan de orde zullen komen, de interactie-effecten. Voor het testen van moderatiemodellen moeten er in het algemeen nog grotere datasets worden gebruikt dan bij modellen met alleen een hoofdeffect.

Een geschikte methode van dataverzameling om causale relaties te onderzoeken is een zuiver experiment. In een experiment kunnen we voorwaarde 1 toetsen via een statistische toets. De opzet van een experiment is dusdanig dat de manipulaties die leiden tot de condities van het experiment (die de waarden van een predictor voorstellen) voorafgaan aan het meten van de afhankelijke variabele, waarmee aan voorwaarde 2 wordt voldaan. Door de subjecten willekeurig aan de condities toe te delen (randomisatie) wordt geprobeerd de invloed van onbekende variabelen te reduceren. Bekende storende variabelen kunnen eventueel worden gemeten en statistisch onder controle worden gehouden door deze variabelen als covariaat in de analyse te betrekken. Bij een goed uitgevoerd zuiver experiment kan men daarom vrij zeker zijn dat ook aan voorwaarde 3 is voldaan.

Question 24

Q

survey

Answer

A

Wanneer de data zijn verzameld via een survey waarbij alle vragen min of meer tegelijk worden verkregen, kan men in principe geen uitspraken doen over causale relaties tussen de variabelen, omdat alleen aan voorwaarde 1 kan worden voldaan. In de praktijk gebeurt dit echter toch vrij vaak en ook in deze cursus wordt regelmatig gesproken over ‘het effect’ of ‘de invloed’ van een variabele op een andere. Bedenk dat het dan gaat over een verondersteld effect dat in de analyse hooguit aannemelijk wordt gemaakt. De veronderstelde causaliteit wordt aannemelijker als er meer onderzoeken in dezelfde richting wijzen en vooral wanneer er sprake is van een goed gefundeerde theoretische onderbouwing.

Question 25

Q

longtidunale dataverzameling

Answer

A

Er bestaan ook longitudinale methoden van dataverzameling. Hierbij worden de gegevens op verschillende momenten in de tijd verzameld bij dezelfde subjecten. Door deze methode kan aan voorwaarde 2 worden voldaan, doordat op T1 de predictor kan worden gemeten en op T2 de afhankelijke variabele. Hoewel bij deze methode niet kan worden vastgesteld of aan voorwaarde 3 is voldaan, lijken causale uitspraken iets gefundeerder dan bij een survey dat op een enkel moment in de tijd is verkregen (cross-sectioneel onderzoek). Maar ook bij longitudinaal onderzoek is het belangrijk dat er een goed gefundeerde theorie ten grondslag ligt aan de veronderstelde causale effecten.

Een ander probleem bij longitudinaal onderzoek is dat het tijdsinterval tussen de metingen (T1, T2 enzovoorts) goed moeten worden gekozen. Het effect van de predictor, gemeten op T1, moet zichtbaar zijn in de afhankelijke variabele op T2. De vraag is dus hoe lang het duurt voordat een predictor effect heeft: enkele seconden, dagen, of maanden? Uiteraard is dat afhankelijk van het specifieke effect dat onderzocht wordt. Is het interval te kort gekozen, dan kan er nog geen causaal effect worden gemeten en als het interval te groot is dan kunnen er allerlei verstorende factoren een rol gaan spelen.

Een variant van longitudinaal onderzoek is een cohortstudie (ook wel panelstudie genoemd). Hierbij wordt een groep subjecten van een bepaalde leeftijdsgroep over een (groot) aantal jaren gevolgd. Op basis van allerlei kenmerken van een dergelijke groep hoopt men ook causale relaties te ontdekken. Met betrekking tot causaliteit spelen hier dezelfde problemen als bij een gewoon longitudinaal onderzoek.

Question 26

Q

experimentele designs

Answer

A

Campell en Stanley (1963) hebben een lijst opgesteld om ervaren onderzoekers te helpen om validiteitsbedreigers te helpen voorkomen bij het kiezen van een experimenteel design. Om onderzoekers hierbij te helpen hebben ze een symbolische notatie ontwikkeld om experimenten mee samen te vatten. Een experimenteel ontwerp wordt meestal met de volgende symbolen aangegeven: O = observation: een waarneming of meting van de afhankelijke variabele en X = het ondergaan van de experimentele stimulus. Een eenvoudig experiment kan bijvoorbeeld als volgt worden weergegeven:

t1 t2
O1 X O2
In dit design wordt op tijdstip 1 (t1) de afhankelijke variabele gemeten: de voormeting. Vervolgens wordt de experimentele treatment ondergaan. Daarna wordt op tijdstip t2 de afhankelijke variabele opnieuw gemeten: de nameting. In dit design ontbreekt de letter R (randomisatie) voorafgaand aan t1, wat in deze context niet nodig zou zijn, omdat er geen verschillende condities zijn om proefpersonen aan toe te wijzen. Bij meer dan één experimentele groep zou de aan- of afwezigheid van R duidelijk maken of het een zuiver experiment betreft.

Question 27

Q

pre experimentele designs, belabberd in hun vermogen validiteitsbedreigers onder controle te houden.

Answer

A

one shot case study xO1, treatment en observatie van reactie, geen vergelijking mogelijk

one-group pre-post design, voor en nameting

pre-experimenteel bestaande groepen nameting only
t1 t2
NR x O1
NR O2 (geen -x dus geen mills method of difference)

geen randomisatie of voormeting, vergelijken is ook hier dus moeilijk

Question 28

Q

zuivere experimenten

Answer

A

*De eenvoudigste; posttest-only control (alleen nameting met controlegroep)
t1 t2
R X O1
R O2

geen voormetig voorkomt testeffect.
Toch heeft het ook nadelen om geen voormeting te hebben. Zelfs als de randomisatie goed is geslaagd en groepen vergelijkbaar zijn missen we nog steeds informatie over het startpunt. Twee belangrijke termen in deze context zijn plafond- en bodemeffecten. Het kan zijn dat er geen verschil tussen de twee condities is waar te nemen, omdat de test te gemakkelijk was voor deze proefpersonen. Als aan middelbare scholieren wiskundeopgaven bij wijze van prestatiemaat worden gegeven, maar deze blijken te eenvoudig, dan zou een voormeting al kunnen tonen dat studenten vrijwel alles goed hebben en topscores halen (plafondeffect) en dat er geen mogelijkheid is om op de nameting hoger te scoren, laat staan hoger dan een andere groep. Een bodemeffect is hetzelfde als een plafondeffect, maar in plaats van dat de scores tegen een plafond zitten, zijn ze vrijwel allemaal zo laag dat er geen lagere score meer waarschijnlijk is.

*Het klassieke experimentele design;

Pretest-posttest control design (voor-nameting met controlegroep)
t1 t2
R O1 x O2
R O3 O4

Voor en nameting daardoor zijn verschillen tussen de groepen toe te schrijven aan de experimentele treatment.

*Solomon 4 groepen design;

t1      t2 R O1 X O2 R       X O3 R O4    O5 R          O6

combinatie van posttest only en pretest posttest control
voordelen; groep 1 en 3 die beiden een voormeting hebben gehad kunnen worden gebruikt om een schatting te maken van de de niet gemeten pre treatment scores van groepen 2 en 4. Het betreft dan wel giswerk, want zonder werkelijk te meten weten we nooit zeker wat de voormetingscores zouden zijn geweest voor die twee groepen. Maar het is mogelijk om te zien in hoeverre de randomisatie geslaagd is: als de voormetinggroepen op de voormeting goed vergelijkbaar blijken, dan is het waarschijnlijk dat de groepen zonder voormeting ook baat hebben gehad van de randomisatie, zo ziet men in hoeverre de randomisatie is geslaagd. zo kan men ook de nameting beter evalueren. Testeffect kan men door vergelijken herkennen/uitsluiten. de 2 groepen zonder voormeting zijn niet gecontamineerd door de voormeting.
en derde punt is dat het mogelijk is om een interactie tussen voormeting en treatment te toetsen. Dit komt omdat iedere groep unieke validiteitsbedreigers onder controle heeft. Groep 1 kan bedreigd worden door de voormeting, de treatment en voormetingsensitisatie (pretest-treatment interaction). Groep 2 kan bedreigd worden door de treatment en zaken die buiten het experiment vallen waar niet voldoende op gelet is, zoals experimenter bias, maar door geen overige factoren, want zonder de voormeting is er geen testeffect of pretest-treatment interactie. Groep 3 kan bedreigd worden door de voormeting en zaken die buiten het experiment vallen, maar geen andere bedreigers, want er is geen treatment gegeven, en daarom geen treatment-effects of pretest-treatment interactie. Groep 4 kan worden aangetast door zaken buiten het experiment om, maar door geen overige bedreigers.

Question 29

Q

quasi-experimentele proefopzetten

Answer

A

De essentie van een quasi-experimenteel design is dat er geen randomisatie heeft plaatsgevonden om proefpersonen aan condities toe te wijzen. In de praktijk houdt dit vaak in dat er van bestaande groepen gebruik wordt gemaakt. Randomiseren is niet altijd mogelijk als onderzoekers gebruik moeten maken van bestaande groepen, zoals schoolklassen, of afdelingen in een bedrijf of instelling. Het is echter niet alleen een zwaktebod om een quasi-experimentele studie te doen. Ondanks het verlies van controle over sommige validiteitsbedreigers betreft het vaak wel een onderzoek in een ‘natuurlijke’ omgeving in tegenstelling tot het kunstmatige psychologische laboratorium. De mate waarin resultaten van een onderzoek en het te onderzoeken fenomeen met elkaar overeenkomen heet ecologische validiteit. Het verlies van controle over sommige bedreigingen enerzijds kan daarom soms gecompenseerd worden met een winst in ecologische validiteit. Simpel gezegd: het onderzoek zegt waarschijnlijk meer over de alledaagse praktijk.

Question 30

Q

quasi experimenteel pretest-posttest control design

Answer

A

t1 t2
NR O1 X O2
NR O3 O4

Een voorbeeld van zo’n studie is wanneer onderzoekers twee zusterbedrijven vergelijken, waarbij in een bedrijf een nieuwe organisatiestructuur wordt toegepast, terwijl het tweede bedrijf nog op normale wijze opereert. Door niet-random toewijzen van personen binnen het bedrijf aan de condities blijven er structurele eigenschappen op de achtergrond sluimeren. Zelfs zusterbedrijven kunnen net verschillen in geschiedenis, omvang, prestaties, of locatie en daarmee cultuur. Proefpersonen binnen een bedrijf hebben meer met elkaar gemeen dan alleen het wel of niet ontvangen van de treatment.

Question 31

Q

enkelvoudige en meervoudige tijdreeks

Answer

A

t1 t2 t3 t4 t5 t6 t7 t8
NR O1 O2 O3 O4 X O5 O6 O7 O8

*Bij de enkelvoudige tijdreeks worden bij dezelfde proefpersonen, of andere eenheden van onderzoek op verschillende tijdstippen zowel voor als na introductie van de experimentele treatment metingen verricht op de afhankelijke variabele. De enkelvoudige tijdreeks is een uitbreiding van de pre-experimentele one-group pre-post design. Dit type experiment leent zich goed voor ‘dagboek’-experimenten waarbij het effect van psychotherapie op een enkele patiënt over tijd wordt gevolgd, of het effect van een verkeersmaatregel op het aantal ongelukken in een stad. Omdat er niet slechts een enkele voormeting en nameting zijn kan er eerst een stabiel beeld gevormd worden van een situatie voor de treatment, en een langetermijneffect na de treatment. Deze series van metingen zijn minder gevoelig voor toevalstreffers of statistische regressie.

*Meervoudige tijdreeks

t1 t2 t3 t4 t5 t6 t7 t8

NR O1 O2 O3 O4 X O5 O6 O7 O8
NR O9 O10 O11 O12 O13 O14 O15 O16

Dit is in alle opzichten vergelijkbaar met de enkelvoudige tijdreeks, maar dan met alle voordelen van een controlegroep.

Question 32

Q

cognitive load casus

Answer

A

De inhoud van deze casus heeft betrekking op het onderzoeksthema: Cognitive load theory. De theorie van Cognitive load is in de jaren tachtig geïntroduceerd door Sweller (1988) en heeft betrekking op de mentale druk die op het werkgeheugen wordt uitgeoefend bij het oplossen van problemen. Volgens Sweller kon kennis van het werkgeheugen helpen om de opdrachten die leerlingen kregen te verbeteren. De belasting die opdrachten leggen op leerlingen werd cognitive load genoemd, en er werd onderscheid gemaakt tussen intrinsic load (de moeilijkheidsgraad van de inhoud van het onderwerp), extraneous load (de complexiteit van het onderwijsmateriaal) en germane load (in hoeverre de inhoud georganiseerd is in schema’s). In deze casus zullen we een onderdeel van deze theorie experimenteel gaan toetsen.

Question 33

Q

regressieanalyse

Answer

A

Bij een regressieanalyse kan de grootte van het effect worden afgelezen aan de gestandaardiseerde regressiecoëfficiënt (beta).

Question 34

Q

voorkennis data-analyse

Answer

A

hoewel bijna alle variabelen continue zijn (ze liggen op een ononderbroken schaal en kunnen in de populatie oneindig veel waarden aannemen, zoals cijfers en leeftijd, zijn sommige variabelen van een lager zogenaamd meetniveau. Geslacht is bijvoorbeeld eeen zogenaamde dichotome variabele: geslacht kan maar 2 waarden aannemen. Dit heet ook wel een binaire variabele. Binnen de continue variabelen worden soms 2 meetniveaus onderscheiden, hoewel dat onderscheidt mbt statistiek irrelevant is. Het ene meetniveau van continu is het intervalniveau (omdat intervallen tussen opeenvolgende meetwaarden altijd even groot zijn) en het andere meetniveau is rationiveau. Het verschil is het bestaan van een zogenaamd absoluut nulpunt.
Ordinaal komt niet echt voor in deze cursus, bv rangen en standen mavo havo vwo.

Question 35

Q

categorische/discrete variabele

Answer

A

de verschillende meetwaarden die deze variabelen aan kunnen nemen zijn altijd categorieen.

nominale variabele: categorieen die alleen te benoemen zijn maar niet te ordenenen (bijv haarkleur).
ordinale variabele: categorieen die alleen te ordenen zijn met onbekende ongelijke afstand.

Voor nominale en ordinale variabelen is geen regressieanalyse mogelijk

-dichotome variabele: binaire variabele: variabelen die maar 2 waarden aan kunnen nemen. Een dichotome variabele kan in een enkelvoudige regressie als predictor worden meegenomen.

Question 36

Q

continue variabele

Answer

A

Het meetniveau van de meeste variabelen. Het hoogste meetniveau. Kunnen allerlei meetwaarden aaanemen (min oneindig-oneindig)

intervalniveau: continue waarden met betekenis. Intervallen tussen opeenvolgende meetwaarden zijn altijd even groot, geen absoluut nulpunt zoals bv temperatuur.
rationiveau: meest voorkomende variabele, heeft een absoluut nulpunt en de afstand ertussen is altijd even grooty, bv leeftijd.

Question 37

Q

regressiecoefficienten

Answer

A

het eerste getal van deze 2 getallen is simpelweg de voorspelling voor iemand die 0 scoort op de x-as. Deze eerste regressiecoefficienten ofwel B0 wordt het intercept genoemd. intercept is de score die onderzoekseenheden op de y-as hebben als ze precies 0 score op de x-as. vervolgens kijk je wat er met de score gebeurd als je 1 maat zou opschuiven en wat ze danzouden scoren. Dit wordt de tweede regressiecoefficient oftewel 1 is de helling van de lijn. dit is de stijging of daling in de variabele op de y-as als de variabele op de x-as. nu heben we per plotje beide regressiecoefficienten gevonden. Hiermee kunnen we een formule opstellen die ons in staat stelt om voor elke waarde op de x as te voorspellen wat iemand op de variabele op de y-as zal scorenHierin staat y^ voor de beste voorspelling van de afh var/het criterium genoemd
B0intercept en B1helling zijn de regressiecoefficienten. x1 is de onafhankelijke variabele die in regressie ook wel een covariaat wordt genoemd, omdat hij meevarieert met het criterium. nummers omdat er meerdere B en X voorspellers/onafhankelijke variabele/covariaten tegelijk kunnen worden geanalyseerd. Het is wel belangrijk te beseffen dat voor regressieanalyse en de berekende regressiecoefficienten hetzelfde geldt als voor alle andere getallen die worden berekend uit een steekproef om iets te zeggen over een populatie puntschattingen zijn niet informatief.

Question 38

Q

effectsize (power) van regressieanalyse

Answer

A

de proportie verklaarde variantie (R2).
is letterlijk hoeveel van de variantie in de afhankelijke variabele dus hoeveel personen en stipjes 1 begrijpen we eigenlijk.
R2 een getal dat altijd tussen de 0 en 1 ligt representeert welke proportie van de variantie van de afhankelijke variabele wordt verklaard door het regressiemodel. Als 1 dan zijn de variabelen identiek/100%d , als de proportie verklaarde vartiantie 0 is of 0%d dan kan de ene variabele helemaal niet worden voorspeld uit de andere. Deze F-waarde is de verhouding tussen de verklaarde en de onverklaarde variantie in de afhankelijke variabele

Question 39

Q

Type 1 fout

Answer

A

een type 1 fout wordt gemaakt als de nulhypothese onterecht wordt verworpen dus als er wordt geconcludeerd dat er in de populatie een verband betaat terwijl dat eigenlijk niet zo is. De kans hierop is exact zo groot aan de gekozen alpha. Het is belangrijk om de kans op een type 1 fout zo laag mogelijk te houden.

Question 40

Q

Type 2 fout

Answer

A

het contract aanhouden van de nulhypothese. Hoe groot de kans op zo een type 2 fout, hangt af van de de daadwerkelijke correlatie en de streekproefomvang. Het omgekeerde van deze kans op een type 2 fout heet de power van een toets.

Question 41

Q

analyseren 3 fases

Answer

A

fase 1:
missing values
data invoer fouten
schaalconstructen
outliers
normaliteit

fase 2:
toets keuze
assumptie checken
toetsen
effectgrootte

fase 3:
wat zegt de data, conclusie in mensentaal
alternatieve verklaringen

Question 42

Q

correlationeel onderzoek

Answer

A

de aannemelijkheid van een verband weergeven. Wil je meer dan dat dan gebruik je een experiment.
Corelationeel onderzoek zie je vaak in een eerste fase. Niks anders dan een verband vinden tussen 2 dingen. goed om te doen voordat je veel gaat investeren in experimenteel onderzoek. Je wilt uberhaupt weten of die link die je veronderstelt er wel is.

Question 43

Q

dataverzamelingsmethoden B/C/E

Answer

A

-beschrijvend onderzoek: hoe vaak komt een fenomeen voor
-correlationeel onderzoek:
is er samenhang tussen de variabelen
experimenteel onderzoek:
is er een causaal effect van de ene op de andere variabele

Question 44

Q

causale conditie

Answer

A

een valide causale inferentie kan enkel bestaan wanneer aan 3 condities is voldaan:
1 de oorzaak doet zich voor voorafgaand aan het effect (tijdsvolgorde of temporeel precedent)
2 de oorzaak en het gevolg zijn aan elkaar gerelateerd (covariatie)
3 er zijn geen plausibele alternatieve verklaringen voor de geobserveerde covariatie (geen schijnverband)

Question 45

Q

retrospectieve voormeting

Answer

A

in plaats van een echte voormeting worden proefpersonen gevraagd naar hun begrip/vaardigheid voorafgaand aan de reatment, na afloop van het onderzoek. bijv in een onderzoek naar de effecten van een professionele ontwikkelingsactiviteit kunnen proefpersonen na de workshop gevraagd worden hoe vaardig zij waren in de vaardigheid die in de workshop aan bod kwam voordat zij de workshop ingingen.

Question 46

Q

representativiteit

Answer

A

houdt in dat de steekproef wat betreft belangrijke kenmerken een goede afspiegeling vormt van de populatie.

Question 47

Q

eperimenter bias: bedreiger van externe validiteit

Answer

A

het blijkt dat verwachtingen die proefleiders zelf hebben over de resultaten van het experiment soms een aantoonbaar effect hebben op die resultatenExperimenter bias is lastig te kwalificeren als een bedreiger van interne of externe validiteit. waarom toch als bedreiger extern genoemd is dat de aanwezige proefleider een bijzondere omgeving schept met de eigen aanwezigheid en biases. Omdat dit dicht bij het concept van ecologische validiteit komt, wordt experimenteer bias ingedeeld bij de externe validiteit bedreigers. Consensus hierover ontbreekt.

Question 48

Q

selectieve perceptie

Answer

A

het is ook mogelijk dat proefleiders op grond van hun ideeen over de uitkomsten van het experiment, bepaalde reacties of gedragingen die hiermee in strijd zijn niet opmerken of signaleren.

Question 49

Q

blind en dubbelblind experiment

Answer

A

blind
wanneer proefpersonen niet weten in welke experimentele conditie zij zitten

dubbelblind
wanneer zowel proefpersonen als proefleiders niet weten in welke conditie zij zitten.

Question 50

Q

experimenteel ontwerp

Answer

A

wordt meestal met de volgende symbolen aangegeven:
O=observatie, een waarneming of meting van de afh var
X= expriment, het ondergaan van de experimentele stimulus
r= randomisatie toewijzing van proefpersonen aan condities.
- experimenteel eenvoudig ontwerp
-pre experimenteel: one shot case study, one group pre-post test design, bestaande groepen posttest only
-zuivere experimenten: posttest only control, pretest posttest control design, solomon 4 groepen design
-quasi experimentele proefopzetten quasi experimenteel pretest posttest control design, enkelvoudige tijdreeks, meervoudige tijdreeks.

Question 51

Q

plafondeffect

Answer

A

geen verschil tussen 2 condities waar te nemen omdat de test te gemakkelijk was

Question 52

Q

bodemeffect

Answer

A

het kan zijn dat er geen verschil tussen de 2 condities waar te nemen is omdat de test te moeilijk was

Question 53

Q

voorbeeld validiteitsbedreiger

Leerlingen wisten van tevoren dat ze gingen deelnemen aan een onderzoek van universiteit Leiden en hebben hiertoe consent gegeven. Het onderzoek werd in hun normale klas op school uitgevoerd in aanwezigheid van de docent en de onderzoeker. De taak die de leerlingen kregen was een saaie taak. Deze taak leek op een normale opdracht zoals deze op school gegeven had kunnen worden, maar was verder onbekend voor de leerlingen. Leerlingen deden eerst een experiment waarbij ze de saaie taak deden. Een half jaar later kregen ze te horen dat ze opnieuw het saaie-takenexperiment gingen doen. Er was geen controlegroep; alle leerlingen kregen de saaie taak in Experiment 1 en Experiment 2 met dezelfde instructies.
De onderzoekers concludeerden dat de repititive tasks niet alleen niet motiverend waren, maar dat ze zelfs demotiverend waren! Zelfs als aan de randvoorwaarden van motivatie was voldaan daalde de motivatie volgens de onderzoekers.

Answer

A

In dit geval is de meest waarschijnlijke validiteitsbedreiger ‘statistische regressie’. Het is maar de vraag of de motivatie echt gedaald is, of dat de eerste motivatiemeting onnatuurlijk hoog was. De leerlingen wisten van tevoren dat ze mee gingen doen aan een experiment van een universiteit. Het is mogelijk dat zij uitkeken naar een bijzondere les. De motivatie die voorafgaand aan deze test werd gemeten, kan onnatuurlijk hoog zijn geweest vanwege deze verwachting. In plaats van de leuke afleiding kregen de leerlingen een les die was als alle andere lessen, maar dan saaier gemaakt door de saaie opdracht. De eerste meting kan daarom extreem hoog zijn uitgevallen en de meting een half jaar later kan dan een meer reële meting zijn geweest. Het kan verleidelijk zijn om ‘rijping’ als validiteitsbedreiger te noemen. Een half jaar is voor een schooljaar relatief lang, en het is niet duidelijk in hoeverre de leerlingen tegen die tijd wel weer klaar waren met school en toe waren aan vakantie. Door gebrek aan een controlegroep, bijvoorbeeld een groep waar leerlingen niet autonoom mochten zijn (een van de randvoorwaarden) is het lastig vast te stellen of rijping heeft opgetreden. Blijkbaar waren de randvoorwaarden door leerlingen nog wel als aanwezig ervaren, maar was hun motivatie toch nog gedaald. De vraag die dan open ligt, is in hoeverre de perceptie van die randvoorwaarden sterker weegt dan het feit dat alle leerlingen feitelijk autonoom waren, of ze dat nu echt zo beleefd hadden of niet. Zonder een groep waar autonomie afwezig was, is hier helaas geen antwoord op te geven. Dit is meer een gebrek aan het experimentele design (zie thema 1.3) dan dat het een specifieke validiteitsbedreiger is.

Question 54

Q

validiteitsbedreigers

Answer

A

Nuland (2011) deed in haar proefschrift onder andere onderzoek naar het effect van opdrachten waar dezelfde handeling steeds herhaald moet worden (repetitive tasks) op de intrinsieke motivatie, en dan het ervaren plezier in de uitvoering van de taak in het bijzonder. Volgens de theorie van zelfbeschikking (self determination theory) van Ryan en Deci is intrinsieke motivatie voor een taak conditioneel gekoppeld aan drie randvoorwaarden: de autonomie om de taak op eigen wijze uit te voeren of te kiezen, een vriendschappelijke band met de docent of samenwerkingspartners en het gevoel dat de taak niet moeilijk is. Op basis hiervan hanteerden de onderzoekers de hypothese dat repetitive tasks niet motiverend zouden worden gevonden, maar dat als aan de drie randvoorwaarden van intrinsieke motivatie zou zijn voldaan, de repetitive tasks nog steeds positief geassocieerd zouden zijn met intrinsieke motivatie.

Dit viel tegen. In tegenstelling tot wat verwacht werd, bleken leerlingen die wisten dat ze weer aan de repetitive tasks moesten werken, juist minder gemotiveerd, zelfs als aan de drie randvoorwaarden van intrinsieke motivatie was voldaan! Deze verrassende uitkomst vatten de onderzoekers als volgt samen:

‘In hoofdstuk zes toonden we aan dat niet alle veronderstelde relaties daadwerkelijk worden gevonden en dat de relaties veranderen wanneer leerlingen een taak gaan maken die voor hen bekend is. Wanneer leerlingen bekend zijn met de taak leidde een hoge ervaren autonomie en gevoel van sociale verbondenheid zelfs tot het afnemen van intrinsieke motivatie. Motivatie blijkt dus niet in elke situatie op dezelfde manier bewerkstelligd te kunnen worden. Dit betekent dat zowel docenten als onderzoekers zich ervan bewust moeten zijn dat algemeen geldende richtlijnen om de motivatie van leerlingen te optimaliseren lastig te formuleren zijn.’ (Nuland, 2011, p. 134)

Question 55

Q

Kunnen er conclusies worden getrokken over de causale verbanden in de drie experimenten beschreven in de drie bronnen? Probeer in uw antwoord rekening te houden met het ontwerp van het experiment en de mogelijkheid van verstorende variabelen.

Answer

A

In het experiment van Van Lankveld is er een relatie tussen state en trait self focus enerzijds (de onafhankelijke variabelen) en sexual arousal anderzijds (de afhankelijke variabele). Bovendien gaan de state en trait self focus in de tijd vooraf aan de sexual arousal. De state focus is gerandomiseerd, dus over die variabele kunnen causale conclusies getrokken worden. Maar bij de trait focus zouden er storende variabelen kunnen zijn die mogelijk van invloed zijn op sexual arousal. Bijvoorbeeld de leeftijd van de respondent, het hebben van een partner en eerdere seksuele ervaringen. Het lijkt erop dat die variabelen ook daadwerkelijk gemeten zijn in het interview dat voorafging aan het experiment, maar of er ook voor is gecontroleerd, is niet duidelijk.

In het experiment van Van Hooren is er een relatie tussen de goal managementtraining en het objectieve en subjectieve functioneren, en de goal managementtraining gaat in de tijd vooraf aan het functioneren. Respondenten zijn op een randomwijze aan de controlee of experimentele conditie toegewezen. In principe is er dus sprake van een zuiver experiment. Als die randomisatie gelukt is, moeten de variabelen die mogelijk van invloed zijn op de relatie tussen de training en het functioneren gelijkelijk verdeeld zijn over beide condities. En dan kunnen er dus conclusies getrokken worden over causale verbanden. Maar of de randomisatie gelukt is, valt op voorhand niet te zeggen. Daarom zou het beter zijn geweest die variabelen toch op te nemen in het onderzoek en er via statistische analyses voor te controleren. Een belangrijke variabele die van invloed kan zijn op de relatie tussen training en functioneren is uiteraard leeftijd.

Ook in het experiment van Bruning is er een relatie tussen de stressinterventiestrategieën en de stressreacties, gaan de stressinterventiestrategieën vooraf aan de stressreacties en is er sprake van een randomtoewijzing aan de diverse condities, waardoor mogelijke variabelen die de relatie verstoren, gelijk verdeeld zijn over die condities. Conclusies over causaliteit lijken dus gerechtvaardigd. Echter, er is mogelijk sprake van een groot aantal storende variabelen. Bijvoorbeeld de variabelen leeftijd, geslacht, beroep, functie, aantal uren werkzaam en eerder gevolgde trainingen. Het zou beter zijn geweest om de belangrijkste van deze variabelen op te nemen in het onderzoek en te controleren via statistische analyses.

Question 56

Q

Na het college kwam een vraag over randomisatie, en dan met name of je kunt toetsen of randomisatie geslaagd was, zoals gesuggereerd in studietaak 1.3 bij het artikel van Van Hooren et al (2007). Kort antwoord: nee.

Answer

A

Langer antwoord zoals terug te horen in de opname, maar hier samengevat: randomisatie (mits objectief goed uitgevoerd) is een feit; een gedane zaak. Een hypothesetoets heeft geen zin, omdat je eigenlijk circulair daarmee toetst: wat is de kans dat de data die random verdeeld is random verdeeld is? Een weinig zinvolle vraag voor een hypothesetoets. Ik verwees voor een leuk en toegankelijk artikel hierover. Ik geef er hier twee. Het meest toegankelijke is het artikel van De Boer et al (2015), en een wat ouder en iets technischer doch goed toegankelijk artikel van Senn et al (1994)

Question 57

Q

gepaarde t-toets

Answer

A

De syntax voor de gepaarde t-toets was:

T-TEST PAIRS=nochunk WITH chunk (PAIRED)
/CRITERIA=CI(.9500)
/MISSING=ANALYSIS.

Question 58

Q

grotere steekproef

Answer

A

kleine verbanden worden significant, vaker aanwezig namelijk
te kleine steekproef te weinig power
bij interacties moderatie grotere nnodig