Statistiek termen Flashcards

1
Q

Verschil tussen willekeurige variatie in gedrag en bias (vertekening / vooringenomenheid) en waarom is bias een veel groter probleem?

A

Random variation - willekeurige variatie is variatie door toeval.

Bias is een systematische afwijking waardoor deze minder opvalt niet identiiceerbaar is door statistische technieken en niet niet corrigeerbaar is door gemiddelde.

Bij willekeurige variate / fouten vermindert de kans op statisch significante resultaten door meer vaiabiliteit in de resultaten.

Bij bias kan men de foute conclusie trekken dat de hypothese ondersteund werd door de resutlaten terwijl deze waargenomen resultaten te wijten zijn aan factoren irrelevant van de hypothesis.

Hierdoor wordt een bias als het ergst van de twee beschouwd.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Items in een meetinstrument?

A

In een meetinstrument wordden constructen gemeten met verschillende items of stimuli die samen het betreffende construct omvatten.

Items /stimuli kunnen

  • uitspraken zijn, (waarop gereageerd kan worden)
  • vragen, (waarop gereageerd kan worden) ,
  • taken en
  • observaties

Meestal bestaan meetinstrumenten uit meerdere stimuli /items en de daarbij behorende registraties van de reacties van deelnemers.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Zijn er in een meetmodel voor een manipulatie over het algemeen meerdere indicatoren? En waarom?

A

Neen want Meetmodellen worden meestal opgesteld voor meetinstrumenten (vb test / vragenlijst) want bij manipulaties (experiment) worden deelnemers vaak maar blootgesteld aan een stimulus / indicator.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Z-verdeling

A

= Een standaard normale verdeling = een normaalverdeling met een gemiddelde van nul en een standaarddeviatie van 1

= Z-verdeling

= handig want van elk datapunt in een z-verdeling is het duidelijk hoe ver het punt van het gemiddelde ligt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Welsh t versus students t

A

Welsh T = t toets voor ongelijke varianties

T-toets (regulier of student) = t toet voor gelijke varianties

Welsh T is altijd beter want strenger

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Spreidingsmaten - welke en waarvoor worden ze gebruikt?

A

Spreidingsmaten: de spreiding van de data wordt gerapporteerd om een goed beeld te geven van een datareeks.

  1. Range (bereik): verschil tss Max en Min = zeer gevoelig voor outliers
  2. Interkwartielafstand (IQR): data ordenen van laag naar hoog en vervolgens opsplitsen in kwartielen (25% - 1 e kwartiel, 50% = mediaan, 75% 3 de kwartiel). IQR = afstand tss 1 e en 3 de kwartiel)
  3. SS - Sum of Squares : Variatie (som vd gekwadrateerde afwijkingen vh gemiddelde) - kwadrateren omdat ze allemaal pos moeten zijn om ze bij elkaar op te kunnen tellen. Nadeel: de variatie wordt steeds groter naarmate er datapunten bijkomen, zelfs als deze die er bijkomen dicht bij het gemiddelde liggen. De spreiding wordt niet noodzakelijk meer dus beter is:
  4. MS - Mean Squares = Variantie = SS / aantal datapunten min 1 = gemiddelde van de SS = Voordeel: houdt rekening met aantal datapunten. Nadeel: niet dezelfde schaal als de data in de datareeks (gekwadrateerd)
  5. Std Deviatie (std afwijking) = wortel van de variantie (van de MS) = geeft de gemiddelde afwijking van het gemiddelde weer. Voordeel: dezelfde schaal als de data in de datareeks

SS grootst, MS tweede grootst en Std dev kleinst

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Centrum maten - welke en waarvoor worden ze gebruikt?

A

Centrummaten: gebruikt om data mee samen te vatten. ze geven op verschillende manieren het “centrum” van een bepaalde datareeks aan.

  1. Gemiddelde: totaal van al de scores gedeeld door aantal scores
  2. Mediaan (rangschikken van laag naar hoog en middelste datapunt of gemiddelde vd 2 middelste datapunten bij even aantal)
  3. Modus: waarde die het vaakst voorkomt - vooral informatief bij beperkt aantal mogelijke waardes of bij een grote hoeveelheid datapunten

Modus en mediaan zijn echt geobserveerde waardes, het gemiddeldde niet.

Het gemiddelde wordt ook vaak gebruikt om de score van een individu op een vragenlijst over een psychologisch concept samen te vatten. Bijvoorbeeld, om burn-out te meten, beantwoorden deelnemers meerdere vragen die gaan over emotionele uitputting, vermoeidheid, hopeloosheid en cynisme op een schaal van 1 (nooit) tot 5 (altijd). Per deelnemer kan vervolgens een gemiddelde score op de burn-outschaal worden berekend door de scores van alle items op te tellen en te delen door het aantal items.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

P-waarde: Welke zijn de aandachtspunten bij de P-waarde?

A
  • Statistische significantie is iets anders dan relevantie: vb. paar duizenden ondervragen maar klein verschil – er is een verschil maar misschien niet relevant (klein effect niet belangrijk)
  • Hoe groter de steekproef, des te kleiner de P waarde en is het resultaat eerder statistisch significant. Toets wordt berekend door verschillen in deelnemer aantal , bij een grotere steekproef is het verschil / verband rapper significant omdat je gewoon veel meer aantallen getest hebt.
  • P-waarde zegt niets over de aan – of afwezigheid van vertekeningen in het onderzoek (slecht onderzoek kan ook een P waarde aangeven – niet altijd zinvol)
  • P-waarde (0.05 of 5 % kan door elkaar gebruikt worden)
  • P-waarde altijd samen bekijken met andere statistieken zoals effect grootte en BI
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Welke zijn de 2 soorten operationalisaties?

A
  1. Meetinstrument:
  • Op consistente wijze een variabele kwantificeren
  • NIET beinvloeden
  • Gebruikt om constructen (naam en definitie van variabelen) te meten met verschillende items (stimuli) die samen het betreffende construct omvatten (vb items = uitspraken, taken, observaties)
  • Meetwaarden = de waarden die bepaald kunnen worden mbv een operationalisatie (vb puntenschaal van 1 - 7 , waarden zijn dan 1-7)
  • Datareeks afkomstig van eenzelfde meetinstrument = variabele (de term variabele wordt dus zowel gebruikt voor een theoretische variabele (bvb leervaardigheid) als voor een reeks datapunten die indicatief is voor de waarde van deze theoretische variabele
  1. Manipulaties:
  • WEL beinvloeden van een construct
  • Door manipuleren van variabelen in (quasi) experimenteel onderzoek kan onderzocht worden of er een causaal verband bestaat tss 2 variabelen
  • Er worden stimuli aan deelnemers gepresenteerd om een bepaalde toestand van of een verandering in het contruct te veroorzaken

Meetinstrumenten zijn ontwikkeld om een specifiek construct te meten terwijl manipulaties werden ontwikkeld om een specifiek contruct (of soms een combinatie van constructen) te beïnvloeden.

Alle operationalisaties, of het nu meetinstrumenten zijn of manipulaties resulteren per onderzoekseenheid in een datapunt per variabele. Binnen elk onderzoek (steekproef) is er dus een datareeks per variabele.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Welke zijn de 2 meetniviueaus voor continue variabelen?

A

Het intervalmeetniveau en ratiomeetniveau

  • Ordening en
  • Een vaste afstand tussen twee waarden. Aangezien er een verschil in zit dat telkens even groot is, hebben deze variabelen kwantitatieve waarden.

Intervalmeetniveau heeft geen nulpunt Als de waarde gelijk is aan 0, is er dan nog iets aanwezig? Zo ja, dan is het interval.

Enkele voorbeelden van intervalvariabelen zijn:

  • Jaartelling
    Dit jaar is 2019. Wanneer is de tijd begonnen? Het jaar 0? Neen, want ervoor was er ook al ‘tijd’: middeleeuwen, het ontstaan van de aarde, etc. De jaartelling heeft geen vast nulpunt.
  • IQ
    Bij IQ is er ook geen nulpunt. We geven dit een toewijzing van een nummer, maar 0 IQ is geen vast nulpunt. Het betekent niet dat er een volledige afwezigheid is van intelligentie.
  • Temperatuur
    Bij temperatuur is er vreemd genoeg ook geen nulpunt. Je zou denken dat 0°C het nulpunt is, maar er is nog steeds temperatuur bij 0°C. Bij Fahrenheit gebruiken we zelfs een andere meting. Hun ‘nulpunt’ ligt op een andere plaats, 32°C = 0°F. Bij deze voorbeelden is er geen verhouding. Als het buiten 30 °C is, is het niet twee keer zo warm als bij 15 °C.

VB welk meetniveau gebruik je voor tevredenheid met cijfers. Bijvoorbeeld: Hoe tevreden ben je op een schaal van 1 tot 5? Ook al zou je denken dat het meetniveau interval is, is dat niet zo. De cijfers zijn toewijzingen voor tevredenheid. Er is geen vaste afstand tussen elk puntje van tevredenheid.

Ratiomeetniveau

Dit is het hoogste meetniveau. Het verschil met het intervalmeetniveau is dat er hier een natuurlijk nulpunt aanwezig is.

Enkele voorbeelden van interval variabelen zijn:

  • Gewicht
    Bij 0 kg is er geen gewicht. Het is een duidelijk nulpunt.
  • Prijs
    Kost iets €0? Dan is het gratis, er is geen prijs.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Welke visualisaties van verdelingsvormen zijn er?

A

Density plots

Histogrammen

Q-Q plots

Box plots

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Welke soorten validiteit zijn er?

A

Validiteit of geldigheid is de mate waarin een meetinstrument meet of voorspelt wat het beoogt te meten.

De 2 benaderingen om te bepalen of een meetinstrument valide is:

Causale opvatting van validiteit: de test is valide om een bepaald construct te meten als het construct bestaat EN de verschillen tussen mensen op het construct tot verschillende uitkomsten op het meetinstrument leiden. Dus je kan pas nagaan of een meetinstrument valide is als je weet hoe het meetinstrument werkt (de processen kent) = onderzoeken welke processen verklaren hoe verschillen in het construct leiden tot verschillen in de testscores (daarom wordt vaak teruggevallen op constructvaliditeit). Zowel voor meetinstrumenten (bvb thermometer) als voor psychologische meetinstrumenten. Psychologisch= welke processen spelen allemaal een rol bij het tot stand komen van een reactie.

Constructvaliditeit: in hoeverre worden interpretaties van testscores ondersteund door theorie en empirisch bewijs voor het gebruikt van deze test / meetinstrument. De empirische evidentie voor constructvalidering is gebaseerd op de mate van samenhang tss variabelen en /of items

Face validity (indruksvaliditeit) is een van de meest basis maatstaven van validity - geldigheid. Researchers nemen de geldigheid van een procedure aan face validity wanneer het meetinstument de indruk geeft de variabele te meten die het verondersteld wordt te meten. Vb: een test die bepaalt of iemand introvert is of niet heeft indruksvaliditeit als het een maatstaf is voor persoonlijkheid maar duimlengte heeft dit niet.

Criteriumvaliditeit (criterion validity): Hierbij wordt de samenhang /corelatie tussen twee testresultaten bekeken: namelijk jouw eigen meting en een andere meting van de eigenschap die we proberen te meten of te voorspellen (het criterium) = de mate waarin de uitkomsten van een meetinstrument als verwacht samenhangen met die op een ander meetinstrument.

Externe validiteit: de mate waarin de uitkomsten van een studie gegeneraliseerd kunnen worden naar de doelpopulatie

Inhoudsvaliditeit: de mate waarin te items van het meetinstrument het gehele construct omvatten = de mate waarin de aspecten van het te meten begrip volledig worden gemeten met je meetinstrument.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Welke schattingsmethoden gebruikt, Statistische software om de waarden voor de 2 regressie coefficienten te berekenen?

A

Statistische software gebruikt schattingsmethoden om de waarden voor B0 en B1 (de 2 regressie coefficienten) te berekenen.
➢ De 2 meest gebruikte methoden zijn ordinary least squares en maximum likelihood

Hierbij geldt weer: de waarden komen uit een steekproef en puntschattingen zijn weinig informatief. Als we iets willen zeggen over de populatiewaarde, moeten we kijken naar betrouwbaarheids intervallen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Welke centrummaten zijn ook bruikbaar bij categorische variabelen?

A

Bruikbare centrummaten:
➢ Modus → kan bepaald worden bij ordinale en nominale variabelen
➢ Mediaan → kan ook bij ordinale meetwaarden bepaald worden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Welke 2 factoren zijn samen indicatief voor de kwaliteit van een operationalisatie in een gegeven steekproef?

A

Betrouwbaarheid en validiteit van de operationalisatie (zowel van een meetinstrument als van een manipulatie) in een gegeven steekproef!

Gegeven steekproef is belangrijk omdat een meetintstument dat in de ene populatie heel valide is kan in een andere steekproef niet valide zijn.

Dus betrouwbaarheid en validiteit zijn geen kenmerken van de operationalisatie zelf en zijn afhankelijk van de populatie / steekproef.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Nominale en ordinale variabelen ?

A
  • Nominaal: de data kunnen alleen worden gecategoriseerd (categorieen benoemd vb haarkleur (geen rangorde = laag meetniveau).
  • Ordinaal: De data kunnen worden gecategoriseerd en gerangschikt maar de afstand tss geordende categorieen is onbekend. Bvb opleidingsniveau = = categorische of discrete variabele
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Wat zijn meetwaarden van een operationalisatie?

A

De meetwaarden van een operationalisatie zijn de mogelijke waarden die behaald kunnen worden bij een operationalisatie. Vb je meet iets op een 7-puntenschaal dan zijn 1 tot en met 7 de meetwaarden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Manipulatie?

A

Manipulatie =

Als 2 equivalente groepen een andere behandeling krijgen. Deze manipulatie Is de operationalisatie van de variabele waarvan de onderzoeker de invloed wil onderzoeken. vb medicijn en placebo slikken.

Een manipulatie is dus een operationalisatie van een variabele, die bestaat uit een serie verschillende procedures waaraan de verschillende groepen worden blootgesteld.

CRUCIAAL: het enige verschil tss groepen bestaat uit de variabele die onderzocht wordt. Anders is het niet mogelijk conclusies te trekken over de invloed van deze variabele.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Gelijkenissen tussen een meetmodel en een structureel / conceptueel model?

A
  1. In beiden is de conventie om de variabelen die rechtstreeks gemeten of gemanipuleerd worden (indicatoren) voor te stellen met rechthoeken en de onderliggende variabelen met ovalen.
  2. In beiden geven de pijltjes de richting van het verband aan.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Aannames van regressie-analyse?

A

Enkelvoudige regressie-analyse heeft 5 aannames. 4 zijn harde aannames → als zij worden geschonden, is het regressie-model het verkeerde model. Schending van de laatste aanname maken het model minder efficiënt.

Naarmate harde aannames meer worden geschonden, neemt de zuiverheid van de schattingen van de regressiecoëfficiënten en proportie verklaarde variantie af. naarmate de zachte aannames meer worden geschonden, neemt de accuraatheid van de schattingen van de regressiecoëfficiënten en de proportie verklaarde variantie af.

  1. Continu meetniveau Beide variabelen moeten een continu meetniveau hebben (interval of ratio). Als 1 van de 2 een categorisch meetniveau heeft, kan beter een variantieanalyse worden toegepast.
  2. Lineariteit Het verband tussen de 2 variabelen moet lineair zijn. Dat betekent dat de toe- of afname van de ene variabele voor elke waarde van de andere variabele hetzelfde moet zijn. Of een verband lineair is, wordt meestal bepaald op basis van een patroon in de scatterplot
  3. Onafhankelijkheid Alle observaties moeten onafhankelijk zijn. Dat wil zeggen: alle onderzoekseenheden moeten onafhankelijk zijn. Of datapunten onafhankelijk zijn, ligt besloten in het studieontwerp en de wervingsstrategie voor deelnemers.
  4. Normaliteit Voor elke waarde van de voorspeller moet de afhankelijke variabele normaal zijn verdeeld. Dit is nodig door het algoritme dat in regressie-analyse wordt gebruikt om de best passende lijn te bepalen. Als de ruis in de afhankelijke variabele niet gemiddeld 0 is, klopt dat algoritme niet.
  5. Homoscedasticiteit Dit betekent homogeniteit (gelijkheid) van varianties en representeert de aanname dat de variantie in de afhankelijke variabele gelijk is voor elke waarde van de onafhankelijke variabele. Als deze zachte aanname wordt geschonden zijn de regressiecoëfficiënten geen efficiënte schatters meer. Is er sprake van homoschedasticiteit?
    a. Bestuderen scatterplot → als de punten niet overal even ver van de regressielijn af liggen, bijvoorbeeld in een trechtervorm, is er niet sprake van homoscedasticiteit.
    b. Toetsen voor homoscedasticiteit.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Wat zijn de 3 Voorwaarden voor een causaal verband tss 2 variabelen?

A
  1. De variabele die de invloed uitoefent (causale antecendent) moet eerder in de tijd gemeten of gemanipuleerd worden dan de andere variabele (causale consequent).
    1. Dit doe je door de causale consequent als laatste te meten
  2. De variabelen moeten samenhangen.
    1. Te onderzoeken met een statistische toets.
  3. Het verband kan niet verklaard worden door andere variabelen of externe invloeden. (confounders). Deze andere variabelen worden ook derde variabelen genoemd. Deze derde variabelen en externe invloeden noemen confounders.
    1. Trachten deze externe invloeden en derde variabelen in kaart te brengen maar allemaal is onmogelijk.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Continue variabelen?

A

Continue variabelen zijn kwantitatief = numeriek en zijn meetbaar op een ononderbroken schaal. Ze kunnen in de populatie oneindig aantal waarden aannemen.

2 meetniveaus binnen continue variabelen

  1. Intervalniveau: de data kunnen worden gecategoriseerd en gerangschikt en er zijn gelijke intervallen tussen de categorieën.
  2. Rationiveau: de data kunnen worden gecategoriseerd en gerangschikt, de intervallen zijn gelijk, en er is een absoluut of betekenisvol nulpunt.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Beschrijvingsmaten?

A
  1. Centrummaten:
    1. Gemiddelde
    2. Mediaan
    3. Modus
  2. Spreidingsmaten
    1. Range
    2. Interkwartielafstand (IQR min de mediaan)
    3. Std Deviatie (std afwijking)
    4. SS - Sum of Squares : Variatie
    5. MS - Mean Squares = Variantie
  3. Verdelingsmaten
    1. Modaliteit = toppigheid gemeten met Hartigans dip test = de verdelingsmaat
    2. Scheefheid = links- , rechtsscheef (asym) of symmetrisch: maat is scheefheid /skewness
    3. Spitsheid = maat is kurtosis (normaalverdeling kurtosis nul)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Wat zijn 3 valkuilen / aandachtspunten bij Correlatie?

A
  1. De interpretatie van hoe sterk variabelen is per definitie een subjectieve aangelegenheid. Vb Als het verband tussen paracetamol en dodelijke bijwerking heel klein is, zou dit
    toch cruciaal zijn omdat paracetamol zoveel wordt gebruikt.
  2. Correlatie zegt niets over de vraag of het verband tussen variabelen causaal is.
  3. Correlaties zijn altijd puntschattingen die worden berekend op basis van steekproeven. Ze verschillen daarom van steekproef tot steekproef. Zonder betrouwbaarheidsinterval kun je onmogelijk iets zeggen over de populatie.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Preregistratie

A

Pre-registratie houdt in dat men het volgende publiek maakt / vast legt:

  • De doelstelling van het onderzoek,
  • De studieopzet
  • De methoden van dataverzameling
  • De analyses die de onderzoekers zullen gebruiken,

Iedereen kan dus nagaan of de onderzoekers de studie op een ethische manier uitgevoerd hebben of zoals ze vooraf beweerd hebben.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Randomisatie?

A

Randomisatie: elke onderzoekseenheid (meestal deelnemer) wordt WILLEKEURIG toegewezen aan een van de groepen in een experiment.

Daardoor zijn bij voldoende grote groepen alle onderzoekseenheden in gelijkwaardige equivalente groepen ingedeeld. Dan zijn de confounders hetzelfde voor elke groep.

= oplossing voor confounders.

De kans dat de groepen in een bepaald experiment niet equivalent zijn, wordt groter naarmate er minder onderzoekseenheden in het onderzoek zitten.

Randomisatie is een noodzakelijke voorwaarden om conclusies te trekken over causaliteit (en bias te beperken)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Preregistratie en wat is full dislosure?

A

Preregistratie = van te voren vastleggen van

  • de onderzoeksvraag,
  • de onderzoeksmethode
  • methode van dataverzameling
  • methode van data-analyse

Full disclosure = volledige openheid geven over het onderzoeksproces. Vb omdat nu alles digitaal is kunnen data en meta-data (data over de data) meegepubliceerd worden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Matching?

A

Matching van condities:

De poging om manipulaties zodanig te ontwikkelen dat deze equivalent zijn in alle aspecten behalve voor wat betreft de te manipuleren variabele.

= Genereren van condities die in alle opzichten behalve de gemanipuleerde situaties hetzelfde zijn.

Doel invloed confounders uit te sluiten.

Manipulaties = condities gelijk zetten voor alles behalve de gemanipuleerde variabele en groepen deelnemers genereren die op bepaalde factoren hetzelfde zijn bvb zelfde leeftijdsverdeling of zelfde man-vrouwverhouding)

Equivalente groepen door randomisatie - willekeurig toewijzen van onderzoekseenheden aan condities / groepen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Verschil tussen een steekproevenverdeling van beschrijvingsmaten (bvb gemiddelde) en van een correlatie?

A

De correlatie kan nooit buiten het interval van -1 tot 1 liggen. Als de populatiecorrelatie dichter bij -1 of 1 ligt, is de kans dat door toeval de steekproefcorrelatie nog dichter bij 1 of -1 ligt een stuk kleiner
dan dat de steekproefcorrelatie dichter bij 0 ligt. Daarom wordt de steekproevenverdeling assymetrisch naarmate de populatiecorrelatie dichter in de buurt van -1 of 1 komt. De steekproevenverdeling van het gemiddelde is symmetrisch. Deze verdeling is smaller of breder
afhankelijk van de standaardfout en dus van de steekproefomvang, maar heeft altijd dezelfde vorm.n

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Verschillen tussen een meetmodel en een structureel / conceptueel model?

A

Twee soorten modellen ; meetmodel en conceptueel = structureel model.

  1. Het meetmodel illustreert de operationalisatie van een variabele. In een conceptueel / structueel model worden de operationalisaties niet gevisualiseerd.
  2. Een meetmodel bevat ALTIJD maar 1 construct/variabele (de operationalisatie kan uit 1 of meer onderdelen bestaan). Het conceptueel / structureel model laat zien hoe de onderzoeker verwacht dat de variabelen (meerdere variabelen) in een studie samenhangen (representeert de verbanden tss de variabelen die worden geanalyseerd).
  3. Een meetmodel illustreert de meetinstrumenten en manipulaties in een studie en bestaat uit ovalen (construct) en rechthoeken (indicatoren/items/stimuli), verbonden door pijltjes. Een structureel / conceptueel model bevat enkel de constructen / variabelen met hun verwachte samenhang.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Scheefheid: Wat is het verschil tussen een links- en rechtscheve verdeling?

A
  • Linksscheef: negatief scheef - minder data punten liggen links van het gemiddelde - modus ligt aan de rechterkant - waarnemingen / datapunten ad linkerkant liggen verder van het gemiddelde - glijbaan van curve afglijden naar links
  • Rechtsscheef; positief scheef - minder data punten liggen rechts van het gemiddelde - modus ligt aan de linkerkant - waarnemingen / datapunten ad rechterkant liggen verder van het gemiddelde - glijbaan van curve afglijden naar rechts
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

Betrouwbaarheid en validiteit verschil? Hoe kan een gebrek aan validiteit bijdragen aan de vertekening?

A

Betrouwbaarheid (reliability - replicability) is een bron van (meet) fouten en geldigheid /validiteit een bron van vertekening / bias.

Bron van fouten vermindert de kans op het bekomen van statistisch significante resultaten terwijl vertekening tot een foute hypothese kan leiden.

Een procedure kan betrouwbaar zijn maar niet geldig zijn.

Reliability / replicability / betrouwbaarheid: meet fouten - een maatstaf is betrouwbaar in de mate dat elke keer deze maatstaf gebruikt wordt, het gelijke resultaten oplevert bij een bepaald individu onder bepaalde omstandigheden. De betrouwbaarheid / replicability is lager naarmate een meetinstrument gevoeliger is voor toevallige verstorende invloeden. = NIET systematische meetfouten (ruis of random measurement error). BIj het bepalen van de betrouwbaarheid van een meetinstrument (stabiliteit over herhaalde metingen) wordt er vanuit gegaan dat datgene date gemeten wordt stabiel is.

Bvb. beoordelen over persoonlijkheid van mensen door het meten van hun duimlengte. Daar we bij elke meting dezelfde resultaten zouden krijgen is deze hoog betrouwbaar (replicability) . Echter deze zijn niet geldig daar er geen relatie is tussen duimlengte en persoonlijheid. Als je hieruit conclusies zou trekken krijg je bias want dan zou je bvb kunnen besluiten dat mensen met een langere duim intelligenter zijn of zo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

Frequenties: Wat is het verschil tussen absolute en relatieve frequenties?

A

Absolute frequenties = de aantalen / frequenties in de tabel

Relatieve frequenties = percentages die informatie geven over het aantal datapunten in een categorie tov het totale aantal datapunten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

Standaarddeviatie: Wat is het gevolg van een grotere standaarddeviatie op de waarde van p?

A

Omdat de t-waarde berekend wordt door het verschil tussen de gemiddelden te delen door de standaardfout, wordt de t-waarde kleiner als de standaarddeviatie (en dus de standaardfout) groter wordt. De gevonden t-waarde wordt dus minder extreem. Onder aanname van de nulhypothese wordt het dus waarschijnlijker om een dergelijke t-waarde te vinden. De p-waarde, die deze kans uitdrukt, wordt dus groter en zal minder vaak onder het significantieniveau (meestal .05) liggen.

Dit allemaal betekent dat de power van de toets dus lager wordt als de standaarddeviatie groter is. De betrouwbaarheidsintervallen worden overigens ook breder; deze worden namelijk berekend aan de hand van de standaardfout, die ‘meegroeit’ met de standaarddeviatie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

Standaard deviatie: Wat is het gevolg van een grotere standaarddeviatie op de waarde van Cohen’s d?

A

Omdat Cohen’s d berekend wordt door het verschil tussen de gemiddelden te delen door de standaarddeviatie, wordt Cohen’s d kleiner als de standaarddeviatie groter wordt. Het verband tussen de twee variabelen wordt dus zwakker. Als de steekproefomvang gelijk blijft, wordt ook de standaardfout groter als de standaarddeviatie stijgt.

Omdat de t-waarde berekend wordt door het verschil tussen de gemiddelden te delen door de standaardfout, wordt ook de t-waarde kleiner als de standaarddeviatie (en dus de standaardfout) groter wordt. De gevonden t-waarde wordt dus minder extreem. Onder aanname van de nulhypothese wordt het dus waarschijnlijker om een dergelijke t-waarde te vinden. De p-waarde, die deze kans uitdrukt, wordt dus groter en zal minder vaak onder het significantieniveau (meestal .05) liggen.

Dit allemaal betekent dat de power van de toets dus lager wordt als de standaarddeviatie groter is. De betrouwbaarheidsintervallen worden overigens ook breder; deze worden namelijk berekend aan de hand van de standaardfout, die ‘meegroeit’ met de standaarddeviatie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

Standaard deviatie: Wat is het gevolg van een grotere standaarddeviatie op de waarde van t?

A

Omdat de t-waarde berekend wordt door het verschil tussen de gemiddelden te delen door de standaardfout, wordt de t-waarde kleiner als de standaarddeviatie (en dus de standaardfout) groter wordt. De gevonden t-waarde wordt dus minder extreem. Onder aanname van de nulhypothese wordt het dus waarschijnlijker om een dergelijke t-waarde te vinden. De p-waarde, die deze kans uitdrukt, wordt dus groter en zal minder vaak onder het significantieniveau (meestal .05) liggen.

Dit allemaal betekent dat de power van de toets dus lager wordt als de standaarddeviatie groter is. De betrouwbaarheidsintervallen worden overigens ook breder; deze worden namelijk berekend aan de hand van de standaardfout, die ‘meegroeit’ met de standaarddeviatie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

Variabele - wat is het?

A
  1. Een variabele is iets dat varieert of zou kunnen varieren. Vb je ondervraagt enkel mensen uit NL dan varieert het land niet maar het zou wel kunnen dus is het nog steeds een variabele.
  2. Een reeks datapunten (datareeks) afkomstig van hetzelfde meetinstrument (bvb een 7 puntenschaal) wordt ook een variabele genoemd.

Een variabele wordt dus zowel gebruikt voor een theoretische variabele (bvb leervaardigheid) als voor een reeks datapunten die als de operationalisatie goed werkt, indicatief is voor de waarde van die theoretische variabele.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
38
Q

Standaard normaal verdeling?

A

Een standaard normale verdeling = een normaalverdeling met een gemiddelde van nul en een standaarddeviatie van 1

= Z-verdeling

= handig want van elk datapunt in een z-verdeling is het duidelijk hoe ver het punt van het gemiddelde ligt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
39
Q

Reflectief meetmodel

A

Meetmodellen worden meestal opgesteld voor meetinstrumenten (vb test / vragenlijst). Een meetmodel visualiseert hoe een variabele via stimuli of items wordt geoperationaliseerd.

Meetmodel: construct of variabele in ovaal, indicatoren (item / stimuli) in rechthoeken (bvb vragen in vragenlijst)

Reflectief meetmodel: In een reflectief meetmodel lopen de lijnen van het contruct, ook wel latente variabele genoemd naar de indicatoren.

De richting van de pijl is belangrijk! Een reflectief meetmodel waarbij de pijl loopt van het construct naar de inidcatoren veronderstelt dat het construct (bvb mate van neiging tot nadenken) bepaalt hoe op de indicatoren (de vragen bvb) wordt gescoord.

Een reflectief meetmodel is niet van toepassing op alle variabelen die binnen de psychologie en onderwijswetenschappen worden onderzocht.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
40
Q

Oplossing van de subjectiviteit van correlatie vooral bij een kleine steekproef?

A

De correlatie is een maat voor hoe sterk 2 variabelen samenhangen. Maar een puntschatting is deels door toeval tot stand gekomen. In elke steekproef is elke puntschatting weer net wat anders en in een kleine steekproef kan de correlatie in de populatie zelfs heel ver van de steekproefcorrelatie afliggen.
De oplossing hiervoor is altijd hetzelfde: betrouwbaarheidsintervallen berekenen op basis van de steekproevenverdeling.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
41
Q

Niet systematische meetfout

A

NIet systematische meetfout = toevallige invloeden op de testscore = fouten in onderzoek leiden enkel tot vermindering van de kans dat onderzoekers statistisch significante resultaten vinden (de variabiliteit dan de data stijgt). Dit wordt ook ruis of random measurement error genoemd. Naarmate de niet-systematische meetfout (ruis / random measurement error) kleiner is en er dus sprake is van minder toevallig verstorende invloeden is een meting betrouwbaarder.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
42
Q

Wat is de steekproevenverdeling van een correlatie?

A

De steekproevenverdeling is te beschouwen als de verdeling die we zouden krijgen als we onze steekproef oneindig vaak zouden herhalen, telkens de correlatie zouden berekenen en die
correlaties zouden combineren in 1 verdeling. De steekproevenverdeling bevat dus per definitie alle mogelijke correlaties die we zouden kunnen vinden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
43
Q

Wat is de proportie verklaarde variantie (hoeveel 2 variabelen overlappen)?

A

Onderzoekers willen vaak weten hoeveel van de afhankelijke variabele ze nu eigenlijk begrijpen. Een indicator hiervan is hoeveel van de variantie van de afhankelijke variabele verklaard kan worden met een regressiemodel: de proportie verklaarde variantie = R2 (correlatiecoefficient maal correlatiecoefficient).
Hoe hoger R2, hoe meer van de afhankelijke variabele wordt verklaard met de voorspeller. R2 kan waardes aannemen van 0 tot 1. Als alle geobserveerde scores exact op 1 rechte lijn liggen, is
R2 gelijk aan 1. Bij een enkelvoudige regressie is R2 gelijk aan het kwadraat van de correlatie tussen predictor en criterium. Wanneer de punten erg verspreid liggen rond de regressielijn, is R2 klein.
Ook hier moeten weer betrouwbaarheidsintervallen voor worden berekend.

Regressiecoëfficiënten maken het mogelijk om uit de ene variabele de andere te voorspellen en de R2’s geven een indicatie van hoe goed die voorspelling is. Dit blijven puntschattingen en kunnen
grote standaardfouten bevatten, dus daarom moeten we betrouwbaarheidsintervallen gaan berekenen.

Omdat R kwadraat de proportie verklaarde variantie is, wordt de P-waarde die uitdrukt hoe groot de kans op de gevonden R2 is als de voorspeller (onafh variabele) in de populatie niet samenhangt met de voorspelde (afhankelijke) variabele vaak berekend door gebruik te maken van de F verdeling.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
44
Q

Wat is de causale opvatting van validiteit?

A

Causale opvatting van validiteit: de test is valide om een bepaald construct te meten als

  1. het construct bestaat EN
  2. de verschillen tussen mensen op het construct tot verschillende uitkomsten op het meetinstrument leiden.

Dus je kan pas nagaan of een meetinstrument valide is als je weet hoe het meetinstrument werkt (de processen kent) = onderzoeken welke processen verklaren hoe verschillen in het construct leiden tot verschillen in de testscores (daarom wordt vaak teruggevallen op constructvaliditeit).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
45
Q

Bias?

A

Bias of vertekening van onderzoeksresultaten kan worden veroorzaakt door de eigen waarneming maar ook door een foutief onderzoeksdesign.

Bias zijn afwijkingen veroorzaakt door factoren buiten de onderzoekshypothese

Het gaat om systematische afwijkingen, een systematische fout die niet onderhevig is aan toeval.

VB meten met een meetlint dat begint bij 20 cm ipv 0 cm

Bias is een groot probleem in onderzoek daar statistische technieken de vertekening niet kunnen identificeren noch corrigeren (niet te compenseren)

NIet systematische meetfout = toevallige invloeden op de testscore = fouten in onderzoek leiden enkel tot vermindering van de kans dat onderzoekers statistisch significante resultaten vinden (de variabiliteit dan de data stijgt).

Bias daarentegen = systematische meetfout en kan leiden tot de verkeerde conclusie dat de onderzoekshypothese klopt terwijl het geobserveerde resultaat veroorzaakt wordt door een factor irrelevant (buiten de / onafhankelijk van) voor de hypothese. VB een meetlat begint bij 20 cm - er is een systematische afwijking

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
46
Q

Betrouwbaarheid (reliability)

A

Betrouwbaarheid (reliablity/replicabliity) heeft te maken met meetfouten en NIET met bias (systematische afwijkingen / vertekeningen).

1 e type betrouwbaarheid: Een maatstaf / measure is betrouwbaar wanneer elke keer dat deze maatstaf gebruikt wordt voor een bepaalde proefpersoon onder bepaalde omstandigheden dit vergelijkbare resultaten oplevert. Dit noemt men ook replicability /replicaarbaarheid. Bvb een lintmeter om cm te meten is niet zo betrouwbaar als een metalen meetlat.

Lage betrouwbaarheid is een bron van fouten en daardoor verlaagt de kans om statistisch significante resultaten te vinden in een onderzoek.

Betrouwbaarheid wordt gedefinieerd als de stabiliteit van een meetinstrument over herhaalde metingen. Voor een zuivere schatting van betrouwbaarheid te bekomen zouden herhaalde metingen onder gelijkblijvende omstandigheden moeten plaatsvinden. Er wordt ook van uigegaan dat wat gemeten wordt stabiel is (daarom niet te lange periode tussen 2 keer meten van intelligentie)/ Toch mag het tijdinterval niet te kort zijn want dan kan herinnering meespelen.

Naarmate de niet-systematische meetfout (ruis / random measurement error) kleiner is en er dus sprake is van minder toevallig verstorende invloeden is een meting betrouwbaarder.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
47
Q

Waarvan is de steekproevenverdeling van een correlatie (asymmetrich) afhankelijk?

A

De steekproevenverdeling van de correlatie bevat alle correlaties die je in een steekproef van een gegeven omvang kunt vinden. De steekproeveverdeling is afhankelijk van de populatiecorrelatie en
van het aantal datapunten (de steekproefomvang).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
48
Q

Waarom zijn psychologische constructen lastig te onderzoeken?

A
  • Er is geen eenduidige exacte definitie
  • Mensen hebben beperkte mogelijkheid tot introspectie
  • Niet direct observeerbaar
  • Er is geen algemeen gebruikte eenheid om deze variabelen te meten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
49
Q

Waarom wordt de steekproevenverdeling van de correlatie asymmetrisch?

A

Steekproevenverdeling van de beschrijvingsmaten zijn symmetrisch, .

De waarde van de correlatie tussen - en + 1 moeten liggen. Afwijkingen van de correlatie van de populatiecorrelatie komt door toeval (steek proef of meetfout). Als de populatiecorrelatie dicht bij - of + 1 ligt, is de kans dat door toeval de steekproefcorrelatie nog dichter bij - of + 1 ligt kleiner dan dat de steekproefcorrelatie dichter bij 0 ligt. Daarom wordt de steekproevenverdeling asymmetrisch naarmate de populatiecorrelatie dichter bij - of + 1 ligt.

  1. De steekproevenverdeling van de correlatie wordt meer en meer symmetrisch naarmate de omvang van de steekproef stijgt
  2. De kans op afwijkende correlaties bij kleine steekproeven is erg groot. Dit komt doordat in een kleine steekproef de invloed van een uitzonderljke waarde veel groter is. In een grote steekproef wordt deze invloed van toeval enigszinds ingeperkt.

BI van correlatie is nodig om een indicatie te kunnen geven over de accuraatheid van de correlatieschatting.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
50
Q

Waarom oppassen met het BI (betrouwbaarheidsinterval) van correlaties? En hoe wordt dit opgelost?

A

Een betrouwbaarheidsinterval kan berekend worden met de gegevens uit een steekproef en omvat, voor een gegeven percentage van de steekproeven, de populatiewaarde.
Steekproevenverdeling voor correlaties is echter niet symmetrisch. Deze formule zou alleen correct zijn voor correlaties die dicht bij 0 liggen of wanneer de steekproefomvang heel groot is. Berekenen
is daarom wat lastiger, maar statistische software kan dit makkelijk.
Met de betrouwbaarheidsintervallen voor correlaties kunnen we dus eigenlijk iets zeggen over het verband tussen 2 variabelen. Maar 1 studie is geen studie. Er kunnen verstorende factoren zijn
geweest, dus ook dit betrouwbaarheidsinterval uit een willekeurige steekproef kan zomaar naast de populatiewaarde liggen. Om echt uitspraken te kunnen doen, is het nodig om meerdere studies te combineren. Meta analyses = literatuurstudies waarbij uitkomsten uit meerdere studies gecombineerd worden, om op die manier hele nauwkeurige betrouwbaarheidsintervallen te kunnen berekenen.
Meta analyses zijn uiteindelijk de manier waarop onderzoeksvragen beantwoord worden. Omdat puntschattingen geen informatie bevatten over hoe accuraat ze zijn worden deze gecombineerd met zogenaamde p-waarden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
51
Q

Waarom kan het kiezen voor een categorisch meetniveau terwijl een variabele op continu niveau gemeten kan worden schadelijk zijn voor onderzoek?

A
  1. Meer deelnemers zijn nodig naarmate het meetniveau van de betreffende variabelen lager is. Een verband aantonen tss 2 continue variabelen vereist minder deelnemers dan wanneer 1 variabele categorisch is.
  2. Veel variabelen die we willen meten in onderzoek zijn continu. Categorische operationalisaties zijn niet altijd valide, omdat er vaak continue variabelen ten grondslag liggen aan de categorische variabelen.
  3. Het is altijd mogelijk om van continue variabelen terug te gaan naar lagere niveaus, maar niet andersom (als deelnemer 35-50 leeftijd aankruist, weet je niet hoe oud hij is)
  4. Groepen mensen bestaan vaak niet uit duidelijk te onderscheiden subgroepen.
    Je neemt bv aan dat iemand van 36 meer lijkt op iemand van 49 dan op iemand van 34?
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
52
Q

Vrijdheidsgraden

A

Voor het gemiddelde van een datareeks zijn de df = n−1, het aantal vrijheidsgraden van deze datareeks. Vrijheidsgraden, oftewel degrees of freedom (df) in het Engels, drukken uit hoeveel datapunten in een datareeks vrij kunnen variëren zonder dat de berekende statistiek verandert. Voor het gemiddelde van een datareeks zijn het aantal vrijheidsgraden n-1. Dat wil zeggen dat je in een datareeks alle datapunten behalve één willekeurige kunt veranderen. Dit ene datapunt moet een bepaalde waarde hebben om hetzelfde gemiddelde te behouden.

Stel je hebt een datareeks van vier observaties met een gemiddelde van 2,5. Dit betekent dat je 4-1 = 3 vrijheidsgraden hebt. Je kunt dus drie observaties willekeurig kiezen, de vierde wordt altijd bepaald. Je kiest voor de eerste drie observaties de waardes 1 2 3. De vierde observatie moet 4 zijn om op een gemiddelde van 2,5 uit te komen.

Stel je kiest voor de eerste drie observaties 0 0 0. De vierde observatie moet dan 10 zijn om het een gemiddelde van 2,5 te behouden. Dit kun je zo vaak herhalen als je wilt. Je kunt bijvoorbeeld de willekeurige waarden kiezen 28, 389 en 964. De vierde observatie moet dan -1371 zijn om op een gemiddelde van 2,5 uit te komen.

Het aantal vrijheidsgraden geeft aan hoeveel van deze datapunten er vrij kunnen veranderen zonder de essentie van de datareeks aan te tasten. Het aantal vrijheidsgraden verandert afhankelijk van hoeveel parameters de datareeks beschrijven. Hoe meer parameters je berekent, hoe minder waarden je willekeurig kunt aanpassen. Ingewikkelde statistische berekeningen vereisen daarom meer observaties.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
53
Q

Voordelen van werken met gestandaardiseerde waarden

A
  1. Z-score geeft aan hoe ver een waarde van het gemiddelde afligt
  2. Als de variabele ook normaal verdeeld is geeft de z-score informatie over hoe extreem het datapunt is
  3. Standaardisering maakt vergelijking mogelijk tss variabelen die op verschillende schalen gemeten zijn

Standaardisering is omrekenen van datapunten in z-scores

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
54
Q

Voorbeelden van probability samples - aselecte of random of willekeurige steekproef

A
  • Aselecte steekproef: iedereen heeft evenveel kans om in de steekproef te belanden
  • Gestratificeerde aselecte steekproef: populatie wordt eerst opgedeeld in subpopulaties adhv bep kenmerken relevant voor de onderzoeksvariabele. Daarna aselecte steekproef uit elke subpopulatie waarbij de verhouding tussen subpopulaties gelijk is aan die in de volledige populatie
  • Multilevel aselecte steekproef: als de te onderzoeken populatie al opgedeeld is in groepen (vb scholieren in scholen en in klassen). Eerst aselecte steekproef van scholen, dan van klassen .
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
55
Q

Voorbeelden van non-probability sampling (selecte steekproeven)

A

Convenience sampling:

  • Deelnemers worden gekozen op basis van enkele praktische criteria (vb geografische locatie, makkelijk toegankelijk (availability bias)
  • Wordt niet nagedacht over welke kenmerken de deelnemers moeten hebben.

Snowball sampling

  • Wel nagedacht over de kenmerken van de deelnemers.
  • Aantal deelnemers geselecteerd die andere deelnemers uitnodigen die voldoen aan bepaalde eisen

Purposive sampling:

  • Deelnemers worden weloverwogen geselecteerd op basis van specifieke kenmerken. Vooral bij kwalitatief onderzoek.

Quota sampling

  • Idee en procedure van deze vorm van steekproeftrekking is vergelijkbaar met het trekken van een gestratificeerde steekproef (opdelen vd populatie in subgroepen) maar hier worden selecte steekproeven toegepast op de verschillende subpopulaties
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
56
Q

Voor en nadelen van construct validiteit:

A

Constructvaliditeit: in hoeverre worden interpretaties van testscores ondersteund door theorie en empirisch bewijs voor het gebruikt van deze test / meetinstrument. De empirische evidentie voor constructvalidering is gebaseerd op de mate van samenhang tss variabelen en /of items. Constructvalidering kan bestaan uit het bepalen van de samenhang tussen items / stimuli / indicatoren en schalen onderling EN dat ook onderzocht wordt of er samenhang is met andere variabelen en uitkomsten zoals te verwachten is op basis van theorie en eerder onderzoek.

Voordeel: je moet niet weten hoe een meetinstrument werkt en er wordt ook niet nagegaan of het construct dat je wil meten wel bestaat. Dus validiteit is zo relatief makkelijk te onderzoeken. Bvb je legt deelnemers een aantal meetinstrumenten voor en bekijkt de samenhang van de scores op deze meetinstrumenten en het meetinistrument dat je interesseert.

Nadeel: deze samenhang met andere test scores of uitkomsmaten biedt geen inzicht of het meetinstrument daadwerkelijk het construct meet dat het zou moeten meten. Het kan ook iets anders meten dat toevallig samenhangt met de andere vragenlijsten of uitkomstmaten die zijn onderzocht.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
57
Q

Verschillende verdelingen

A

Z verdeling: rond 1 schatting / univariaat / een parameter bvb de datapunten zijn de lengtes van mensen = std normaal verdeling

T verdeling: schattingen van de parameters vb. regressie (verschillende parameters - schattingen van een regressie coefficient). T verdeling wijkt enkel voor een heel kleine steekproef af van de normaal verdeling.

F verdeling = P waarde van het hele model volgt een F verdelling ( 2 parameters B0 eb B1). De Levene’s toets is F verdeeld.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
58
Q

Verschillende toetsen en gebruik

A
  • Correlatie = verband tussen 2 continue variabelen vaststellen (r=effectmaat)
  • Regressie analyse = verband tussen 2 continue variabelen (een waarde voorspellen uit de andere waarde) / en dichotome variabele door 0 - 1 waarde toe te kennen aan beide categorieen = dummy coderen
  • Categorische variabelen (onafhankelijke variabele = categorisch - de afhankelijke variabele is continu) bestaande uit 2 groepen: t-test en effectmaat cohen’s d
    • Onafhankelijke t-toets (de meetwaarden van verschillende subjects
    • Gepaarde t-toets (meerdere meetwaarden bij zelfde subject)
  • Categorische variabelen (de onafhankelijke variabele - de afhankelijke is continu met meer dan 2 groepen : variantie-analyse
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
59
Q

Verschil validiteit (geldigheid) en betrouwbaarheid

A

Bij validiteit gaat het om het meten wat je beoogt te meten.

Betrouwbaarheid daarentegen gaat het om de vraag of je onderzoeksresultaten hetzelfde zouden zijn als je het onderzoek op dezelfde wijze nogmaals uitvoert.

Betrouwbaarheid (reliability - replicability) is een bron van (meet) fouten en geldigheid /validiteit een bron van vertekening / bias. Bron van fouten vermindert de kans op het bekomen van statistisch significante resultaten terwijl systematische vertekening tot een foute hypothese kan leiden.

Een procedure kan betrouwbaar zijn maar niet geldig zijn.

Bvb. beoordelen over persoonlijkheid van mensen door het meten van hun duimlengte. Daar we bij elke meting dezelfde resultaten zouden krijgen is deze hoog betrouwbaar (replicability) . Echter deze zijn niet geldig daar er geen relatie is tussen duimlengte en persoonlijkheid. Als je hieruit conclusies zou trekken krijg je bias want dan zou je bvb kunnen besluiten dat mensen met een langere duim intelligenter zijn.

Stel: Een onderzoekster wil weten hoe vaak mensen rommel op straat gooien en benadert daartoe op een drukke zaterdagmiddag in een winkelcentrum rechtstreeks een aantal respondenten met de vraag of zij zich hieraan weleens schuldig maken. De vraag leidt telkens tot hetzelfde antwoord: de overgrote meerderheid van de respondenten zegt dit niet te doen. Toch blijkt aan het einde van de middag de straat vol te liggen met kauwgomresten, papiertjes, stokjes, blikjes en plastic bekers. De respondenten hebben slechts sociaal wenselijke antwoorden gegeven toen hun op de man af werd gevraagd of zij weleens rommel op straat gooiden. De kans is groot dat de enquête, wanneer ze werd herhaald, opnieuw tot dezelfde resultaten zou leiden; in die zin is het een betrouwbaar instrument. Maar het onderzoek is niet valide, omdat het geen antwoord geeft op de gestelde onderzoeksvraag.

NIet betrouwbaar, wel valide: Stel: Op de afdeling Neonatologie van een ziekenhuis meet men de lichaamstemperatuur van pasgeboren baby’s. Daarbij wordt gebruikgemaakt van vijf oude thermometers, die een afwijking hebben tot twee graden Celsius gemiddeld. In dat geval is het meetinstrument niet betrouwbaar en kan het ziekenhuis beter andere thermometers kopen. De uitslagen zullen bij herhaling wel telkens rond een verwachte waarde bewegen (van twee graden onder de werkelijke temperatuur tot twee graden erboven), maar de uitslagen zijn niet betrouwbaar genoeg om er uitspraken op te baseren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
60
Q

Verschil tussen onderzoeksvraag en hypothese

A

Beantwoorden onderzoeksvragen en testen hypothese draagt bij aan bereiken doelstelling

In de praktijk maakt het voor de analyses niet uit of een onderzoeker een onderzoeksvraag of een hypothese formuleert. De analyses die verbanden tussen variabelen analyseren zijn dezelfde of die verbanden nu onderzoeksvragen of hypotheses betreffen.

➢Onderzoeksvraag: de te onderzoeken verbanden door onderzoekers worden verwoord in onderzoeksvragen

Hypothese = onderzoeksvraag die geformuleerd is als een stelling met een specifieke verwachting van de onderzoekers

➢Een hypothese verwoordt de verwachtingen van de onderzoeker, maar een onderzoeksvraag niet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
61
Q

Kritieke t-waarde, t-waarde en Wench’s t _ wat is het verschil?

A

Betrouwbaarheidsinterval voor het verschil tussen gemiddelden=

(Verschil tussen gemiddelde =) Steekproefwaarde + / - Breedte-index * standaardfout

De breedte-index komt in dit geval uit een t verdeling en noemt ook wel de kritieke t waarde. De software berekent deze kritieke t waarde (of opzoeken tabel)

Aantal vrijheidsgraden voor T verdeling is steekproefomvang (n) minus 2

De kritieke t- waardes verschillen tot aan 100 vrijheidsgraden (steekproefomvang van 102). Boven een steekproefomvang van 102 of DF van 100 is de kritieke t-waarde = 1.96

T-waarde gebruikt in de onafhankelijke t-toets. De onafhankelijke t-toets is de methode om de p waarde te berekenen voor het ruwe verschil tussen de gemiddelden en ook de p waarde van de bijhorende Cohen’sd. 1. T waarde berekenen en 2. de bijhorende P-waarde opzoeken (of software programma).

De formule voor de t-waarde is:( gemiddelde y1 - gemiddelde y2 )/se verschil

Welch’s t-toets is correctie van de gewone t-toets om rekening te houden met MOGELIJKE verschillende varianties tussen groepen. Tegenwoordig is de conventie om altijd deze Welch’s t-toets te gebruiken (berekend door software).

Het testen of K (aantal groepen) steekproeven gelijke varianties hebben (Homoscedastisch zijn) kan gedaan worden met Leven’s toets voor gelijkheid (homogeniteit) van varianties.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
62
Q

Verschil doelstelling, onderzoeksvraag en hypothese

A

Doelstelling = niet alleen wat een onderzoeker wil onderzoeken in een studie, maar ook wat het achterliggende doel is wat hiermee bereikt kan worden.

Een hypothese verwoordt de verwachtingen van de onderzoeker, maar een onderzoeksvraag niet.

➢ Elke studie heeft 1 of meer doelstelling en met deze doelstelling in het achterhoofd, worden de onderzoeksvragen geformuleerd

➢ Vervolgens wordt een hypothese geformuleerd op basis van theoretische en/of empirische evidentie. De hypothese is een onderzoeksvraag die geformuleerd is als een stelling met een specifieke verwachting van de onderzoekers

Beantwoorden onderzoeksvragen en testen hypothese draagt bij aan bereiken doelstelling

➢ In de praktijk maakt het voor de analyses niet uit of een onderzoeker een onderzoeksvraag of een hypothese formuleert. De analyses die verbanden tussen variabelen analyseren zijn dezelfde of die verbanden nu onderzoeksvragen of hypotheses betreffen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
63
Q

Verdelingsvormen en 3 termen om ze te beschrijven en 3 om ze te meten:

A

Verdelingsvorm: geeft informatie over de manier waarop de datapunten om het gemiddelde heen liggen

Deze vorm wordt bepaald door te kijken naar een grafische weergave van de data, een plot of grafiek (bvb histogram)

Verdelingsmaten: de 3 termen om een verdelingsvorm te beschrijven

3 termen om een verdelingsvorm te beschrijven

  1. Modaliteit = toppigheid (aantal toppen ve verdeling - komt van modus = de top = meest voorkomende waarde ie verdeling). Unimodaal - 1 top of multimodaal - meertoppig en bimodaal - 2 toppig.
  2. Scheefheid =/skewness
  3. Spitsheid = kurtosis

Verdelingsmaten

  1. Modaliteit gemeten met Hartigans dip test = de verdelingsmaat (0 = perfect unimodaal - hoe meertoppiger hoe groter deze waarde)
  2. Scheefheid: maat is scheefheid /skewness (symmetrisch of asymmetrisch) perfect symmetrisch skewness = 0
  3. Spitsheid = maat is kurtosis (normaalverdeling kurtosis nul)

Symmetrische bell curve = normaal verdeling

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
64
Q

Univariate statistiek

A

Met univariate statistieken kijk je naar één variabele,

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
65
Q

Underpowered studies -gevolg /gevaar

A

Studies met te weinig deelnemers zijn underpowered. Maar naast dat de kans in deze studies klein is om de nulhypothese te kunnen verwerpen ook al is er een daadwerkelijk verband in de populatie (type 2 fout) = onterechte aanname vd nulhypothese als waar, herbergen deze studies nog een extra gevaar dat in eerste instantie niet duidelijk is. Naarmate de daadwerkelijke populatiecorrelatie groter is, is de power van een studie met een gegeven steekproefomvang hoger. De correlatie die in een steekproef wordt gevonden, komt dan namelijk uit een populatiesteekproevenverdeling die steeds verder van de nulhypothese-steekproevenverdeling af ligt. Om een sterk verband aan te tonen, volstaat bij zulke sterke correlaties dus een relatief kleine steekproef.

Als in een underpowered studie een grote correlatie wordt gevonden, wordt daarom vaak gedacht dat de kleine steekproef klaarblijkelijk geen probleem was. Als er van tevoren poweranalyses waren gedaan op basis van die grote correlatie, was daar namelijk uitgekomen dat er maar weinig deelnemers nodig zijn om een fatsoenlijke power te bereiken. Deze redenering is echter fout, omdat steekproeven verdelingen bij kleine steekproeven heel breed zijn. Bijunderpowered studies is de kans dus redelijk groot dat er in een steekproef een relatief sterk verband wordt gevonden, terwijl er in de populatie helemaal geen verband is.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
66
Q

Type 2 fout

A

Type 2 fout

  • Als je de nulhypothese niet verwerpt , is er een kans dat je dit ten onrechte doet. Dan is er toch een effect / verband terwijl je aanneemt dat er geen effect is.
  • Type 2 fout = ten onrechte de nulhypothese niet verwerpen
  • Oplossing: grotere steekproef (hoe groter hoe minder kans op type 2 fouten) – meer power (= kans op detecteren van effect dat in de populatie aanwezig is) .

Type 2 fout = ten onrechte de nulhypothese aanhouden = de nuhypothese NIET verwerpen terwijl er wel een verband is tussen variabelen (de nulhypothese is niet waar - r / correlatie is niet 0). Dit is een nadelig gevolg van de mechaniek van NHST: als de alpha lager is, wordt de kans op een type 1-fout kleiner, maar de kans op een type 2-fout wordt groter. Gelukkig is hier een oplossing voor:
de steekproefomvang vergroten. Stel dat we een steekproef van 𝑛 = 500 deelnemers gebruiken. De steekproevenverdeling waarbinnen we de nulhypothese toetsen, is dan een stuk smaller.
Een steekproefomvang van bvb 𝑛 = 500 of meer maakt het dus mogelijk om de kans op een type 1-fout te beperken tot 1%, terwijl de kans op een type 2-fout ook beperkt blijft

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
67
Q

Type 1 fout

A

Type 1 fout:

  • Bij een alfa van 0.05 is er 5 % kans dat je een effect vindt in je steekproef terwijl er in de populatie geen effect is . Als je dit omdraait dan weet je 95% zeker dat er een effect is. Als je een P waarde van 0.001 dan heb je 99.999% kans dat je juist zit.
  • Type 1 fout = ten onrechte de nulhypothese verwerken
  • Oplossing: kleinere alfa

Een type 1-fout wordt gemaakt als de nulhypothese onterecht wordt verworpen, dus als er wordt geconcludeerd dat er in de populatie een verband bestaat terwijl dit eigenlijk niet zo is. Bij een alpha van .25 gebeurt dit in 25% van de getrokken steekproeven uit een populatie waar het betreffende verband niet bestaat. Het is belangrijk om de kans op een type 1-fout zo laag mogelijk te houden. Bij een
alfa van 5% zal je dus in 5% van de studies de nulhypothese verwerpen, terwijl deze in werkelijkheid wel waar is. Het is dus onvermijdelijk om af en toe de verkeerde conclusie te trekken. Dit heet een type 1-fout.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
68
Q

Onafhankelijke t-toets

A

Het verband tussen een dichotome variabele en een intervalvariabele kan getoetst worden met een onafhankelijke t-toets

Voor het verschil tussen 2 gemiddelden is het mogelijk om een p-waarde te berekenen. Deze p waarde is de p-waarde voor het ruwe verschil tussen de gemiddelden en ook de p-waarde van de bijbehorende Cohen’s d. De methode om deze p-waarde te berekenen heet de onafhankelijke t-toets. De t-toets bestaat uit 2 stappen:

  1. Berekenen van de t-waarde
  2. bepalen van de bijbehorende p-waarde met behulp van de t-verdeling.

De formule voor de t-waarde is:( gemiddelde y1 - gemiddelde y2 )/se verschil

(Cohen’s d = gemiddelde y1 min gemiddelde y2 / SD y)

Om de t-waarde te verkrijgen, wordt het verschil tussen beide gemiddelden gedeeld door de standaardfout van dat verschil. De standaardfout = de naam voor de standaarddeviatie in een steekproevenverdeling. Een t verdeling is zo’n steekproevenverdeling.

Een t-waarde van -4 betekent dat de 2 gemiddelden 4 standaard fouten van elkaar afliggen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
69
Q

Wleke zijn de 2 regressie coefficienten?

A

Intercept= het eerste getal uit de regressieanalyse is simpelweg de voorspelling voor iemand die 0 scoort op de predictorvariabele, oftewel een waarde van 0 op de x-as.(Y waarde bij 0 waarde op x as)

Hellingscoefficient = de tweede regressiecoëfficiënt oftewel, β1, is de helling van de lijn. Deze regressiecoëfficiënt geeft de stijging (of daling) in de variabele op de y-as aan als de variabele op de x-as met 1 eenheid toeneemt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
70
Q

T-verdeling

A

De steekproevenverdelingen voor B0 en B1 (de regressie coefficienten) is een t-verdeling. De t-verdeling = een variatie op de z-verdeling met een aanpassing voor kleine steekproeven van
bijvoorbeeld 10 of 20 deelnemers. Deze wordt niet opgesteld voor gegeven steekproefomvang, maar voor het aantal vrijheidsgraden
Df (degrees of freedom) = steekproefomvang (n) – aantal regressie coëfficiënten (=2). De t-verdeling is symmetrisch.
De t-verdeling wijkt alleen in kleine groepen af van de normaal verdeling (z-verdeling). Naarmate de groep groter wordt, gaat de t-verdeling de normaalverdeling steeds meer benaderen. Omdat kleine steekproeven te weinig power hebben om bruikbaar te zijn in onderzoek zijn de t- en z-verdeling in de praktijk vaak als equivalent te beschouwen. Toch is het beter om standaard met een t-verdeling te werken, want deze vereist geen subjectief oordeel over de vraag of een steekproef groot genoeg is.
De breedte van een normaalverdeling wordt bepaald door de standaarddeviatie. Een z-waarde van 1 correspondeert met een afwijking van 1 standaarddeviatie vanuit het midden van de verdeling
(vaak het gemiddelde). Bij de t-verdeling correspondeert een t-waarde van 1 met 1 standaardfout vanuit het midden van de verdeling af.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
71
Q

T verdeling

A

De t verdeling is symmetrisch

Bij statistiek wordt de t-verdeling meestal gebruikt om:

  • De kritische waarden voor een betrouwbaarheidsinterval te vinden als de data ongeveer normaal verdeeld zijn.
  • De corresponderende p-waarde te vinden van een statistische toets die de t-verdeling gebruikt (t-toets, regressieanalyse).

Naarmate het aantal vrijheidsgraden (totaal aantal waarnemingen min 1) toeneemt, zal de t-verdeling steeds dichter bij de standaardnormale verdeling (z-verdeling) komen te liggen, totdat ze nagenoeg hetzelfde zijn.

Boven 30 vrijheidsgraden komt de t-verdeling ongeveer overeen met de z-verdeling. Daarom gebruik je voor grote steekproeven de z-verdeling in plaats van de t-verdeling.

De z-verdeling wordt verkozen boven de t-verdeling, omdat de variantie bekend is bij de z-verdeling. Bij de t-verdeling wordt de variantie slechts geschat op basis van het aantal vrijheidsgraden. Hierdoor kunnen nauwkeurigere schattingen worden gemaakt met behulp van de z-verdeling.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
72
Q

T en Z verdeling

A

T-verdeling voor verschillen tss 2 groepen en voor de regressiecoefficienten.

De t-verdeling is een variatie op de z verdeling met een aanpassing voor kleine steekproeven met bvb 10 of 20 deelnemers.

Zulke kleine steekproeven zijn meestal niet ethisch. Bij steekproeven van 100 of meer zijn de t- en de z-verdeling (normaal verdeling) praktisch hetzelfde.

De t-verdeling wordt niet opgesteld voor een bepaalde steekproefomvang maar voor een gegeven aantal vrijheidsgraden. Bij regressiecoefficienten en vergelijking vd gemiddelde tss 2 groepen = n-2 (aantal regressiecoefficienten of groepen)

N= aantal deelnemers

Omdat heel kleine steekproeven te weinig power hebben om bruikbaar te zijn in wetenschappelijk onderzoek en we dus grotere steekproeven hebben , zijn de t - en z verdeling als praktisch equivalent te beschouwen. Toch is het beter om standaard met een t-verdeling te werken daar deze geen subjectief oordeel vereist over de vraag of een steekproef groot genoeg is.

Een z-waarde van 1 correspondeert met 1 standaarddeviatie van het gemiddelde.

Een t-waarde van 1 correspondeert met 1 standaardfout vanuit het midden van de verdeling.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
73
Q

Synoniemen voor effect van de ene variabele op de andere

A

In de statistiek is effect van de ene variabele op de andere =

  • samenhang tussen variabelen
  • als 2 variabelen samenhangen, zeggen ze in de statistiek dat dat de ene variabele uit de andere voorspeld kan worden

VERWARREND!!! In de statistische context wordt er GEEN causaliteit verondersteld bij deze formuleringen!

DUS enkel bij experiment causaal verband.

Als er geen sprake is van een experiment levert het design GEEN data op die conclusies mogelijk maken over causaliteit.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
74
Q

Synoniemen van probability samples

A

Probability samples - aselecte of random of willekeurige steekproef

75
Q

Synoniemen onafhankelijke variabele

A

X = x = onafhankelijke variabele

Covariaat

Predictorvariabele

Voorspeller

Predictor

De variabele die de invloed uitoefent = causale antecendent / onafhankelijke variabele). Zelfs bij cross sectioneel observationeel onderzoek hebben onderzoekers vaak ideeen over welke variabele invloed hebben op (de onafhankelijke variabele - oorzaak) op de andere variabele (gevolg)/

76
Q

Synoniem R kwadraat

A

Proportie verklaarde variantie = R kwadraat = kwadraat van de correlatie coefficient = het percentage van de ene variabele die kan verklaard worden door de andere. GEEN CAUSALE verklaring

77
Q

Synoniem intercept en hellings coeficient

A

Eerste regressiecoefficient maar opgelet

De regressiecoefficient = hellingscoefficient omdat er bij enkelvoudige regressie maar 2 regressiecoefficienten zijn en het intercept niet zo interesant is.

78
Q

Synoniem afhankelijke variabele

A

Criterium = Y = y = afhankelijke variabele = causale consequent = uitkomstmaat

De variabele die de invloed uitoefent (causale antecendent / onafhankelijke variabele) moet eerder in de tijd gemeten of gemanipuleerd worden dan de andere variabele ( - afhankelijke variabele = causale consequent )

Zelfs bij cross sectioneel observationeel onderzoek hebben onderzoekers vaak ideeen over welke variabele invloed hebben op (de onafhankelijke variabele - oorzaak) op de andere variabele (gevolg)/

79
Q

Structureel / conceptueel model

A

Twee soorten modellen ; meetmodel en conceptueel = structureel model.

Het meetmodel illustreert de operationalisatie van een variabele. Een meetmodel bevat ALTIJD maar 1 construct.

In een gewoon meetmodel wordt de operationalisatie van een variabele geillustreerd MAAR in een conceptueel / structueel model worden de operationalisaties niet gevisualiseerd.

Een gewoon meetmodel illustreert de meetinstrumenten en manipulaties in een studie en bestaat uit ovalen (construct) en rechthoeken (indicatoren/items/stimuli), verbonden door pijltjes.

Een structureel model verbeeldt theoretische verbanden tussen variabelen.

Het conceptueel / structureel model laat zien hoe de onderzoeker verwacht dat de variabelen in een studie samenhangen (representeet de verbanden tss de variabelen die worden geanalyseerd). In een conceptueel / structueel model worden de operationalisaties niet gevisualiseerd.

Het bevat enkel de constructen / variabelen met hun verwachte samenhang.

Pijltjes met 2 pijlpunten (bidirectioneel), verband maar niet bekend in welke richting / of ze elkaar ook echt beïnvloeden.

Pijl met 1 pijlpunt = de variabele heeft invloed op de andere variabele = causaal verband.

80
Q

Steekproevenverdeling

A

De steekproevenverdeling (sampling distribution) is de theoretische verdeling van een bepaalde maat (bvb gemiddelde) die je krijgt als je een oneindig aantal steekproeven uit de populatie zou trekken.

Meerdere steekproeven nemen en van alle steekproeven de gemiddeldes, std deviaties en waardes voor bvb spitsheid uitrekenen. Als je dan het gemiddelde neemt van al de bekomen gemiddeldes (gemiddelde van de verschillende gemiddeldes, de gemiddelden van alle verschillende std dev en de gemiddelden van bvb de verschillende spitsheidmaten) krijg je een gemiddelde dat veel dichter bij de waardes van de populatie ligt.

Omdat zo die steekproevenverdeling alle mogelijke uitkomsten bevat kunnen we deze redenering omdraaien. ALs we een willekeurige steekproef nemen komt ons steekproefgemiddelde eigenlijk uit zo een theoretische steekproevenverdeling met alle mogelijke gemiddeldes die we kunnen vinden.

De theoretische verdelingen van gemiddelden, standaard deviaties ,scheefheid, mediaan , modus, variantie, variatie ,spitsheidmaten enz heten steekproevenverdelingen.

81
Q

Steekproevenverdeling van het gemiddelde

A

De verdeling van zeer veel steekproeven is praktisch normaal verdeeld -centrale limietstelling: naarmate we meer en meer steekproeven nemen, lijkt de steekproefverdeling van het gemiddelde steeds meer op een normaalverdeling,

  • ONGEACHT de vorm van de populatieverdeling.
  • MAAR hoe meer de populatieverdeling afwijkt van normaliteit hoe grotere steekproeven nodig zijn om een normale steekproevenverdeling te krijgen
  • de theoretische steekproevenverdeling van gemiddelde is altijd normaal verdeeld BEHALVE voor hele kleine steekproeven (meestal niet realistisch)
  • het gemiddelde dat we hebben gevonden ligt in 68% vd gevallen 1 std deviatie vh WARE gemiddelde, in 95% 2 en in 99.7 % van de gevallen 3 std deviaties vh ware gemiddelde

De verdeling van zeer veel steekproeven is een stuk smaller dan de populatieverdeling

82
Q

Steekproevenverdeling van correlatie kleine versus grotere steekproef

A
  • Steekproevenverdeling wordt steeds meer symmetrisch naarmate de steekproefomvang stijgt.
  • Kans op sterk afwijkende correlaties bij kleine steekproeven (100 of minder) is erg groot.
  • Hoe kleiner de steekproef, hoe breder de steekproeven verdeling is. De steekproefcorrelaties, die namelijk uit deze steekproevenverdeling komen, liggen bij kleine steekproeven soms nog relatief ver van de populatiecorrelatie af.
  • Als de steekproeven groter zijn, wordt de steekproeven verdeling smaller. Dit betekent dat de correlatie die in een willekeurige steekproef gevonden wordt vaker dichtbij de populatiecorrelatie ligt. Bij een steekproef van 500500 deelnemers zijn forse afwijkingen al heel zeldzaam.
83
Q

Steekproef nemen: welke 2 soorten en wat is het verschil?

A

Probability samples - aselecte steekproeven - random of willekeurige steekproef

  • Elk lid van de populatie heeft een bepaalde bekende kans om opgenomen te worden in de steekproef
  • Hierdoor zijn uitspraken generaliseerbaar naar de hele populatie , hoge externe validiteit
  • Kwantitatief onderzoek: generaliseerbaarheid zeer belangrijk (dus aselecte steekproef)
  • Altijd sprake van niet- systematische meetfout - elke meting wordt op toevallige wijze een beetje verstoord.
  • Steekproeffout: puur door toeval kunnen outliers (uitzonderlijke) mensen in de steekproef belanden waardoor de steekproef minder representatief is zonder dat de onderzoekers dit realiseren.

Non-probability samples - selecte steekproeven

  • Je weet niet wat de kans is dat een bepaald lid vd populatie in de steekproef opgenomen wordt
  • Minder generaliseerbaar naar de volledige populatie
  • Meestal gebruikt bij kwalitatief onderzoek (intensief en daardoor maar kleine steekproeven onderzoeken - weloverwogen keuze van onderzoekseenheden nodig met bepaalde kenmerken die men wil onderzoeken)
84
Q

Stappen NHST

A
  1. Stel alpha vast (bijvoorbeeld op .05).
  2. Neem een steekproef van een gegeven omvang (𝑛), meet de betreffende variabelen en bereken de correlatie.
  3. Construeer op basis van de nulhypothese (“in de populatie geldt: 𝑟 = 0”) en de steekproefomvang (𝑛) de steekproevenverdeling van Pearson’s 𝑟 volgens die nulhypothese.
  4. Bereken de 𝑝-waarde, oftewel de proportie van de steekproeven verdeling die correlaties betreft die even extreem of extremer zijn dan de correlatie die in de steekproef in stap 1 is gevonden.
  5. Vergelijk deze 𝑝-waarde met de gekozen waarde van alpha, oftewel het significantieniveau. Conventioneel is deze 5%.
    • Als de gevonden 𝑝-waarde lager is dan alpha, verwerp dan de nulhypothese. Dit betekent dat er wordt geconcludeerd dat de twee variabelen samenhangen.
    • Als de gevonden 𝑝-waarde hoger is dan alpha, behoud dan de nulhypothese. Dit betekent dat er wordt geconcludeerd dat de twee variabelen niet samenhangen.
    Bij deze conclusie kunnen twee soorten fouten gemaakt worden. Als de nulhypothese daadwerkelijk waar is, kan een type 1-fout gemaakt worden: de nulhypothese kan ten onrechte worden verworpen.
    De kans hierop is exact gelijk aan de gekozen alpha. Als de nulhypothese daadwerkelijk onwaar is, kan een type 2-fout gemaakt worden: de nulhypothese kan ten onrechte worden behouden. Hoe groot de kans op zo’n type 2-fout is, hangt af van de daadwerkelijke correlatie (die altijd onbekend is) en de steekproefomvang.
85
Q

Standaardisering

A
  • Een speciale vorm van de normale verdeling is een normaalverdeling met een gemiddelde van 0 en een standaarddeviatie van 1. Dit heet een standaardnormale verdeling of z-verdeling.*
  • Deze z-verdeling is handig, want van elk datapunt in die verdeling is gelijk duidelijk hoe ver het van het gemiddelde ligt. Datapunten in een z-verdeling heten z-scores. .*

Als een datapunt een z-score van 22 heeft, betekent dit dat dit datapunt 22 standaarddeviaties boven het gemiddelde ligt. Dat betekent ook dat slechts 2,5%2,5% van de datapunten nog hoger ligt dan dat datapunt. We zagen net namelijk dat 95%95% van de datapunten binnen twee standaarddeviaties van het gemiddelde ligt, dat is 2,5%2,5% aan elke kant van de verdeling.

Omdat je van een z-score weet hoe ver deze van het gemiddelde ligt, kan het handig zijn om datapunten om te rekenen in z-scores. Dit proces heet standaardisering. Je kunt een waarde standaardiseren door het gemiddelde van deze waarde af te trekken en dat te delen door de standaarddeviatie. Dit is in onderstaande formule weergegeven.

z= (xi−gemiddelde) / sdx

z = z score

xi = elke aparte waarde die gestandardiseerd wordt / omgezet in een z score

x met streepje bovenop = gemiddelde van de datareeks

sdx = de standaarddeviatie

We kunnen zo in één oogopslag vaststellen dat het datapunt met een z-score van −1,28−1,28 een stuk onder het gemiddelde ligt. Er is geen sprake van heel extreme waardes.

Let op, de standaardisering van waarden verandert de onderliggende verdeling van deze waarden niet.

De z-score geeft aan hoe ver een waarde van het gemiddelde afligt. Als de betreffende variabele ook nog normaal verdeeld is, geeft de z-score bovendien informatie over hoe extreem dat datapunt is, omdat we weten welke proportie van de datapunten op welke afstand van het gemiddelde ligt. Verder maakt standaardisering de vergelijking mogelijk tussen variabelen die op verschillende schalen gemeten zijn. Standaardisering vertaalt de datareeksen naar dezelfde schaal, waarbij 0 staat voor het gemiddelde en 1 staat voor één standaarddeviatie. Z-scores kunnen dus in statistische analyses erg handig zijn.

86
Q

Standaard fout

A

De steekproevenverdeling (sampling distribution) is de theoretische verdeling van een bepaalde maat (bvb gemiddelde) die je krijgt als je een oneindig aantal steekproeven uit de populatie zou trekken.

De spreiding van de steekproevenverdeling moet gekend zijn om een nauwkeurige uitspraak te doen over het steekproefgemiddelde.

De standaard deviatie van een steekproevenverdeliing dus van de populatie noemt de standaard fout.

De standaardfout hangt af van de grootte van de steekproef. Hoe groter de steekproef, hoe smaller de steekproevenverdeling en hoe kleiner de standaardfout.

De standaard deviatie van de populatie kennen we nooit. Daarom gebruiken we om de standaardfout te benaderen de standaard deviatie van de steekproef.

Standaardfout = standaard deviatie van de populatie (sigma) gedeeld door de wortel van de steekproef grootte (wortel van n). Griekse letters staan voor de populatie.

Ipv de standaard deviatie van de populatie (sigma) gebruiken we dus de sd (std deviatie) gedeeld door wortel van n

87
Q

Standaard deviatie

A

Standaard deviatie = spreidingsmaat - geet aan hoe dicht de waarden van de datareeks om de centrummaten heen liggen.

Wortel van MS (MS = SS/ (n-1) )

SS = variatie = Sum of Squares

MS = variantie = mean squares

88
Q

Spitsheid

A

Negatieve waarde kurtosis = platter dan normale verdeling

Positieve waarde kurtosis = spitser dan normale verdeling

89
Q

SE proportie

A
  • SE proportie is de standaard error van een categorische variabele
  • P is de proportie is dat een waarde voorkomt = het percentage (gedeeld door 100)
  • en n is het aantal datapunten in een datareeks

SE proportie = wortel van P * (1-P) / 3

Vb 150 mannetjes en 200 vrouwtjes dan is P voor de vrouwtjes = 0.5714 (57.14%)

N = 350

SE proportie = wortel van (0.5714 * (1-0.5714) )/350 = wortel van 0.00069972 = 0.0265

BI = tss 0.5714 - 1.96 * 0.0265 en 0.5714+1.96*0.0265 = tss 0.51946 en 0.62334

90
Q

Scheefheid

A

Scheefheid; is de waarde negatief dan linksscheef

Positief - rechttscheef

  • Linksscheef: negatief scheef - minder data punten liggen links van het gemiddelde - modus ligt aan de rechterkant - waarnemingen / datapunten ad linkerkant liggen verder van het gemiddelde - glijbaan van curve afglijden naar links
  • Rechtsscheef; positief scheef - minder data punten liggen rechts van het gemiddelde - modus ligt aan de linkerkant - waarnemingen / datapunten ad rechterkant liggen verder van het gemiddelde - glijbaan van curve afglijden naar rechts
91
Q

Scheefheid - skewness - een verdelingsmaat

A

Scheefheid beschrijft of een verdeling symmetrisch of asymetrisch is. Asymmetrisch: de meeste datapunten liggen aan een kant van de schaal (links- of rechtsscheef).

Een eentoppige verdeling kan

  • Symmetrisch zijn: skewness = ongeveer nul,
  • Linksscheef: negatief scheef - minder data punten liggen links van het gemiddelde - modus ligt aan de rechterkant - waarnemingen / datapunten ad linkerkant liggen verder van het gemiddelde - glijbaan van curve afglijden naar links
  • Rechtsscheef; positief scheef - minder data punten liggen rechts van het gemiddelde - modus ligt aan de linkerkant - waarnemingen / datapunten ad rechterkant liggen verder van het gemiddelde - glijbaan van curve afglijden naar rechts
92
Q

Scatterplot opstellen

A
  1. Histogram: elke staaf stelt het aantal onderzoekseenheiden met een bepaalde score voor
  2. 2 histogrammen combineren: de ene op de y-as , de andere op de x- as.
  3. Voor elke onderzoekseenheid een lijn trekken van de score op beide assen en een stipje tekenen waar de lijnen elkaar kruisen
  4. Enkel stipjes overhouden = scatterplot
93
Q

Scatterplot: verband bepalen

A

Om het verband te bepalen kun je je een ellips inbeelden die zo getekend is dat de meeste punten erbinnen vallen. Je kunt ook een lijn inbeelden die zo goed mogelijk door de puntenwolk heen loopt.

Positief verband: de stipjes liggen grofweg in een wolk, of rondom een lijn, die van linksonder naar rechtsboven loopt.

Negatief verband: de stipjes liggen grofweg in een wolk, of rondom een lijn, die van linksboven naar rechtsonder loopt.

Geen samenhang /verband: de score op de ene variabele is niet te voorspellen uit de andere variabele. In dat geval liggen de stipjes in een ronde wolk, en loopt de lijn horizontaal,

94
Q

Regressie analyse: dichotome waarden, methode en gevolgen:

A

Om een dichotome voorspeller als intervalvariabele mee te nemen in regressieanalyse, moet aan elk van deze 2 waarden een getal toegekend worden. Het representeren van de meetwaarden van
een categorische variabele met getallen heet dummy coderen.
Bij een dichotome variabele krijgen de 2 categorieën bv. de waarden 0 en 1. Dit heeft als voordeel dat voor de deelnemers in de 0 categorie het regressiemodel een stuk simpeler wordt.
Voor categorie 1 wordt de formule: y = B0 + B1 * 0 = B0
→ B1 zal daardoor altijd 0 zijn, dus de best voorspelde waarde is altijd
het intercept.

Voor de andere categorie is de afhankelijke variabele (criterium) = B0 + B1 (intercept plus hellingscoefficient)

VB gemiddelde van groep 1 en gemiddelde van groep 2 zijn de beste voorspellers dan is de hellingscoefficient = het verschil tss de 2 gemiddelden in de 2 groepen. Alle regressiecoefficienten zijn verdeeld volgens de t verdeling met de bijbehorende standaard fout.

Als we het verschil tss de 2 gemiddelden delen door de std error = t waarde waar ook een p waarde mee kan berekend worden.

95
Q

Reflectief meetmodel

A

Een meetmodel visualiseert hoe een variabele /construct (ovalen) via stimuli of items (= indicatoren in rechthoeken) wordt geoperationaliseerd.

Reflectief meetmodel:

  • Er lopen lijnen vh construct (delatente variabele) naar de indicatoren
    • De richting van de pijl!!! : pijl van construct naar indicatoren - het construct bepaalt hoe gescoord wordt op de indicatoren
  • Dit is niet van toepassing bij ale onderzoeken id psychologie (bvb niet bij indexvariabelen)
96
Q

Quasi experiment

A

Een quasi experiment is een studie waarbij deelnemers in groepen ingedeeld worden op basis van gemeten variabelen zoals geslacht, leeftijd enz. Hierdoor is er niet bekend welke variabelen er nog meer verschillen tss de verschillende groepen. Confounders moeten zoveel mogelijk gelijk gehouden worden tss de groepen. = wordt gedaan als er interesse is in het effect van variabelen die niet te manipuleren zijn (geslacht , leeftijd enz)

97
Q

Q-Q plots

A

De plot splitst de data op in kwantielen. Kwantielen zijn breekpunten tussen even grote data.

  • Vb Decielen = 9 breekpunten die de datareeks in 10 even grote delen splitsen
  • Percentielen 99 breekpunten die de datareeks in 100 even grote delen splitsen

Geobserveerde kwantielen uit de data worden geplot tegen de verwachtte kwantielen op basis van een normaalverdeling.

  • Als de datareeks normaal verdeeld is liggen kwantielen allemaal op 1 diagonale lijn
  • Bij een niet normaal verdeling wijken de stipjes af

Q-Q plot vergelijkt de kwantielen van de empirische steekproef (geobserveerde kwantielen) met de corresponderende kwantielen van een normaal verdeling (theoretische verdeling). Liggen ze ongeveer op dezelfde lijn = normaalverdeling

Geobserveerde kwantielen op X as dan

  • Rechtstsscheef = datapunten in gebogen lijn beneden / ad rechterkant van de rechte
  • Linksscheef = datapunten in gebogen lijn boven . ad lkinkerkant vd rechte
98
Q

Publication bias en hoe deze te verkleinen

A

De neiging om enkel studies te publiceren die effecten laten zien.

De publication bias te beperken

  • door preregistratie in te dienen bij een journal, geaccepteerd en vervolgens wordt het onderzoek gepubliceerd ongeacht de resultaten.
  • Full disclosure = volledige openheid over het onderzoeksproces.

Preregistratie = van te voren vastleggen van

  • de onderzoeksvraag,
  • de onderzoeksmethode
  • methode van dataverzameling
  • methode van data-analyse
99
Q

Proportie in een frequentietabel

A

De proportie is het percentage voor elke meetwaarde tov het totaal aantal datapunten = aantal datapunten in een categorie ten opzichte van het totaal aantal datapunten.

Vb 333 pinguins : we tellen 165 vrouwtjes en 168 mannetjes dan is de proportie vrouwtjes in de steekproef 49.5 %

Hiervoor kan ook een betrouwbaarheidsinterval berekend worden met behulp van standaardfout.

100
Q

Power van de nulhypothesetoets

A

De power van de nulhypothesetoets is de kans dat we een verband van een bepaalde omvang kunnen detecteren aangenomen dat dit verband echt bestaat. Als de daadwerkelijke populatiecorrelatie groter is, wordt de power ook groter.

Omgekeerd wordt de power lager als de daadwerkelijke populatiecorrelatie dichter bij de nulhypothese correlatie ligt.

101
Q

Power analyses

A

Om te weten hoeveel data moet verzameld worden

102
Q

Power

A

Voordat wetenschappers data gaan verzamelen, moeten ze eerst berekenen hoe groot de steekproef moet zijn. Als er nulhypothese-significantietoetsing wordt gebruikt, wordt dit gedaan met zogenaamde powerberekeningen. Hiervoor is wel een aanname nodig, namelijk die van de daadwerkelijke populatiecorrelatie.

In de praktijk betekent dit dat onderzoekers van tevoren goed moeten nadenken over hoe sterk het verband is dat ze hopen aan te tonen. Vervolgens moet worden besloten hoe groot de gewenste kans op succes is. Ethische toetsingscommissies zoals de cETO vereisen zulke poweranalyses van onderzoekers. Het is namelijk niet ethisch om een studie te doen met zó weinig deelnemers dat de meeste verbanden, zelfs als ze bestaan, niet gevonden kunnen worden. Tegelijkertijd is het ook niet ethisch om meer deelnemers dan nodig te werven om de verwachte correlatie te detecteren. Deelnemers zijn een schaars goed waar zuinig mee omgegaan moet worden. Deelname aan onderzoek kost namelijk tijd en energie.

103
Q

Positief en negatief verband / correlatie

A

Een scatterplot is in te delen in vier kwadranten, die bij elkaar komen op het gemiddelde. Een punt dat verder van het gemiddelde af ligt heeft meer invloed op het verband tussen 2 variabelen dan punten
die dichterbij het gemiddelde liggen.

Als iemand op een variabele ver boven het gemiddelde scoort en op een andere variabele ook, draagt die persoon bij aan een positief verband. Personen die op beide variabelen juist onder het gemiddelde scoren, dragen ook bij aan een positief verband. Personen die op de ene variabele boven en op de andere variabele onder het gemiddelde scoren, dragen bij aan een negatief verband.

104
Q

Wat zijn de 2 redenen dat niet alle onderzoekseenheden in een populatie kunnen onderzocht worden?

A
  • Vaak is de populatie te groot.
  • Populatie is zodanig gedefinieerd dat deze ook mensen in verleden en toekomst bevat. Was dit niet het geval; dan verwijst data onmiddellijk na verzameling naar een populatie die niet langer bestaat.

om “houdbare” data te verzamelen over een populatie, wordt deze dus meestal gedefinieerd als een oneindig grote groep mensen.

105
Q

Platykurte verdeling

A

Spitsheid = kurtosis - beschrijft hoe spits of plat een verdeling is.

Platykurte verdeling = erg platte verdeling

De platste verdeling: alle waarden komen evenveel voor = uniforme verdeling

Hoe platter de verdeling - hoe kleiner de kurtosis (negatiever)

106
Q

P waardes

A
  1. Probability /waarschijnlijkheid – de kans op gevonden resultaat indien de nulhypothese juist is – is hoe groot is de kans op een effect in de steekproef terwijl er geen effect is in de populatie. – we willen dat deze kans zo klein mogelijk is
  2. We willen iets zinnigs kunnen zeggen over de steekproef
  3. Op basis vd P waarde besluiten om de nulhypothese te verwerpen of niet
  4. Hoe Kleiner , hoe beter

P < 0.05 bv. dan is er statitische significantie

De 𝑝-waarde is de kans op een gegeven puntschatting of een extremere waarde als die uit een gegeven steekproevenverdeling afkomstig zou zijn. In de praktijk is die steekproevenverdeling bijna altijd de steekproevenverdeling die zou gelden als de nulhypothese waar zou zijn, en de puntschatting is de puntschatting uit de eigen steekproef. De 𝑝-waarde kunnen we alleen uitrekenen onder de aanname dat de nulhypothese waar is.

Met een extremere waarde wordt hier een waarde bedoeld die verder van de nulhypothesewaarde afligt.

Bij een nulhypothesewaarde van 0 is dat dus een hogere waarde voor een positieve puntschatting en een lagere waarde voor een negatieve puntschatting.

Als een waarde bovendien zowel positief als negatief kan zijn, zoals het geval is bij correlaties, dan betekent “extremer” niet alleen hoger of lager, maar ook verder van 0 af in de andere richting. Bij een puntschatting van 𝑟 = .30 zijn de extremere waarden dus alle correlaties van 𝑟 > .30 én alle correlaties van 𝑟 < −.30. Bij de correlatie en bij aanname van de nulhypothese is P de kans om een bepaalde correlatiecoefficient te vinden MAAR voor correlatie moeten we deze P waarde verdubbelen want als we ervan uitgaan dat r = 0 en afwijkingen hiervan door toeval zijn , is er door toeval zowel een + als een - afwijking van deze nulhypothese mogelijk. (als we dat niet doen dan is het enkel de kans op een hogere correlatie)

Als de nulhypothese waar is en je berekent de 𝑝-waarde altijd onder de aanname dat dat zo is, dan zijn alle afwijkingen van 𝑟 = 0 namelijk altijd het gevolg van toeval. Toeval kan net zo goed tot positieve als tot negatieve correlaties leiden.

De P waarde voor verschil tussen gemiddelden , voor een t-waarde (zelfde p-waarde voor de bijhorende Cohen’sd). NHST. Nulhypothese: er is geen verschil tussen gemiddelden. Alfa = 5% voor bepalen van statistisch significant resultaat. Als P kleiner is dan 0.05 is het statistisch significant en gaan we ervan uit dat er een verschil is tussen de 2 groepen. De redenering is:

Als de nulhypothese klopt (geen verschil) dan is het wel heel toevallig dat we juist in deze ene steekproef zo een extreem verschil gevonden hebben dat in minder dan 5 % van de steekproeven voorkomt. Als dat toch gebeurt en de P-waarde lager ligt dan 5% Dan gaan we ervan uit dat de verdeling waar de gevonden t-waarde uitkomt wel niet gecentreerd zijn rond nul en dus ligt de populatieverdeling niet gecentreerd rond nul = verwerpen nulhypothese. We gaan er dus vanuit de de gemiddelden verschillen en dat beide variabelen samenhangen.

107
Q

Outlier

A

Outlier is een extreem datapunt dat ver af ligt van de rest vd datapunten en dus ook vh gemiddelde.

  • Vaak een teken dat er een fout in de data zit, maar soms horen outliers bij de data
  • Trekt gemiddelde naar zich toe , grote invloed dus op resultaten
  • Modus en mediaan zijn minder gevoelig voor outliers
108
Q

Operationalisaties

A

Een operationalisatie is de vertaling van de definitie van het theoretische construct (variabele) naar een meetinstrument of manipulatie - wordt gebruikt om psychologische constructen te meten.

Operationaliseren is de manier waarop de kenmerken bij de onderzoekseenheden worden gemeten. Een operationalisatie wordt gebruikt om psychologische constructen te meten. Operationalisatie maakt het construct concreet en tastbaar. Het construct is de vraag die we willen beantwoorden, de variabele die we willen meten.

2 operationalisaties

Meetinstrumenten zijn ontwikkeld om een specifiek construct te meten terwijl manipulaties werden ontwikkeld om een specifiek contruct (of soms een combinatie van constructen) te beïnvloeden.

Alle operationalisaties, of het nu meetinstrumenten zijn of manipulaties resulteren per onderzoekseenheid in een datapunt per variabele. Binnen elk onderzoek (steekproef) is er dus een datareeks per variabele.

109
Q

Onderzoeksvraag

A

Onderzoeksvragen = de te onderzoeken verbanden door onderzoekers worden verwoord in onderzoeksvragen. De onderzoeksvragen komen voort uit de doelstelling van het onderzoek. Doelstelling = niet alleen wat een onderzoeker wil onderzoeken in een studie, maar ook wat het achterliggende doel is wat hiermee bereikt kan worden

Onderzoeksvraag = de vraag waarop onderzoekers antwoord willen geven. Bijna altijd gaat die om het verband tussen 2 of meer variabelen

➢ Bij onderzoeksvragen die causaal verband willen onderzoeken, dan experimenteel design

➢ Bij samenhang vaststellen, dan observationeel design

110
Q

Onafhankelijke en afhankelijke variabelen

A

Vaak beschrijven onderzoeksvragen en hypothesen een causale relatie tussen variabelen. Het causale antecedent en het causale consequent kunnen niet worden omgedraaid. Causale verbanden vereisen experimentele designs, maar deze zijn in de praktijk niet altijd haalbaar. Het causale antecedent is bv moeilijk te operationaliseren als manipulatie, maar makkelijker als meting. Zelfs bij cross-sectioneel observationeel onderzoek hebben onderzoekers vaak ideeën over welke variabelen invloed hebben (oorzaak) op andere variabelen (gevolg).

Deze impliciet veronderstelde causale antecedenten en causale consequenten worden in de statistiek onafhankelijke en afhankelijke variabelen genoemd. Onafhankelijke variabelen zijn de veronderstelde causale antecedenten; afhankelijke variabelen zijn de veronderstelde causale consequenten. Onafhankelijke variabelen worden ook wel voorspellers of covariaten genoemd; de afhankelijke variabele heet ook wel het criterium of de uitkomstmaat.

Hoewel dit onderscheid voor de hand ligt bij experimentele designs, is het bij observationele designs wat artificieel. Er kan namelijk niets geconcludeerd worden over causaliteit. Toch is het ook bij observationele designs handig om over onafhankelijke en afhankelijke variabelen te spreken. Deze termen beschrijven efficiënt een deel van het structurele model en de achterliggende theorie.

111
Q

Observationeel design

A

observationeel design:

Gewoon meten wat er is.

Design waarbij 2 of meer variabelen gemeten worden, maar waarbij er GEEN sprake is van manipulatie. Causaal verband aantonen - experimenteel design. Samenhang vaststellen - observaties

112
Q

NHST

A

De nulhypothese-significantietoetsingsprocedure (NHST) houdt in dat de gevonden 𝑝-waarde vergeleken wordt met een vooraf bepaalde grenswaarde. Deze grenswaarde wordt alpha (𝛼), de kritische 𝑝-waarde, of het significantieniveau genoemd. De logica is nu als volgt: als de 𝑝-waarde van de puntschatting uit de steekproef erg klein is (𝑝 < 𝛼), dan zou het wel héél erg toevallig zijn dat deze puntschatting gevonden wordt onder de aannames op basis waarvan de nulhypothese-steekproevenverdeling is geconstrueerd. Conventie 0.05

Dus als 𝑝 < 0.05 kan je de nulhypothese verwerpen en de te bewijzen theorie aannemen. Bij een alpha van 5% zal je dus in 5% van de studies de nulhypothese verwerpen, terwijl deze in werkelijkheid
wel waar is (type 1 fout)

113
Q

Nul hypothese

A

Nulhypothese bij een onderzoek waarbij er een theoretische voorspelling is die een verband aantoont tss 2 variabelen = correlatie = 0 , dus er is GEEN verband

De nullhypothese is eigenlijk het omgekeerde van wat je wil bewijzen. De nulhypothese drukt uit wat je verwacht te vinden als de theoretische voorspelling niet klopt.
De nul staat voor “zonder theoretische voorspelling”
Als correlaties worden onderzocht, is de nulhypothese vaak: R=-0, oftewel de 2 variabelen hangen niet met elkaar samen.
Als 1 van de 2 variabelen dichotoom (variabele die maar 2 waardes kan aannemen) is, wordt de hypothesestelling meestal benaderd als het verschil tussen 2 groepen. Dan is de nulhypothese vaak: x1 = x2, oftewel u1 = u2 omdat u het populatiegemiddelde is.
Voor veel van deze nulhypotheses zijn steekproevenverdelingen opgesteld door middel van situaties die deze nulhypotheses representeerden. Daarmee was het mogelijk om voor een gegeven
puntschatting uit een steekproef op te zoeken hoe groot de kans ongeveer was dat je die puntschatting zou vinden als hij afkomstig was geweest uit de nulhypotheseverdeling. Deze kans heet de p-waarde.

114
Q

Modaliteit

A

Modaliteit wordt gemeten met Hartigans dip test = de verdelingsmaat

Modaliteit: beschrijft het aantal toppen ve verdeling

Doel: iets zeggen over de verdelingsvorm in de populatie op basis vd verdelingsvorm in een steekproef

  • unimodaal of
  • multimodaal (indicatie dat de populatie uit meerdere subpopulaties bestaat)

Perfecte unimodale verdeling heeft een diptestwaarde van nul. Deze waarde wordt steeds groter naarmate een verdeling meertoppiger is en minder eenduidig.

115
Q

Meta analyses

A

Meta analyses = literatuurstudies waarbij uitkomsten uit meerdere studies gecombineerd worden om op die manier hele nauwkeurige betrouwbaarheidsintervallen te kunnen berekenen. Meta analyses zijn uiteindelijk de manier waarop onderzoeksvragen beantwoord worden.

Meta-analyse = Integreren van evidentie uit meerdere studies.

Bij meta-analyses zijn eventuele hypotheses van onderzoekers niet zo relevant daar er enkel wordt vastgesteld hoe sterk de variabelen uit de onderzoeksvraag samenhangen.

BELANGRIJK: Het is wel noodzakelijk om in elk apart onderzoek minimaal 1 onderzoeksvraag en / of hypothese te formuleren = een handige samenvatting van de verwachtingen die voor het onderzoek bestonden op basis van theorie en empirie. Is transparanter en meer integer.

Een studie is geen studie: integratie van evidentie uit meerdere studies is nodig voordat echte conclusies getrokken kunnen worden. Een studie: hoog risico op bias en vaak te weinig deelnemers voor het kunnen trekken van algemene conclusies.

116
Q

Meta - analyses

A

Integreren van evidentie uit meerder studies wordt gedaan in meta-analyses. 1 studie is geen studie omdat individuele studies hoog risico op bias hebben

117
Q

Welke zijn de meetniveaus van variabelen?

A

Meetniveaus, ook wel meetschalen genoemd, zeggen iets over hoe nauwkeurig de variabelen (in een experiment) zijn gemeten.

Er zijn vier meetniveaus (of meetschalen) die van laag naar hoog kunnen worden gerangschikt.

Categorische of dicrete variabelen (nominaal of ordinaal)

  • Nominaal: de data kunnen alleen worden gecategoriseerd (categorieen benoemd vb haarkleur (geen rangorde = laag meetniveau) = categorische of discrete variabele vb geslacht
  • Ordinaal: De data kunnen worden gecategoriseerd en gerangschikt maar de afstand tss geordende categorieen is onbekend. Bvb opleidingsniveau = = categorische of discrete variabele

Continue variabelen:

  • Interval: meetniveau voor continue variabele. De data kunnen worden gecategoriseerd en gerangschikt en er zijn gelijke intervallen tussen de categorieën. Vb temperatuur
  • Ratio: meetniveau voor continue variabele: De data kunnen worden gecategoriseerd en gerangschikt, de intervallen zijn gelijk (2 m is twee keer zo lang als 1 m) , en er is een absoluut of betekenisvol nulpunt.

Dichotoom of binair nominaal meetniveau = variabelen met 2 mogelijke scores vb geslacht

118
Q

Meetmodel en de richting van de pijl

A

Een meetmodel visualiseert hoe een variabele / construct via stimuli of items wordt geoperationaliseerd. - illustreert de operationalisatie van een variabele.

Meetmodellen worden meestal opgesteld voor meetinstrumenten (vb test / vragenlijst) want bij manipulaties (experiment) worden deelnemers vaak maar blootgesteld aan een stimulus / indicator.

Reflectief meetmodel (van meetinstrument): in een reflectief meetmodel lopen de lijnen van het contruct, ook wel latente variabele genoemd naar de indicatoren.

De richting van de pijl is belangrijk! Een reflectief meetmodel waarbij de pijl loopt van het construct naar de indicatoren veronderstelt dat het construct (bvb mate van neiging tot nadenken) bepaalt hoe op de indicatoren (de vragen bvb) wordt gescoord.

Bij meetmodel voor een manipulatie: bestaat slechts uit 1 stimulus, item, indicator (in tegenstelling tot het meetmodel van een meetinstrument met meerdere indicatoren) De pijl bij het meetmodel van een manipulatie loopt in tegengestelde richting , van de indicator (vierkant) naar het construct (ovaal). De stimulus / indicator wordt aangeboden om het construct te beinvloeden.

119
Q

Meetmodel

A

Twee soorten modellen - meetmodel en conceptueel / structureel model.

Een meetmodel visualiseert hoe een variabele / construct via stimuli of items wordt geoperationaliseerd. - illustreert de operationalisatie van een variabele.

Variabelen of constructen worden weegegeven in ovalen

Stimuli / items die het construct operationaliseren vormen de indicatoren (vb de vragen op een vragenlijst) die in rechthoeken worden weergegeven

Meetmodellen worden meestal opgesteld voor meetinstrumenten (vb test / vragenlijst) want bij manipulaties (experiment) worden deelnemers vaak maar blootgesteld aan een stimulus / indicator.

Illustreren de meetinstrumenten en manipulaties in een studie.

De meeste studies bevatten een operationalisatie voor elk construct. Maar bvb depressie kan gemeten worden met 2 verschillende meetinstrumenten, bvb zelfrapportage vragenlijst en diagnostisch interview, dan zijn er 2 ovalen (subjectieve inschatting depressie en objectieve inschatting van depressie) waarbij pijlen vanuit deze 2 ovalen naar de 2 desbetreffende indicatoren lopen ( de subjectieve naar de items op de vragenlijst en de objectieve naar de vragen van het diagnostisch interview)

120
Q

Longitudinaal design

A

Als er meerdere meetmomenten zijn per onderzoekseenheid.

Bij wetenschappelijk onderzoek hebben deze de voorkeur omdat theorieen binnen een persoon interessantst zijn om te onderzoeken.

121
Q

Levene’s toets

A

Levene’s toets wordt gebruikt voor het toetsen of k (aantal groepen = k) steekproeven gelijke varianties hebben (homoscedastisch) zijn. Levene gebruikt hiervoor een robuste F-toets.

In statistische toetsen waar groepen met elkaar vergeleken worden en de assumptie geldt dat de varianties van de vergeleken groepen hetzelfde zijn, kan de Levene’s toets gebruikt worden om te toetsen of deze assumptie (gelijke varianties) klopt. In de meeste software wordt de Levene’s toets op basis van het gemiddelde gebruikt.

Teller: absolute verschil over alle groepen heen - absolute verschil per groep .

Als Levene’s test een significante F waarde geeft, P < alfa , dan verwerpt men de nulhypothese dat alle varianties hetzelfde zijn. Dan wordt aangenomen dat de variantie van minstens een groep afwijkt van de variantie van tenminste 1 andere groep.

F waarde = signaal / ruis

F-waarde = variantie van de groepsgemiddelden (tussen groepen) / gemiddelde van de varianties binnen groepen (within groeps)

122
Q

Leptokurte verdeling

A

Spitsheid = kurtosis - beschrijft hoe spits of plat een verdeling is.

Leptokurte verdeling = verdeling die erg spits is - meest spits is als alle datapunten dezelfde waarde hebben

Hoe spitser de verdeling - hoe groter de kurtosis

123
Q

Kwantitatief onderzoek

A

Kwantitatief onderzoek: onderzoek waarmee aan de hand van meetinstrumenten en manipulaties getallen worden toegekend aan variabelen. Deze getallen vormen de datareeks te analyseren met statistische software.

Nadeel: vereist operationalisaties van hoge kwaliteit

Vaak niet duidelijk hoe het meetinstrument werkt / niet geschikt voor nieuwe fenomenen.

Beperkt tot onderzoeken van variabelen waar al operationalisaties voor bestaan die ook valide en betrouwbaar moeten zijn als ze in een steekproef toegepast worden.

Kwalitatief onderzoek (essentieel om iets nieuws te leren) kan ideeen geven over hoe de wereld in elkaar zou kunnen zitten en kwantitatief onderzoek kan deze ideeen vervolgens bevestigen of ontkrachten.

124
Q

Kwalitatief onderzoek

A

Kwalitatief onderzoek heeft als doel het perspectief van deelnemers te interpreteren en te begrijpen. Nadeel: mensen hebben beperkte introspectie en zijn zich niet bewust van verstoringen in de informatieverwerking = beperkte geldingskracht.

Kwalitatief onderzoek is (essentieel om iets nieuws te leren.

Kwalitatief onderzoek kan ideeen geven over hoe de wereld in elkaar zou kunnen zitten en kwantitatief onderzoek kan deze ideeen vervolgens bevestigen of ontkrachten.

125
Q

Kritieke t-waarde

A

Betrouwbaarheidsinterval voor het verschil tussen gemiddelden=

(Verschil tussen gemiddelde =) Steekproefwaarde + / - Breedte-index * standaardfout

De breedte-index komt in dit geval uit een t verdeling en noemt ook wel de kritieke t waarde. De software berekent deze kritieke t waarde (of opzoeken tabel)

Aantal vrijheidsgraden voor T verdeling is steekproefomvang (n) minus 2

De kritieke t- waardes verschillen tot aan 100 vrijheidsgraden (steekproefomvang van 102). Boven een steekproefomvang van 102 of DF van 100 is de kritieke t-waarde = 1.96

126
Q

Kiezen voor een categorisch meetniveau terwijl een variabele op een continu niveau gemeten kan worden, kan schadelijk zijn voor het onderzoek om vier redenen.

A

Variabelen hebben niet altijd een vast meetniveau, het meetniveau van een variabele is een keuze die de onderzoeker maakt tijdens het operationaliseren. Leeftijd in jaren is bijvoorbeeld een intervalvariabele, maar wordt soms als ordinale variabele gemeten, bijvoorbeeld met de antwoordopties ‘jonger dan 18’, ‘18 tot 35’, ‘35 tot 50’, ‘50 tot 65’ en ‘ouder dan 65’. Meetniveaus zijn vaak dus niet zozeer eigenschappen van variabelen ‘in de realiteit’, maar kenmerken van operationalisaties, oftewel van meetinstrumenten of manipulaties.

Kiezen voor een categorisch meetniveau terwijl een variabele op een continu niveau gemeten kan worden, kan schadelijk zijn voor het onderzoek om vier redenen.

  1. Er zijn altijd meer deelnemers nodig naarmate het meetniveau van de betreffende variabelen lager is. Een verband aantonen tussen twee continue variabelen vereist minder deelnemers dan wanneer een van de variabelen categorisch is, laat staan als beide variabelen categorisch zijn.
  2. Veel variabelen die we willen meten in onderzoek zijn continu. Daar waar mensen categorieën waarnemen, blijkt na nader onderzoek meestal dat er in feite sprake is van een of meer onderliggende continue variabelen, die mensen min of meer arbitrair in groepen indelen. Categorische operationalisaties zijn dus niet altijd valide.
  3. Het is altijd mogelijk om van een continue variabele terug te gaan naar lagere niveaus, maar niet andersom. Als een deelnemer ‘35 tot 50’ aankruist, is onbekend of de leeftijd 36 is of 47.
  4. Groepen mensen bestaan vaak niet uit duidelijk onderscheidbare subgroepen. Elke indeling in categorieën geeft dus vaak een vertekening van de werkelijkheid. Het meten van variabelen op een categorisch meetniveau vereist namelijk dat harde grenswaarden, zogenaamde ‘cut-offs’, worden gekozen. Om het leeftijdsvoorbeeld weer te gebruiken: je neemt hierbij aan dat iemand van 36 veel meer lijkt op iemand van 49 dan op iemand van 34. Als dit niet zo is, is een cut-off van 35 niet goed te verdedigen.
127
Q

Kenmerken perfect normaalverdeling

A
  • Toppigheid: unimodaal (een topig)
  • Scheefheid: nul (symmetrische verdeling)
  • Kurtosis / spitsheid : nul (niet bijzonder plat noch spits)
  • 68% vd datapunten ligt binnen ongeveer 1 std deviatie vh gemidddelde
  • 95% vd datapunten ligt binnen ongeveer 2 std deviaties vh gemidddelde
  • 99.7% vd datapunten ligt binnen ongeveer 3 std deviaties vh gemidddelde

Veel variabelen in de natuur zijn normaal verdeeld.

Ook ruis, zoals meetfout is normaal verdeeld.

128
Q

Inhoudsvaliditeit

A

Inhoudsvaliditeit: de mate waarin te items van het meetinstrument het gehele construct omvatten = de mate waarin de aspecten van het te meten begrip volledig worden gemeten met je meetinstrument.

129
Q

Indruksvaliditeit

A

Face validity (indruksvaliditeit) is een van de meest basis maatstaven van validity - geldigheid. Researchers nemen de geldigheid van een procedure aan face validity wanneer het meetinstument de indruk geeft de variabele te meten die het verondersteld wordt te meten. Vb: een test die bepaalt of iemand introvert is of niet heeft indruksvaliditeit als het een maatstaf is voor persoonlijkheid maar duimlengte heeft dit niet.

130
Q

Hypothese

A

Hypothese = onderzoeksvraag die geformuleerd is als een stelling met een specifieke verwachting van de onderzoekers. Bij experimenten hebben onderzoekers meestal hypothesen. Ook bij observationeel onderzoek kunnen hypothesen geformuleerd worden.

De verwachting in de hypothese is meestal gebaseerd op psychologische en onderwijswetenschappelijke theorien of op basis van eerder verzamelde empirische evidentie.

  1. Doelstelling
  2. Onderzoeksvraag
  3. Hypothese (meestal specifiek)
131
Q

Hoe verhouden de uitkomsten van correlatie- en regressieanalyse zich tot elkaar?

A

Correlatie en regressie lijken op elkaar, alleen gaat regressieanalyse net een stapje verder. De correlatiecoëfficiënt die bij correlaties wordt berekend, is identiek aan de gestandaardiseerde regressiecoëfficiënt van de predictor (X = de onafhankelijke variabele - covariaat bij regressie-analyse) in regressieanalyse (de beta). Ook de p-waarde behorende bij de correlatie en die van de predictor zijn identiek.

Dit is logisch: deze regressiecoëfficiënten en correlatiecoëfficiënten hebben namelijk betrekking op exact dezelfde verbanden. Wanneer regressieanalyses worden uitgevoerd met meerdere voorspellers tegelijk zullen de p-waarden van de regressiecoëfficiënten en de correlatiecoëfficiënten wel afwijken. Bij bivariate (enkelvoudige) regressieanalyses zijn deze p-waarden altijd identiek.

132
Q

Hoe teken je een regressielijn voor dichotome voorspellers?

A

Het tekenen van een regressielijn voor dichotome voorspellers is makkelijk, want er zijn maar 2 waardes op de x-as. De lijn gaat van het gemiddelde van de ene waarde naar het gemiddelde van de andere
waarde. Het intercept is in dit geval het gemiddelde waar de waarde (toegekende categorie / getal) op de x as nul is.

133
Q

Hoe bereken je de variabiliteit van scores ?

A
  1. Een mogelijkheid is om de range te gebruiken = het verschil tussen de laagste en de hoogste waarde van een score in een distributie maar deze wordt maar bepaald door 2 scores.
  2. De variantie houdt rekening met alle scores en is een betere maatstaf van variabiliteit.

4 stappen voor het berekenen van variantie:

  1. bepaal het gemiddelde van de scores
  2. bepaal de afwijking (deviation): verschil tss iedere score en het gemiddelde
  3. Verhef elke afwijking tot de tweede macht (vermenigvuldig met zichzelf)
  4. Bereken het gemiddelde van alle resultaten van stap 3 (afwijkingen tot de 2 de macht)

Hieruit berekenen we de standaard awijking door de wortel van de variantie (het resultaat van stap 4) te nemen. Deze laatste stap is nodig omdat de variantie niet dezelfde meeteenheid is van de scores in originele vorm (werden tot de 2 de macht verhoffen)

134
Q

Histogrammen met normale curves

A

Vooral handig om snel afwijkingen te zien van de normaal verdeling en daardoor de verdeling van de data goed te kunnen beoordelen.

Een staafdiagram (bar chart) maak je bij een categorische / discrete verdeling. Dit gaat bijna altijd om kwalitatieve data (nominaal of ordinaal). Een histogram maak je bij een continue verdeling. Dit gaat altijd om kwantitatieve data (interval of ratio). Met een staafdiagram kan geen density plot gemaakt worden. Geen verdelingsvormen bij categorische variabelen.

135
Q

Gepaarde T-toets of afhankelijke t toets

A

De gepaarde t-toets

Bij de onafhankelijke t-toets wordt de continue variabele gemeten bij verschillende personen, namelijk de te vergelijken groepen.

Als je bij dezelfde mensen 2 keer een meting doet, is er wel een verband tussen die 2 metingen. Het zijn afhankelijke of gepaarde metingen. Ander voorbeeld afhankelijke meting: ➢ Voor en na meting. Je doet eerst bij iedereen een voormeting, dan vindt de manupulatie plaats en vervolgens de nameting. ➢ Als 2 personen oordelen over dezelfde persoon (jij doet een schatting van je cijfer en je docent doet dat ook). Voordelen van gepaarde t-toetsen Door op individueel niveau verschilscores uit te rekenen, elimineer je de individuele verschillen in een beoordeling. Omdat je maar 1 meting per persoon hebt, weet je niet of de lage of hoge meetwaarden komen doordat ze beoordeeld zijn door mensen die nu eenmaal lage of hoge oordelen geven, of dat deze spreiding in scores door steekproeven of meetfout komt. ➢ Deze variantie door persoonlijke verschillen manifesteert zich in een zogenaamd between subjects design als meetfout en resulteert in grotere standaarddeviatie. Within subjects desing = wanneer dezelfde personen vaker gemeten worden. Gepaarde meetwaarden elimineren persoonskenmerken, want je vergelijkt, de score van elke persoon namelijk met een andere score van diezelfde persoon. Verschillende berekeningen bij gepaarde t-toetsen

De t-waarde bij de gepaarde t-toets is het gemiddelde gedeeld door de standaardfout De berekening voor Cohen’s d is vergelijkbaar. In plaats van het verschil tussen de gemiddelden, wordt het gemiddelde van de verschilscores gedeeld door de standaarddeviatie.

Power voor gepaarde t-toetsen: Voor gepaarde t-toetsen zijn veel minder deelnemers nodig. Deze deelnemers moeten wel allemaal 2 keer gemeten worden.

136
Q

Full dislosure?

A

Full disclosure = volledige openheid geven over het onderzoeksproces. Vb omdat nu alles digitaal is kunnen data en meta-data (data over de data) meegepubliceerd worden.

137
Q

Frequentieverdeling en waaruit bestaat de frequentietabel?

A

Frequentieverdeling = bestaat uit de frequenties, oftewel de aantallen, voor elke mogelijke meetwaarde.

Meestal opgevraagd voor categorische variabelen en meestal niet zo handig voor continue variabelen omdat er bij continue variabelen te veel meetwaarden zijn (lange lijst met kleine aantallen).

De frequentietabel bestaat uit

  1. De frequenties
    ➢ Aantal datapunten voor elke meetwaarde
  2. Percentage voor elke meetwaarde tov totaal aantal datapunten ➢ Missing values (datapunten die geen meetwaarde hebben) tellen ook mee in totaal
  3. Percentage voor elke meetwaarde van het aantal datapunten waarvoor wel een meetwaarde bekend is
  4. Cumulatieve percentage tov dit laatste subtotaal
    ➢ = percentage van een bepaalde meetwaarde samen met de percentages van alle lagere meetwaarden.

Absolute frequenties = de aantalen / frequenties in de tabel

Relatieve frequenties = percentages die informatie geven over het aantal datapunten in een categorie tov het totale aantal datapunten.

138
Q

Formulering van onderzoeksvragen en hypotheses op theoretisch versus operationeel niveau

A

Theoretisch niveau: de genoemde variabelen zijn de namen van constructen zoals ze in wetenschappelijke theorieën voorkomen. Deze kunnen op verschillende manieren geoperationaliseerd worden.

Operationeel niveau: deze formulering benoemt de operationalisaties van elk construct en ideaal gezien ook de verwachtte effectgrootte

139
Q

File drawer problem

A

Onderzoek dat geen effecten laat zien blijft in de kast liggen. Publication bias

140
Q

ANOVA - F-waarde

A

Als Levene’s test (F-verdeeld) een significante F waarde geeft, P < alfa , dan verwerpt men de nulhypothese dat alle varianties hetzelfde zijn. Dan wordt aangenomen dat de variantie van minstens een groep afwijkt van de variantie van tenminste 1 andere groep.

F waarde = signaal / ruis

Signaal = modelvariantie

Ruis = Residuele variantie

F-waarde = variantie van de groepsgemiddelden (tussen groepen) / gemiddelde van de varianties binnen groepen (within groeps)

F = MS b / MS w

MS = SS / df

Df = de degrees of freedom die bij de term hoort

SS = opgetelde gekwadrateerde afwijkingen van het gemiddelde

De DF van de MS b (between / tussen groepen) = aantal groepen (k) - 1

De DF van de MS w (within / binnen groepen) = N-k (N = steekproefgrootte = totaal aantal personen)

141
Q

F-verdeling

A

Omdat R2 de proportie verklaarde variantie is, wordt vaak de F-verdeling gebruikt om de p-waarde te berekenen die uitdrukt hoe groot de kans op de gevonden R2 is als de voorspeller in de populatie
niet samenhangt met de voorspelde variabele

142
Q

ANOVA en welke post hoc testen

A

F-waarde (als de homogeniteit van varianties geschonden wordt / ongelijke varianties dan Welch F) berekenen , dan de P waarde

Als statistisch significant weten we dat er een verschil is tussen groepen maar niet waar / welke groepen.

  • Multiple t-toeten (t en p waardes voor elke combinatie) : niet aangewezen bij veel groepen - iedere extra hypothesetoets brengt de toename op de kans voor een type 1 fout met zich mee
  • Verschillende correcties te gebruiken voor het verminderen van type 1 fout (type 2 fout stijgt wel)
    • Bonferroni - correctie: assumptie van aantal observaties per groep gelijk en de variantie tussen groepen is gelijk (delen van alpha door aantal paarsgewijze vergelijkingen of p waarde vermenigvuldigen met aantal paarsgewijze vergelijkingen
    • Tukey-Kramer: assumptie aantal observaties per groep NIET gelijk en de variantie tussen groepen is gelijk. Aangepaste t toets met correctie van type 1 foutinflatie. Qs = Ya-Yb/SE. Verschil met gewone t-toets is dat het minimum van het maximum afgetrokken wordt. = hierdoor wordt het een studentized t-verdeling. = conservatievere p waarde
    • Dunnett’s t-test assumptie variantie tussen vergeleken groepen is gelijk. Set van experimentele condities getoetst tegen een controle conditie (paarsgewijze vergelijking met controleconditie)
    • Games-Howell test: Assumptie van ongelijke groepsgroottes en ongelijke varianties tussen groepen. Correctie op aantal vrijheidsgraden
143
Q

Extrapolatie en interpolatie (regressie)

A
  • *Extrapolatie** = het berekenen van voorspellingen van een model voor waarden buiten het bereik van de data waarop dat model gebaseerd is.
  • *Interpolatie** = het gebruik van een model om tussenliggende waarden te berekenen.
144
Q

Externe validiteit

A

Externe validiteit: de mate waarin de uitkomsten van een studie gegeneraliseerd kunnen worden naar de doelpopulatie

145
Q

Experimenteel design

A

Design dat 1 of meer manipulaties bevat en waarbij deelnemers worden beïnvloed. Dit is nodig om conclusies te trekken over het bestaan van een causaal verband tss variabelen.

146
Q

Anova: Effectmaten bij Anova

A
  • R kwadraat = n kwadraat = SSm / SSt = gebaseerd op een steekproef en onzuiver dus omega kwadraat is beter
  • W kwadraat = omega kwadraat = (SSm - df m * MS r ) /(SSr + MSr))
147
Q

Effectmaat en effect grootte

A

De correlatie is een zogenaamde effectmaat.

  • *Effectmaat** = groep statistische maten die aangeeft hoe sterk een verband is op een schaalverdeling onafhankelijk van de gebruikte operationalisaties.
  • *Effectgrootte** = sterkte van het verband.

Effectmaten hebben altijd dezelfde schaalverdeling waardoor het mogelijk is om vuistregels te formuleren.

Correlatie samenhang (effect groottes)

  • 0.1 - - 0.7 ZEER sterk negatief +0.1 - +0.7 ZEER sterk positief
  • 0.7 - -0.5 Sterk negatief +0.7 - +0.5 Sterk Positief
  • 0.5 - -0.3 Middelsterk negatief +0.5 - +0.3 Middelsterk positief
  • 0.3 - -0.1 Zwak negatief +0.3 - +0.1 Zwak positief
  • 0.1 - 0.1 Triviaal
148
Q

ANOVA wat is SSt en SSm?

A
  • SSt = N times variance = total variation in the data = Add differences between each group value (for all groups take each value) and the overall mean value (mean of all groups together)
  • SSm = the variance our model explains = add the difference between each group value and its group mean value
149
Q

Doelstelling

A

Doelstelling = niet alleen wat een onderzoeker wil onderzoeken in een studie, maar ook wat het achterliggende doel is wat hiermee bereikt kan worden.

➢ Elke studie heeft 1 of meer doelstelling en met deze doelstelling in het achterhoofd, worden de onderzoeksvragen geformuleerd

➢ Vervolgens wordt een hypothese geformuleerd op basis van theoretische en/of empirische evidentie.

➢ Beantwoorden onderzoeksvragen en testen hypothese draagt bij aan bereiken doelstelling

150
Q

Doelstelling

A

Doelstelling is niet alleen wat een onderzoeker wil onderzoeken in een studie maar ook wat het achterliggende doel is dat ermee bereikt kan worden.

  1. Elke studie heeft 1 of meerdere doelstellingen en op basis van deze doelstelling(en) worden de onderzoeksvragen (de vraag waarop onderzoekers antwoord willen) geformuleerd
  2. Vervolgens wordt en hypothese geformuleerd op basis van theoretische en / of empirische evidentie
  3. Beantwoorden van onderzoeksvragen en testen van de hypothese (onderzoeksvraag geformuleerd als een stelling met een specifieke verwachting van de onderzoekers

*

151
Q

Dichotoom of binair nominaal meetniveau

A

Dichotoom of binair nominaal meetniveau = variabelen met 2 mogelijke scores

152
Q

Design

A

Manier waarop data wordt verzameld.

Het simpelste design is er een waarbij voor een groep mensen alleen 1 variabele eenmalig wordt gemeten.

Niet vaak gebruikt (meestal meerdere variabelen)

153
Q

Density plots

A

Density plots

  • Geven de dichtheid van de verdeling aan - hoeveel datapunten er voor een gegeven meetwaarde zijn.
  • Heeft altijd een oppervlakte van 1
  • drukt uit welke proportie van de datapunten ergens zit ten opzichte van het totaal aantal datapunten
  • Handig om de kans op een bepaalde waarde af te lezen want deze kans correspondeert met het deel van de density plot dat links of rechts van die bepaalde waarde ligt
154
Q

De centrale limietstelling

A

De centrale limietstelling stelt dat naarmate we meer steekproeven trekken de steekproevenverdeling van het gemiddelde steeds meer op de normaalverdeling zal lijken.

De theoretische steekproevenverdeling is dus altijd normaal verdeeld

Bij acceptabele steekproefgroottes is de steekproeven verdeling vh gemiddelde normaal verdeeld tenzij de populatieverdeling enorm afwijkt van de normaliteit. Dit betekent dat altijd bekend is wat de verdelingsvorm is van de verdeling waar het steekproefgemiddelde uitkomt; Bovendien is ook de spreiding van die verdeling bekend.

155
Q

Curvilineair verband

A

De correlatie drukt het verband tussen 2 variabelen alleen goed uit als de variabelen lineair met elkaar samenhangen. Dit betekent dat het verband tussen de 2 variabelen over de hele schaal van de variabelen even sterk is. De stipjes moeten om een rechte lijn heen hangen.
Verband curvilineair → de stipjes liggen op een gekromde lijn, dan kan de correlatie samenhang niet goed samenvatten. Geldt ook voor datareeksen met outliers.

156
Q

Cross-sectioneel design

A

Alle data per onderzoekseenheid wordt binnen 1 sessie verzameld.

VB prevalentie studie = in kaart brengen hoe vaak iets voorkomt (bvb een ziekte)

157
Q

Criteriumvaliditeit

A

Criteriumvaliditeit (criterion validity): Hierbij wordt de samenhang /corelatie tussen twee testresultaten bekeken: namelijk jouw eigen meting en een andere meting van de eigenschap die we proberen te meten of te voorspellen (het criterium) = de mate waarin de uitkomsten van een meetinstrument als verwacht samenhangen met die op een ander meetinstrument.

158
Q

Covariantie

A

COVARIANTIE = maat voor de spreiding die 2 datareeksen delen. Zelfde manier berekend als variantie

De covariantie drukt uit hoeveel variantie de 2 variabelen x en y met elkaar delen. Een variantie deelt uiteraard 100% van de variantie met zichzelf. Dus de covariantie van x met x = de variantie (mean squares).

De variantie is ‘de covariantie van een variabele met zichzelf.’

Nadeel covariantie: deze maat is afhankelijk van de meetschalen waarop de 2 variabelen gemeten zijn. We willen daarom de covariantie corrigeren voor de schaalverdelingen van de gebruikte
operationalisaties. Oplossing: delen door de standaarddeviatie = correlatiecoefficient. Elimineerd de schaalafhankelijkheid

  1. Afwijkingen van beide datapunten met gemiddelde bereken
  2. Afwijkingen met elkaar vermenigvuldigen (vb afwijking gewicht maal afwijking lengte)
  3. Deze getallen bij elkaar optellen
  4. Delen door het aantal datapunten min 1 (aantal vrijheidsgraden)

Covariantie xy = Som van ((xi - gemiddelde x) * (yi - gemiddelde y)) / (n-1)

159
Q

Correlatie

A

Correlatiecoëfficiënt = drukt uit hoe sterk 2 continue variabelen – dus minimaal interval niveau –met elkaar samenhangen. Correlatie = Pearson’s R.
Belangrijk: Correlatie impliceert geen causaliteit

160
Q

Constructvaliditeit

A

Constructvaliditeit: in hoeverre worden interpretaties van testscores ondersteund door theorie en empirisch bewijs voor het gebruikt van deze test / meetinstrument. De empirische evidentie voor constructvalidering is gebaseerd op de mate van samenhang tss variabelen en /of items. Constructvalidering kan bestaan uit het bepalen van de samenhang tussen items / stimuli / indicatoren en schalen onderling EN dat ook onderzocht wordt of er samenhang is met andere variabelen en uitkomsten zoals te verwachten is op basis van theorie en eerder onderzoek.

Voordeel: validiteit is relatief makkelijk te onderzoeken want het is voldoende om deelnemers een aantal andere meetinstrumenten voor te leggen en de samenhang tussen de scores op deze meetinstrumenten en het meetinstrument van interesse te bepalen.

Nadeel: deze samenhang met andere testscores of uitkomstmaten biedt geen inzicht in of het meetinstrument daadwerkelijk het construct meet dat het zou moeten meten.

Als je dus echt wil weten of een meetinstrument het construct van interesse meet, is toch de causale opvatting van validiteit nodig waarbij je waarbij wordt uitgezocht hoe een meetinstrument werkt.

161
Q

Construct en psychologisch construct

A

Een construct is de naam en definitie van een variabele (iets dat kan veranderen) in een theorie.

Psychologisch constructen zijn psychologische variabelen waarvan de definitie wordt afgeleid vanuit een theorie en waarbij die definitie specificeert wat wel en wat niet tot de variabele hoort.

Psychologische Constructen zijn theoretisch omdat we niet weten of ze echt bestaan.

Psychologische constructen zijn heel bruikbaar omdat ze andere variabelen die wel direct observeerbaar zijn kunnen voorspellen of beïnvloeden. Ze zijn dus de moeite van het onderzoeken zeker waard op voorwaarde dat er een eenduidige duidelijke en uitgebreide definitie van het construct wordt opgesteld. Beperkingen zijn: 1. de meeste mensen zijn niet bekend met de exacte definitie, 2. hebben beperkte mogelijkheden tot introspectie en 3. Ze zijn niet direct observeerbaar.

Een construct is iets dat we willen meten, de vraag die we willen beantwoorden.

162
Q

Cohen’s d

A

Cohen’s d = standardised mean difference (SMD) : DE maat voor het verschil tussen 2 gemiddelden (t-verdeling) die onafhankelijk is van de schaal van de continue variabele, is Cohen’s d. Cohen’s d kan in theorie oneindig klein of groot worden.

Cohen’s d wordt gebruikt als effectmaat voor een verband tussen een dichotome variabele (vb geslacht) en een intervalvariabele (vb statistiekkennis).

Cohen’s 𝑑 is het verschil tussen twee groepen, gecorrigeerd voor de standaarddeviatie. De standaarddeviatie is een maat voor de meetschaal van de betreffende variabele. Door het verschil tussen de gemiddelden hierdoor te delen krijgen we een schaalonafhankelijke maat voor het verschil tussen de groepen.
Dit is bijna precies hetzelfde als we doen om een 𝑧-waarde te berekenen
𝑧 = (𝑥𝑖 − 𝑥)/ 𝑠𝑑𝑥
Oftewel, de 𝑧-waarde die correspondeert met elk datapunt is gelijk aan het verschil tussen dat datapunt en het gemiddelde, gedeeld door de standaarddeviatie. Bij Cohen’s d kijken we nu niet naar het verschil van een enkel datapunt ten opzichte van het gemiddelde (𝑥𝑖 − 𝑥), maar naar het verschil tussen twee gemiddelden
Cohen’s 𝑑 = (𝑦1 − 𝑦2)/𝑠𝑑𝑦 = standardised mean difference (y met streepje boven van gemiddelde)

In deze formule wordt 𝑦 gebruikt in plaats van 𝑥 omdat het conventie is om de afhankelijke variabele met 𝑦 aan te duiden en de onafhankelijke variabele met 𝑥

Cohen’s 𝑑 is dus het verschil tussen de gemiddelden, uitgedrukt in standaarddeviaties. Een Cohen’s 𝑑 van .50 betekent dat de twee gemiddelden een halve standaarddeviatie uit elkaar liggen; een Cohen’s𝑑 van .80 betekent dat ze acht tiende standaarddeviaties uit elkaar liggen.

Of Cohen’s d positief of negatief is, ligt er gewoon aan of het gemiddelde van de tweede groep kleiner of groter is dan het gemiddelde van de eerste groep.

De puntschatting van Cohen’s d is weinig informatief waardoor ook hier weer een betrouwbaarheidsinterval moet berekend worden. Hoe meer deelnemers, hoe smaller en hoe accurater het betrouwbaarheidsinterval.

Welke standaard deviatie gebruiken:

  • De standaarddeviatie uit de grootste groep.
  • De grootste standaarddeviatie, om de meest conservatieve schatting van Cohen’s d te krijgen.
  • De kleinste standaarddeviatie, om de meest liberale schatting van Cohen’s d te krijgen.
  • De zogenaamde gepoolde standaarddeviatie. Dit is een soort gemiddelde standaarddeviatie die je kunt berekenen.

Die laatste optie wordt het meest gebruikt, maar vereist een vrij complexe formule. Als de groepen bijna even groot zijn en de standaarddeviaties in beide groepen ongeveer gelijk zijn, pakken we voor nu even gewoon het gemiddelde:

163
Q

Cohen’s d - verschil tussen gemiddelden uitgedrukt in Standaard deviaties

Samenhang sterkte=

A

Omdat Cohen’s d onafhankelijk is van de schaal waarop variabelen zijn gemeten, is het mogelijk om net als bij correlatie coëfficienten voorzichtige richtlijnen te formuleren. ➢ In de praktijk worden in de psychologie en onderwijswetenschappen zelden verbanden gevonden die sterker zijn dan Cohen’s d = 1.

Samenhang

  • kleiner dan -1.30 zeer sterk negatief
  • tussen -.1.30 en -0.80 sterk negatief
  • tussen -0.80 en -0.50 middelsterk negatief
  • tussen -0.50 en -0.20 zwak negatief
  • tussen -0.20 en 0.20 Triviaal
  • tussen 0.20 en 0.50 zwak positief
  • tussen 0.50 en 0.80 middelsterk positief
  • tussen 0.80 en 1.30 sterk positief
  • groter dan 1.30 zeer sterk positief
164
Q

Confounders en wat is er de oplossing voor?

A

Confounders zijn variabelen (derde variabelen) en externe invloeden waarvan niet kan worden uitgesloten dat ze verantwoordelijk zijn voor de gevonden verbanden / meetwaarden in een studie. Dus invloeden buiten de onafhankelijke variabelen om.

Oplossing voor cofounders: randomisatie = zorgen dat alle onderzoekseenheden in gelijkwaardige equivalente groepen worden ingedeeld. Voor equivalente groepen telt per definitie datr de cofounders voor die groepen gemiddeld genomen hetzelfde zijn. Randomisatie is de beste oplossing daar alle externe invlloeden en derde variabelen in kaart brengen onmogelijk is.

165
Q

Causale consequent

A

De causale consequent is de variabele die beinvloed wordt door de andere variabele. - de afhankelijks variabele - criterium / uitkomstmaat.

166
Q

Causale antecedent

A

De variabele die de invloed uitoefent (causale antecendent - voorspellers - covariaten onafhankelijke variabele) en gemeten / gemanipuleerd wordt voor de andere variabele

167
Q

Categorische vatiabelen - beschrijvingsmaten

A
  • Modus (meest voorkomende waarde)
  • Bij ordinale variabelen mediaan

Modus en mediaan bij categorische variabelen zeggen weinig over de verdelingsvorm

  • Frequentietabel (frequenties= aantallen voor elke meetwaarde - absolute frequenties), (perc = relatieve frequenties) perc totaal (incl misssing data, perc valid en cumulative percentage
  • Staafdiagram (categorie op x as) maar er is geen density plot en dus ook geen verdelingsvormen)
  • Elk van de percentages uit de frequentietabel komen uit een eigen steekproevenverdeling
  • Steekproevenverdelingen van percentages zijn normaal verdeeld
  • De standaardfout = Se van de proportie = wortel van P * (1-p) / n met P = proportie of percentage gedeeld door 100 en n = aantal datapunten in de datareeks
  • BI = P + of - breedte-index * std error
168
Q

Categorische of discrete variabele

A

Categorische of discrete variabele: de nominale en ordinale variabelen - de verschillende meetwaarden die ze kunnen aannemen zijn altijd categorieen.

169
Q

Breedte index

A

De breedte index komt uit de t-verdeling en noemt ook de kritieke t-waarde.

Breedte index = 1.96 voor een 95%-betrouwbaarheidsinterval,

  1. 58 voor een 99%-betrouwbaarheidsinterval en
  2. 67 voor een 50%-betrouwbaarheidsinterval
170
Q

Breedte - index

A

De breedte index wordt gebruikt om een betrouwbaarheidsinterval te bepalen.

Betrouwbhinterval = steekproefwaarde + /- breedte-index * std fout

De breedte index is afhankelijk van 2 dingen:

  1. Vorm van de steekproevenverdeling van de desbetreffende waarde
  2. Betrouwbaarheid van het interval : de breedte index wordt groter naarmate een hogere betrouwbaarheid gewenst wordt.

0.67 voor een 50%-betrouwbaarheidsinterval., 1.96 (de 2 eerder vermeld) voor een 95%-betrouwbaarheidsinterval, 2.58 voor een 99%-betrouwbaarheidsinterval

171
Q

Boxplots

A
  • In een boxplot worden 3 kwartielen geplot, dwz breekpunten die de data in 4 even grote delen splitsen
  • De middelste lijn is de mediaan
  • 2 Boxen erom heen geven het 1 e en het 3 e kwartiel weer, dus 50 % van deze datapunten liggen binnen deze boxen
  • De verticale lijnen geven aan tussen welke waarden de hoogste en laagste 25 % van de datapunten ligt
  • Outliers worden visueel weergegeven als stipjes
  • Als er geen outliers weergegeven worden, betekent dit dat je het einde van de vertikale lijn kan beschouwen als het max en het min
  • Meestal vertikaal waarbij de Y as de schaal van de variabele geeft
  • Linksscheef: minder datapunten ed linkerkant - daar liggen de outliers vooral = beneden en de box ligt meer naar boven (rechtst bij horizontale boxplot) want daar meer datapunten
  • Rechtsscheef: minder datapunten ed rechterkant - daar liggen de outliers vooral = boven en de box ligt meer naar beneden (of links bij horizontale boxplot) want daar meer datapunten
  • Bij normaalverdeling ligt de box meer in het midden
172
Q

Blindering en dubbelblind design

A

Blindering: niet aan de deelnemers vertellen in welke conditie ze ingedeeld zijn . Om de verstorende invloed van de verwachtingen van deelnemers te beperken.

Dubbelblind design: zowel deelnemers als onderzoekers worden in het ongewisse gelaten zodat ze het onderzoek niet (ongewild) beïnvloeden. Ook als er geen interactie is tss deelnemers en onderzoekers vb internet . Proefleiders zijn mensen die het onderzoek begeleiden maar zelf niet weten welke condities er zijn.

173
Q

BI van het verschil tussen gemiddelden

A

Steekproefwaarde + / - Breedte-index * standaardfout

Steekproefwaarde is hier het verschil tussen gemiddelden.

De breedte-index komt in dit geval uit een t verdeling en noemt ook wel de kritieke t waarde. De software berekent deze kritieke t waarde (of opzoeken tabel)

Aantal vrijheidsgraden voor T verdeling is steekproefomvang (n) minus 2

De kritieke t- waardes verschillen tot aan 100 vrijheidsgraden (steekproefomvang van 102). Boven een steekproefomvang van 102 of DF van 100 is de kritieke t-waarde = 1.96

Wanneer het betrouwbaarheidsinterval van het verschil tss de gemiddelden aan 1 kant negatief is en aan 1 kant positief, ligt 0 (nulhypothese dat de 2 gemiddelden niet verschillen) in het BI en kunnen we concluderen dat het waarschijnlijk niet plausibel is dat de gemiddelden in de populatie verschillen.

Dus zolang het BI ofwel onder- als bovengrens negatief of positief - concluderen we dat de gemiddelden in de populatie waarschijnlijk verschillen. Nul ligt niet in het BI.

BI: dit verschil tussen gemiddelden en dus ook het BI is enorm schaalafhankelijk (bvb m of cm of mm)

Voordeel: concrete eenheid en makkelijk interpreteerbaar

Nadeel:

  • moeilijk te bepalen hoe relevant dit verschil is. Hoeveel moeten gemiddelden uit elkaar liggen om te concluderen dat ze ook echt anders zijn?
  • Sterkte van het verband is niet te vergelijken met andere studies tenzij die studies exact dezelfde meetinstrumenten gebruikt zijn.

DE MAAT voor het verschil tussen gemiddelden die onafhankelijk is van de schaal van de continue variabele, is Cohen’s d.

174
Q

Betrouwbaarheidsinterval van een proportie / percentage

A

DOEL betrouwbaarheidsinterval proportie = voor categorische variabelen op basis van de steekproef conclusies trekken over de populatie (gebruik makend van %)

95 % betrouwbaarheidsinterval voor de proportie vrouwtjes =

Proportie + / - 1.96 maal std error vd proportie vrouwtjes

1.96 = breedte index voor 95 % betrouwbaarheidsinterval

Standaardfout proportie formule:

Se proportie = wortel van p * (1-p) / n

P = de proportie = het percentage voor elke meetwaarde tov het totaal aantal datapunten = aantal datapunten in een categorie ten opzichte van het totaal aantal datapunten.

Ook voor categorische variabelen kunnen we dus op basis van de steekproef conclusies trekken over de populatie.

175
Q

Betrouwbaarheidsinterval

A

Het betrouwbaarheidsinterval geeft een indicatie van de accuraatheid van een maat (bvb gemiddelde, skewness, std dev) uit de steekproef. Smalle intervallen zijn meer accuraat, brede minder.

Vb een betrouwbaarheidsinterval van 95% is het interval om het steekproefgemiddelde (of andere maat) heen dat in 95% van de steekproeven het populatiegemiddelde bevat.

Dit komt overeen met ongeveer 2 std fouten van het gemiddelde.

De betrouwbaarheidsinterval van verschillende steekproefmaten = steekproefwaarde + en - breedte index maal std fout

Een BI van 0% is een puntschatting en geen BI meer. (is dan bvb gewoon het gemiddelde dat we vonden)

De breedte index is afhankelijk van 2 dingen:

  1. Vorm van de steekproevenverdeling van de desbetreffende waarde
  2. Betrouwbaarheid van het interval : de breedte index wordt groter naarmate een hogere betrouwbaarheid gewenst wordt.

0.67 voor een 50%-betrouwbaarheidsinterval., 1.96 (de 2 eerder vermeld) voor een 95%-betrouwbaarheidsinterval, 2.58 voor een 99%-betrouwbaarheidsinterval

In de praktijk wordt vaak een betrouwbaarheidsinterval van 95% gebruikt. Hoe hoger het % hoe vaker deze het populatiegemiddelde zal bevattan en hoe breder het interval.

FOUT = betrouwbaarheidsinterval van 95% = interval waarbij de kans 95% is dat het populatiegemiddelde (of andere maat) in dat interval ligt.

JUIST= betrouwbaarheidsinterval van 95%= als je een interval oneindig keer herhaald, bevat dit betrouwbaarheidsinterval in 95% van de steekproeven het populatiegemiddelde (of andere maat).

176
Q

Betrouwbaarheid

A

Reliability / replicability / betrouwbaarheid: meet fouten - een maatstaf is betrouwbaar in de mate dat elke keer deze maatstaf gebruikt wordt, het gelijke resultaten oplevert bij een bepaald individu onder bepaalde omstandigheden. De betrouwbaarheid / replicability is lager naarmate een meetinstrument gevoeliger is voor toevallige verstorende invloeden. = NIET systematische meetfouten (ruis of random measurement error). BIj het bepalen van de betrouwbaarheid van een meetinstrument (stabiliteit over herhaalde metingen) wordt er vanuit gegaan dat datgene dat gemeten wordt stabiel is.

Systematische meetfouten (bias) = systematisch vertekening en kans op verkeerde conclusie.

177
Q

Beschrijf kort de empirische onderzoekscyclus

A
  1. Onderzoeksvraag formuleren
  2. Studie ontwerpen
  3. Data verzamelen
  4. Data analyseren
  5. Rapporeren: beschrijven van de studie en de uitkomsten, iets dat weer nieuwe onderzoeksvragen zal oproepen
178
Q

Berekening van de correlatie

A
  1. Afwijkingen van beide datapunten (x en y) met gemiddelde bereken
  2. Afwijkingen met elkaar vermenigvuldigen (vb afwijking gewicht maal afwijking lengte)
  3. Deze getallen bij elkaar optellen
  4. Delen door het aantal datapunten min 1 (aantal vrijheidsgraden)
  5. Delen door de standaarddeviatie van x maar std dev y

Delen door de standaarddeviatie elimineert de schaalafhankelijkheid.

Correlatie v x en y = r v xy = covariantie v xy / (sdx*sdy)

Bij standaardisering van scores wordt van elk datapunt het gemiddelde afgetrokken, waarna dat verschil wordt gedeeld door de standaarddeviatie. De nieuwe reeks datapunten heeft een gestandaardiseerde schaal, waarbij het gemiddelde 0 is en 1 staat voor 1 standaarddeviatie.

179
Q

Attritie

A

De uitval van mensen tijdens het onderzoek.

Groot nadeel bij longitudinale designs

Als uitval willekeurig is, kan je gewoon meer deelnemers verwerven bij het begin van de studie dan er nodig zijn (de kenmerken van de overgebleven steekproef blijft zelfde en de interne validiteit wordt niet bedreigd bij willekeurige uitval. MAAR

Uitval is vaak NIET willekeurig. Bvb mensen die ernstig ziek zijn vallen eerder uit, mensen die sneller genezen ook.

Resultaat niet willekeurige uitval: steekproef niet meer representatief voor de hele populatie, je weet niet meer op welke kenmerken de overgebleven steekproef gebaseerd, is. Daardoor wordt het moeilijker om conclusies te trekken.

180
Q
  1. Als herhaalde metingen van een variabele zeer verschillende scores geven die gemiddeld genomen samenvallen met iemands ware score, dan is het meetinstrument
  2. Als herhaalde metingen van een variabele dicht bij elkaar liggen en gecentreerd zijn rond iemands ware score, dan is het meetinstrument
A
  1. Wel valide, maar niet betrouwbaar
  2. Betrouwbaar en valide.

Meetfouten: als er enkele niet-systematische (toevallige) meetfouten zijn, zullen op den duur bij heel vaak meten deze toevallige meetfouten tegen elkaar wegmiddelen en resutleren in iemands ware score.

181
Q

Afhankelijke en onafhankelijks variabele

A

In een experiment is de afhankelijke variabele de variabele die verwacht wordt te veranderen onder invloed van een onafhankelijke variabele. In de psychologische experimenten is dit meestal een maatstaf van een gedrag. = criterium (Y)

De onafhankelijke variablele is de variabele die invloed heeft op de afhankelijke variablele. Deze wordt tijdens een experiment gevarieerd om zo het effect op de afhankelijke variebel(en) te observeren. X = x = onafhankelijke variabele; Covariaat; Predictorvariabele: Voorspeller :Predictor

182
Q

Condities - wat is dat en welke 2 soorten condities zijn er te onderscheiden?

A

De groepen in een experiment worden ook wel eens condities genoemd.

Deze condities komen tot uiting in de meetwaarden (categorieen) van een gemanipuleerde variabele. Vb de condities: medicijn en placebo, behandelind en geen behandeling …

  1. Controle conditie: de vergelijkingsconditie , de groep die niet gemanipuleerd wordt
  2. Experimentele conditie: de condittie / groep waar de interesse naar uitgaat. De groep die de manipulatie ontvangt
183
Q

Bonferroni correctie

A

De ‘Bonferroni correctie’ voor p waarde stelt dat de α (en dus ook de p-waarde, die als statistisch significant wordt beschouwd) moet worden gedeeld door het aantal vergelijkingen waarvoor men toetst. Dus wanneer 2 uitkomsten worden getoetst, is de significantiegrens 0,05/2 = 0,025. Bvb 4 uitkomsten toetsen = 6 vergelijkingen dan 0.05/6