Extra begrippen samenvatting Thema 1-4 Flashcards
Ware score
Uitkomsten metingen construct + meetfout(en) = ‘ware’ score.
Bij enkel niet-systematische meetfouten zal na vaak meten deze meetfouten tegen elkaar wegmiddelen en is dat de ware score.
Relatie betrouwbaarheid versus validiteit
Verstoringen van meetresultaat door niet volledig betrouwbaar meetinstrument = niet systematische meetfouten.
Vertekeningen van meetresultaat omdat meetinstrument niet valide is = systematische meetfouten (bias)
Meetmodel versus structureel/conceptueel model
Meetmodellen visualiseren de operationalisaties van variabelen. Ze laten de meetinstrumenten en manipulaties zien in een studie.
Structurele/conceptuele modellen visualiseren de verbanden tussen de variabalen. De richting van de pijl is hierin van belang. Heeft een pijltje twee punten (bidirectioneel) dan is er een verband tussen twee variabelen maar is niet bekend of ze elkaar beïnvloeden.
causale antecedent
De variabele die invloed uitoefent. Dus de onafhankelijke variabele/covariaat
Causale consequent
De afhankelijke variabele of criterium/uitkomstmaat
Normale verdeling
De normaalverdeling is unimodaal, niet scheef, niet spits of plat. De verdelingsmaten zijn dus 0. Als een verdeling erg in de buurt komt van 0 dan mag gesproken worden van een normale verdeling. Bij de normaalverdeling ligt 68% binnen +/- één standaarddeviatie van het gemiddelde, 95% binnen twee standaarddeviaties en 99,7% binnen drie standaarddeviaties van het gemiddelde.
Z verdeling
Een normale verdeling met een gemiddelde van 0 en
standaarddeviatie van 1. Een Z-verdeling is handig omdat van elk datapunt in deze verdeling gelijk duidelijk is hoever het van het gemiddelde af ligt (b.v. +1 of -2).
Z-score
Datapunten in een Z-verdeling heten z-scores. De Z-score geeft aan hoe ver een waarde van het gemiddelde af ligt. Een Z-score van 2 betekent dat het datapunt 2 standaarddeviaties boven het gemiddelde ligt. En dit betekent ook dat maar 2,5% nog hoger kan liggen. (2x2,5 =5)
Standaardfout
De standaarddeviatie (oftewel, de standaardafwijking) van de steekproevenverdeling (steekproefgemiddelde) is de standaardfout. De standaardfout hangt af van de grootte van de steekproef. Hoe groter de steekproef, hoe smaller de steekproevenverdeling en hoe kleiner de standaardfout.
Hogere meetniveaus hebben de voorkeur omdat
Hogere meetniveaus (continu niveau) hebben de voorkeur op categorische meetniveau omdat:
• Een verband aantonen tussen twee continu variabelen vereist minder deelnemers
• Categorische operationalisaties zijn niet altijd valide.
• Het is altijd mogelijk om van hogere niveaus naar lager te gaan maar niet andersom.
• Indeling in categorieën geeft vaak een vertekening van de werkelijkheid.
Absolute frequenties
Het aantal datapunten in een steekproef, de frequenties.
relatieve frequenties
Geven informatie over het aantal datapunten in een categorie ten opzichte van het totale aantal datapunten.
Cumulatieve frequenties
Het percentage van een bepaalde meetwaarde samen met de percentages van alle lagere meetwaarden
Meetniveaus van hoog naar laag
Hoog: continue
Laag: ordinaal, nominaal, dichotoom.
Meetniveaus van hoog naar laag
Hoog: continue
Laag: ordinaal, nominaal, dichotoom.
Positief verband
Naarmate de waarde van de variabele op de X-as toeneemt, neemt ook de waarde van de variabele op de y-as toe. Dit betekent dus dat als onderzoekseenheden meer kenmerk hebben van x, zij ook vaak meer kenmerk hebben van y.
Negatief verband
Onderzoekseenheden die hoger score op variabele van de X-as, scoren lager op variabele van de Y-as. Dit heeft ook deels te maken met hoe je een variabele definieert. Wanneer je dit namelijk net andersom (b.v. voorkeur wordt afkeur) kan het verband juist wel weer positief worden. Het betekent dus niet dat er geen verband is of negatief niets betekent, maar juist dat het verband anders ligt.
Correlatie
De correlatie drukt uit hoe sterk twee continue variabelen met elkaar samenhangen. Samenhangen wil nog niet zeggen dat ze elkaar beïnvloeden. Correlatie is dus geen causaliteit.
Covariantie
De covariantie is de maat voor de spreiding die twee datareeksen delen.
Nadeel van covariantie
De covariantie drukt handig uit hoe sterk variabelen samenhangen maar dit is afhankelijk van de meetschalen waarop de variabelen gemeten zijn. B.v. wordt lengte in meters, cm. Of mm gemeten? Je wil de covariantie dus corrigeren voor de schaalverdelingen van de gebruikte operationalisaties. Hiervoor bereken je de correlatiecoëfficiënt.
Pearsons R
Door de correlatiecoëfficiënt uit te rekenen elimineer je schaalafhankelijkheid. De R is hetzelfde als het product van de Z-score. . De R ligt altijd tussen -1 en 1 waarbij 0 geen verband is en -1 de perfecte negatieve samenhang en 1 de perfecte positieve samenhang.
Hoe groter de steekproef, hoe groter de kans dat de correlatie in de buurt ligt van de steekproefcorrelatie.
Symmetrie
De steekproefverdeling voor het gemiddelde is symmetrisch.
De T-verdeling is symmetrisch
De steekproefverdeling voor correlaties is asymmetrisch
Regressieanalyse is asymmetrisch
P-waarde en steekproefomvang
De p-waarde is een functie van de sterkte van het verband en de steekproefomvang. Als de steekproefomvang toeneemt, daalt de p-waarde voor een gegeven verband.
P-waarde berekenen
De P-waarde bereken je door de kans op correlatie te delen door 100 en vervolgens te vermenigvuldigen.
Type 1 fout
Een type 1 fout wordt gemaakt als de nulhypothese onterecht wordt verworpen, dus als er in een onderzoek wordt geconcludeerd dat er een verband bestaat terwijl dit niet het geval is. Bij een alpha van 0,05 gebeurt dit in 5% van de getrokken steekproeven uit een populatie waar het betreffend verband niet bestaat. De kans op een type 1 fout wordt alleen verlaagd door een lagere alpha te kiezen.
Type 2 fout
Een type 2 fout is ten onrechte de nulhypothese aanhouden. Een lagere alpha verkleint de kans op een
type 1 fout maar vergroot de kans op een type 2 fout. Dit kan je oplossen door de steekproefomvang te vergroten. De grafiek wordt dan hoger en smaller. Je kan de type 2 fout berekenen door het percentage af te
lezen hoeveel overlap er is.
Power
de kans dat we een verband kunnen detecteren, aangenomen dat het verband ook echt bestaat. Is de daadwerkelijke populatie correlatie groter, dan wordt de power ook groter. De power is het andere gedeelte van de percentage van de Type2 fout.
Multiple testing
Als er meer dan één verband wordt geschat, neemt de kans op type1 fouten toe. De kans op minimaal één type 1-fout kan berekend worden met de volgende formule:
Pminimaal 1 type 1-fout = 1 - (1-a)k
K is hierbij het aantal p-waarden wat wordt berekend. De uitkomst is de kans op minimaal 1 type 1 fout in procenten.