Slides/kennisclips Flashcards
Bij inferentie trachten we…
wat we bij een steekproef zien, te veralgemenen naar de populatie
Wat zijn de eigenschappen van een variabele op nominaal niveau?
Categoriën en niet te ordenen.
VB: ‘kleur’, ‘naam’
Wat zijn de kenmerken van een variabele op ordinaal niveau?
Heeft categoriën die je kunt ordenen, maar afstand tussen categoriën is niet duidelijk.
VB: Likert scale.
Wat zijn de kenmerken van een variabele op interval niveau?
Heeft categoriën, is te ordenen en de afstand tussen categoriën is eenduidig. Er is geen absoluut nulpunt.
VB: temperatuur
Wat zijn de kenmerken van een variabele op ratio niveau?
Heeft categoriën, kun je ordenen, eenduidige afstand tussen categoriën en een absoluut nulpunt.
VB: inkomen, leeftijd
Modus
De meest frequente waarde.
Mediaan
De middelste waarde wnr je de waardes van klein naar groot op een rij zet.
Gemiddelde
Som van waarden gedeeld door aantal observaties.
Welke maat voor centrale tendens is veel gevoeliger voor outliers?
het gemiddelde.
Bereik
max waarde - min waarde
Wat is de som van afwijkingen tot het gemiddelde in een set observaties?
0
MAD formule
(SUM(k to n) | X.k - X_ | ) / n
Variantie formule
s^2 =
SUM(k to n ) (X.k - X_ ) ^2
/
n-1
Standard deviatie formule
s =
ROOT( s^2)
Steekproefgemiddelde
Het gemiddelde van een steekproef
Steekproevengemiddelde
Het gemiddelde van de gemiddeldes van verschillende steekproeven.
Normaalverdeling
De manier waarop observaties verschillende frequenties hebben voor verschillende waarden. Piekt rond mu, het gemiddelde en is symmetrisch met spreiding sigma^2.
Variabele voor gemiddelde van een steekproef:
X_ met streepje erop
Variabele voor gemiddelde van een populatie:
mu
Variabele voor variantie van een steekproef:
s^2
Variabele voor variantie van een populatie:
sigma^2
Variabele voor standard deviatie van een steekproef:
s
Variabele voor standard deviatie van een populatie:
sigma
Waarom doe je bij de variantie een steekproefcorrectie?
Omdat de steekproef veel minder variantie bevat dan de gehele populatie./
Hoeveel procent van de data zit binnen 1 standard deviatie van het gemiddelde bij een normaalverdeling?
68%.
Hoeveel procent van de data zit binnen 2 standard deviaties afwijking van het gemiddelde bij een normaalverdeling?
95%
Hoe bereken je de Z-score?
(X-mu) / sigma^2
Wat geeft de Z-score aan?
hoe afwijkend je score is, hoe ver je van mu af ligt. En hoe waarschijnlijk het dus is om deze score te observeren.
Wat zijn de 5 stappen van de Groot’s empirische cyclus?
- Observatie
- Inductie (theorievorming)
- Deductie (hypothesevorming)
- Toetsen
- Evalueren
Wat gebeurt er in de probleemanalyse stap van de empirische cyclus?
De observatie / gat in de kennis ontdekken / redenen vinden voor replicatie van onderzoek
Wat gebeurt er in het onderzoeksplan stap van de empirische cyclus?
De onderzoeksvraag, hypothese, voorspellingen.
Wat houdt deductie in?
Hypothesevorming, je maakt er een om later te falsificeren of verifiëren.
Wat gebeurt en in de uitvoering stap van de empirische cyclus?
De methode en dataverzameling.
EEG (afkorting)
Electroencephalogram
Wat laat EEG zien?
Hersenactiviteit
TMS (afkorting)
Transcranial magnetic stimulation
Wat laat TMS ons zien?
Het verstoort de hersenactiviteit en daardoor zie je activiteit in het lichaam, bijv bewegende hand opeens.
Wat zijn verschillende toepassingsniveaus?
Real world
Simulation
Lab
Wat zijn verschlilende abstractieniveaus in tijd?
ms, seconden, minuten, dagen, weken, maanden
Wat zijn de drie niveaus in David Marr’s model van het abstractiecontinuüm?
Computationele theorie
Algoritmische theorie
Implementatie theorie
Waar zegt het toepassingscontinuüm iets over?
Hoe gedetailleerd je gedrag kan meten en hoe gedetailleerd het model moet zijn + in hoeverre het iets over de echte wereld zegt.
Categorical variables
Variables that depict groups/categories.
Quantitative variables
Variables that depict a quantity/size. Differences between values are relevant: a difference of 2 between low and high values means the same.
What are the two measurement levels within the categorical variables?
Nominal and ordinal
What is the mode if two values have the highest frequency?
Both of them, there are two modes then.
What is the value of the mean deviation?
Always 0
What is the sum of differences between indivudal observations and the mean?
Always 0
What are the two steps you use to calculate the variance?
- Calculate the sum of squared deviations.
- Divide by number of observations to get mean squared deviation.
How do you calculate the variance if you know both the sum of squares and the amount of datapoints?
sum of squares / amount of datapoints.
What are the four steps to take when calculating the standard deviation?
- Calculate the deviation scores of observations from the mean.
- Calculate the sum of squares.
- Calculate the variance.
- Take the root of (3).
What does the z-score of a value tell us?
How many standard deviations it is from the mean
Sample correction
The fact that you divide by n-1 when you calculate a sample st.dev., but divide by N when calculating a population st.dev.
Wat representeert de covariantie?
De samenhang tussen twee variabelen. Het is basically de oppervlakte tussen twee variabelen.
Wat is de geschatte spreiding?
De standaard deviate van elke aparte variabele.
Wat is de formule voor de covariante coëfficient?
r.xy = s.xy / (s.x * s.y)
Wat is een requirement om de Pearson product-moment correlatie te gebruiken
De data moet normaal verdeeld zijn.
Wat is de formule voor de squared error?
SUM (y-y^)^2
Hoe heet het getal b0 in regressie?
The intercept, het snijpunt. Het is het punt waarop je op de y-as start als x=0.
Hoe heet het getal b1 in regressie?
de helling, de richtingscoëfficient, de slope.
Wat is de formule van de regressielijn?
y = b0 + b1*x
Hoe bereken je de t-waarde wanneer je een r.xy (correlatiecoëfficient) hebt, in Pearson?
t = rxy * WORTEL( (n-2) / (1-r.xy^2))
Wat is de formule voor b1 in regressie?
b1 = r.xy * (s.y / s.x)
Waar staat r.xy voor?
De coorrelatiecoëfficient van x en y
Waar staan s.y en s.x voor in regressie?
De standaard deviaties van y en x.
Wat is de formule voor b0 in regressie?
b0 = _y - b1*_x
met _y en _x = de gemiddelden van y en x
Welke stappen onderneem je als je in je data met twee variabelen v1 en v2 een voorspelling van v2 wilt doen op basis van v1?
- neem gemiddelden van v1 en v2
- Bereken standaard deviatie van beiden.
- Bereken covariantie en correlatie
- bereken b0 en b1
- Vorm de regressielijn, die je kan gebruiken bij de voorspelling.
Welke techniek gebruik je om variabelen op ordinaal / nominaal niveau te vergelijken?
De chi-kwadraat test.
Welke stappen onderneem je in de chi-kwadraat test bij nominale/ordinale variabelen?
- bereken de expected values
- Bereken O-E (observed - expected)
- Neem het kwadraat hiervan
- Bereken chi^2 =SUM( (O-E)^2 / E )
- Bereken vrijheidsgraden df = c-1
- Zoek op of chi significant is in de chi-tabel.
Wat is de vrijdheidsgraad bij Cramer’s V?
df = min(r-1, c-1)
Wat doe je bij cleaning in het resultaten gedeelte van de empirische cyclus?
Je checkt voor NaN’s en vraagt je af of die erg zijn. Je verwijdert de RTs van incorrecte antwoorden wanneer RT een afhankelijke variabele is.
Welke vorm heeft het resultaat van Cramer’s V?
Een getal tussen 0 en 1, geeft aan hoe sterk het verband tussen je 2 nominale variabelen is.
Ware afwijking
Wanneer een waarde afwijkt, maar deze wel correct gemeten is dus het gewoon aan die persoon ligt.
Hoe bereken je of een waarde een outlier is?
Bereken de mediaan, Q1 en Q3. Bereken de Interquartile distance: Q3-Q1.
Een outlier is <Q1-1.5IQD of >Q3+1.5IQD.
Hoe bepaal je de volgorde van de info in je resultaten gedeelte van het verslag?
Hou de volgorde gelijk aan de hypothesen.
Wat heeft over het algemeen de voorkeur in je resultaten sectie: een grafiek of een tabel?
Een grafiek.
Hoe rapporteer je een t-test?
Antwoorden waren sneller in conditie y (M=…, SE=…) vergeleken met conditie z (M=…, SE=…), t(..) = …, rho = …, d = …. .
Welke maat gebruik je voor effect size bij een t-test?
Cohen’s d (d)
Welke maat gebruik je voor effect size bij een ANOVA test?
eta squared of partial eta squared