Week 5 Flashcards
Wat is een Venn Diagram?
Twee Cirkels die gedeeltelijk overlappen. (X en Y)
- De overlapping is in hoeverre de ene variabele de variatie in de andere verklaart.
Wanneer gebruik je de t-toets, z-toets en 𝜒²?
- t-toets gebruik je bij gemiddeldes en regressieanalyse
- Z-toets gebruik je bij proporties
- 𝜒² gebruik je bij het verschil in frequentie tussen twee categorische variabelen.
Hoe ziet de grafiek van de 𝜒² verdeling er uit? Hoe wordt dit beïnvloed door df? Hoe bereken je df?
- Hij is volledig positief omdat het een normale verdeling in het kwadraat is.
- Bij hogere df gaat hij meer op een normale verdeling lijken.
- df = (r – 1) x (c – 1)
Hoe bereken je de 𝜒² waarde?
- Je doet de som van elke geobserveerde frequentie f₀, min de verwachte frequentie fℯ gedeeld door fℯ.
- Dit doe je voor elke geobserveerde frequentie f₀ en die tel je bij elkaar op.
Als je kolommen en rijen hebt, waar staat dan de onafhankelijke variabele en waar staat de afhankelijke?
- De onafhankelijke variabele staat in de rijen
- De afhankelijke variabele staat in de kolommen.
Waar is het verwerpingsgebied van 𝜒².
Wat is het nadeel?
- Dit is altijd aan de rechter kant.
- Het laat dus niet zien of er een positief of negatief verband is,
Hoe bepaal je fe?
- Je neemt de totale frequenties en past dit percentage toe op de verschillende categoriale variabelen
- fe = Totaal van de kolom / Het totaal x de totaal van de rij.
- Bijvoorbeeld overal 75% ongeacht geslacht.
Hoe laat Jasp de fe zien?
Naast de geobserveerde frequenties komt in het rood de verwachte frequentie.
Waar staat r² voor en waar staat r voor?
- r² staat voor het aandeel variatie in y dat door de regressielijn verklaard kan worden
- r geeft de sterkte en richting van de lineaire correlatie tussen twee variabelen
Is effect grootte gestandaardiseerd?
Ja
Hoe zie je in de puntenwolk dat er geen homoscedasticiteit is?
- Er is een trechter waar bijvoorbeeld de observaties bij lage x heel dicht bij de regressielijn liggen en bij hoge y niet
- Homoscedasticiteit betekent dat voor elke waarde van x de schatting van y even goed is. Dus de variatie rond de regressielijn is hetzelfde (conditionele verdeling)
Wat is een sterke relatie tussen x en y? Is dat wanneer de puntjes dicht bij de lijn liggen of wanneer de stijging/daling sterker is?
- Er is een sterke relatie als en groei in x hoort bij een grote groei in y.
- De errors maken hierbij dus niet uit
- het gaat om een grote beta
Hoeveel waarnemingen per cel moet je hebben in 𝜒²?
Je moet minimaal 5 participanten per cel hebben
Wat is het symbool van gestandaardiseerde residuen en wat geeft het aan?
- 𝒵
- Geeft aan welke combinaties het sterkste afwijken en de richting (positief/negatief) van individuele afwijkingen.
- Jasp geeft voor elke combinatie de gestandaardiseerde residuen
Wat is de odds ratio? Wat is het symbool? wanneer is het effect groter? Wat is de odds? Wat is een beperking?
- 𝜃
- De odds van groep 1 gedeeld door de odds van groep 2.
- Hoe sterker hij afwijkt van 1, hoe sterker het effect.
- Odds van een groep is kans op succes/kans op failure.
- Alleen voor 2 x 2 kruistabellen