Week 5 Flashcards
Wat is een Venn Diagram?
Twee Cirkels die gedeeltelijk overlappen. (X en Y)
- De overlapping is in hoeverre de ene variabele de variatie in de andere verklaart.
Wanneer gebruik je de t-toets, z-toets en 𝜒²?
- t-toets gebruik je bij gemiddeldes en regressieanalyse
- Z-toets gebruik je bij proporties
- 𝜒² gebruik je bij het verschil in frequentie tussen twee categorische variabelen.
Hoe ziet de grafiek van de 𝜒² verdeling er uit? Hoe wordt dit beïnvloed door df? Hoe bereken je df?
- Hij is volledig positief omdat het een normale verdeling in het kwadraat is.
- Bij hogere df gaat hij meer op een normale verdeling lijken.
- df = (r – 1) x (c – 1)
Hoe bereken je de 𝜒² waarde?
- Je doet de som van elke geobserveerde frequentie f₀, min de verwachte frequentie fℯ gedeeld door fℯ.
- Dit doe je voor elke geobserveerde frequentie f₀ en die tel je bij elkaar op.
Als je kolommen en rijen hebt, waar staat dan de onafhankelijke variabele en waar staat de afhankelijke?
- De onafhankelijke variabele staat in de rijen
- De afhankelijke variabele staat in de kolommen.
Waar is het verwerpingsgebied van 𝜒².
Wat is het nadeel?
- Dit is altijd aan de rechter kant.
- Het laat dus niet zien of er een positief of negatief verband is,
Hoe bepaal je fe?
- Je neemt de totale frequenties en past dit percentage toe op de verschillende categoriale variabelen
- fe = Totaal van de kolom / Het totaal x de totaal van de rij.
- Bijvoorbeeld overal 75% ongeacht geslacht.
Hoe laat Jasp de fe zien?
Naast de geobserveerde frequenties komt in het rood de verwachte frequentie.
Waar staat r² voor en waar staat r voor?
- r² staat voor het aandeel variatie in y dat door de regressielijn verklaard kan worden
- r geeft de sterkte en richting van de lineaire correlatie tussen twee variabelen
Is effect grootte gestandaardiseerd?
Ja
Hoe zie je in de puntenwolk dat er geen homoscedasticiteit is?
- Er is een trechter waar bijvoorbeeld de observaties bij lage x heel dicht bij de regressielijn liggen en bij hoge y niet
- Homoscedasticiteit betekent dat voor elke waarde van x de schatting van y even goed is. Dus de variatie rond de regressielijn is hetzelfde (conditionele verdeling)
Wat is een sterke relatie tussen x en y? Is dat wanneer de puntjes dicht bij de lijn liggen of wanneer de stijging/daling sterker is?
- Er is een sterke relatie als en groei in x hoort bij een grote groei in y.
- De errors maken hierbij dus niet uit
- het gaat om een grote beta
Hoeveel waarnemingen per cel moet je hebben in 𝜒²?
Je moet minimaal 5 participanten per cel hebben
Wat is het symbool van gestandaardiseerde residuen en wat geeft het aan?
- 𝒵
- Geeft aan welke combinaties het sterkste afwijken en de richting (positief/negatief) van individuele afwijkingen.
- Jasp geeft voor elke combinatie de gestandaardiseerde residuen
Wat is de odds ratio? Wat is het symbool? wanneer is het effect groter? Wat is de odds? Wat is een beperking?
- 𝜃
- De odds van groep 1 gedeeld door de odds van groep 2.
- Hoe sterker hij afwijkt van 1, hoe sterker het effect.
- Odds van een groep is kans op succes/kans op failure.
- Alleen voor 2 x 2 kruistabellen
Wat is relative risk? Wanneer is het effect groter?
- 𝜋1/𝜋2
- Hoe verder van 1, hoe sterker het effect.
Wat gebruik je in plaats van 𝜃 als je meer dan 2 x 2 (r x c) nominale variabelen hebt in je kruistabel
Je gebruikt tau
Waarvoor gebruik je de gamma coëfficiënt, wat is het symbool
- 𝛾 (c - d / c + d)
- Voor ordinale variabelen in een r x c kruistabel
- Je bepaalt concordante en discordante waarnemingsparen
- Dus hoort een hogere waarde van de variabele bij een hogere of lagere frequentie in de andere cel
- Je kijkt hoeveel kordate en discordante paren er zijn.
Wat als er perfect samenhang is in een een kruistabel tussen variabelen.
Een specifieke waarde van de ene variabelen valt alleen in één specifieke waarde van de andere variabele