Theorie PT3 Flashcards

Question 1

Q

Polygons

Answer

A

Rechte lijn getrokken door verbonden datapunten met 2 assen

Kan bij Interval en Ratio schalen.

Question 2

Q

Populatie

Answer

A

Alle individuen waarin een studie geïnteresseerd is. De originele populatie waaruit een sample komt

Question 3

Q

Probability values:

Answer

A

uitgedrukt in fracties. Kan ook in percentage.

Question 4

Q

Probability:

Answer

A

de kans op een specifieke uitkomst wanneer meerdere uitkomsten mogelijk zijn. Gegeven als een fractie. Dus de kans van alle opties bij elkaar is altijd 1.

Question 5

Q

Proportion / Proportie definitie

Answer

A

Relatieve frequentie van een waarde in relatie tot het totale aantal.

Question 6

Q

Random Sampling:

Answer

A

elk individu uit een populatie heeft een gelijke kans om geselecteerd te worden voor een sample. Resulteert in een simple random sample.

Question 7

Q

Range:

Answer

A

Verschil tussen hoogste en laagste score.

stap 1 om variability vast te stellen.

Question 8

Q

Ratio scale

Answer

A

Data met een rangorde, gelijke intervallen én een absoluut nulpunt.
B.v. lengte, gewicht, inkomsten

Question 9

Q

Real limits

Answer

A

Het bereik waarin de ware waarde van de meting van een interval ligt. B.v. +/- 1.5cm (boven en onder)
Hierbij heb je upper en lower- real limits.

Question 10

Q

Rekenvolgorde met sommatie

Answer

A

Haakjes
Machten
Keer en delen
Sommatie
Verder optrekken/aftrekken

Question 11

Q

Relatie Alpha level en Type I error?

Answer

A

Alpha level is de kans dat een experiment in een Type I error resulteert.

Question 12

Q

Ruwe score (raw)

Answer

A

Onverwerkte score, zoals 40/50 goed. Dus niet omgezet naar cijfer van 1 tot 10.

Question 13

Q

s =

Answer

A

Sample SD

Question 14

Q

Sample

Answer

A

Een set van individuen uit een populatie

Question 15

Q

Sampling error

Answer

A

Verschil tussen waarden berekend in de steekproef en de ware waarden uit de populatie. ontstaat omdat je een DEEL van de populatie meet.

Question 16

Q

Sampling Error:

Answer

A

natuurlijke meetfout tussen steekproef en populatie.

Question 17

Q

Scale of measurement

Answer

A

Categorieën die gebruikt worden om een variabele te meten

Question 18

Q

Score definitie

Answer

A

Score op een test, zoals 85 van de 100. Dit kan verwerkt zijn, b.v. als t-score

Question 19

Q

Smooth curves worden gebruikt voor …

Answer

A

Populaties

Question 20

Q

Standaardisatie =

Answer

A

alle ruwe scores omzetten in z-scores. Handig voor hypothese-testing.

Question 21

Q

Standardized distribution:

Answer

A

een getransformeerde distributie (normale distributie naar z-score) waarbij mu = 0 en SD = 1.

Question 22

Q

Statistiek

Answer

A

Numerieke waarde die een sample beschrijft, gemeten uit die sample.

Question 23

Q

Stel je voor dat je toetst of mensen met rode shirts meer complimenten krijgen dan mensen met andere kleuren. Je toetst dit met een sample van N = 200. Wat zijn de 2 hypothesen voor de hypothesetest?

Answer

A

Nulhypothese N0 = de mensen wie rood dragen krijgen niet meer complimenten dan de andere kleuren.
Alternatieve hypothese N1 = de mensen wie rood dragen krijgen meer complimenten.

Question 24

Q

Stem-and-leaf display

Answer

A

Scores opknippen in losse getallen, 1e los.

Dus

1 | 1415
2 | 1266
3 | 87
4 | 55

3 heeft dan: 38 en 37.

Question 25

Q

Tail of the distribution =

Answer

A

de lage kant in een asymmetrische distributie, waar het naar afzwakt.

Question 26

Q

Type I en II error

Answer

A

Type I error: wanneer nulhypothese verworpen wordt terwijl de nulhypothese klopt. Dus onterecht aannemen dat er een effect was. De kans hiervoor is gedetermineerd door het Alpha level.
Type II error: wanneer nulhypothese niet wordt verworpen terwijl hij niet klopt. Dus onterecht aannemen dat er geen effect was. Komt vaak voor wanneer het effect klein is.

Question 27

Q

Undetermined values:

Answer

A

waarden die niet ingevuld zijn bij datapunt, b.v. als de test nooit afgerond is en dus geen tijd voor de test beschikbaar is.

Question 28

Q

Unimodale verdeling =

Answer

A

Symmetrische smooth curve waarin de piek het midden is

Question 29

Q

Variability:

Answer

A

Beschrijft distributie, hoeveel afstand we kunnen verwachten tussen individu en gemiddelde. Mate waarin scores verspreid of geclusterd zijn. kwantitatieve meting van verschil tussen scores in een distributie. Meestal uitgedrukt in distance.

SD en Variance.

Question 30

Q

Variance en standaarddeviatie kunnen gebruikt worden bij … scales.
1. Nominal
2. Ordinal
3. Ratio
4. Interval

Answer

A

Ratio en Interval, omdat ze gemeten worden in numerieke scores in termen van afstand van het gemiddelde. Aangezien alleen Ratio en Interval gelijke numerieke afstanden hebben. Een gemiddelde voor Nominal is onmogelijk en voor Ordinal is het onpasselijk.

Question 31

Q

Verschil discrete/continuous variabele?

Answer

A

Continuous variables kunnen opgedeeld worden in oneindig delen. B.v. lengte tot cm, tot 1 punt achter komma of 2, etc.

Discrete variabelen zijn categorieën die ongerelateerd en apart zijn.

Question 32

Q

Verschil simple random sampling en (independent) random sampling?

Answer

A

independent random sampling vereist dat de kans op selectie gelijk blijft naarmate mensen worden geselecteerd. Random sampling verwijst naar independent random sampling, dus de kans blijft gelijk.

Question 33

Q

Voor de hypothese Mu > 15.8 is het beter om een … te gebruiken. 1) Directionele test 2) Two-tailed test.

Answer

A

Een directionele, want je stelt de alternatieve hypothese dat het effect groter zal zijn dan 15.8.

Question 34

Q

Voordeel stem & leaf display over frequency distribution table:

Answer

A

stem & leaf geeft je specifieke waarde, frequency distribution geeft je sneller idee van frequentie.

Question 35

Q

Waarom gebruik je real limits bij het inschatten van z-scores of probability bij een binominal distributie?

Answer

A

Een score van b.v. 6 is gerepresenteerd door een staaf in een histogram, en de volgende is 7. Dus 5,5 – 6,5 is 6.

Question 36

Q

Waarom is de onbekende populatie (unknown population) hypothetisch?

Answer

A

Deze populatie is hypothetisch omdat de manipulatie nooit aan de hele populatie wordt geadministreerd. Dus het is een hypothese over de populatie op basis van sample data. De hypothese test is slechts een gestandaardiseerde methode om de sample data te testen.

Question 37

Q

Waarom is er een normal approximation voor binominal distributies, en niet gewoon een normaaldistributie?

Answer

A

Omdat het geen continuous data is (1 of 2, niets tussen). Het komt wel erg dichtbij als je groot genoeg n hebt.

Question 38

Q

Waarom wordt Variance gebruikt, waarbij je kwadraten gebruikt ipv de ruwe scores van Deviatie?

Answer

A

Omdat de som anders altijd 0 is.

Question 39

Q

Wanneer gebruik je de Definitional Formula voor SS, en wanneer de Computational Formula?

Answer

A

Wanneer het gemiddelde geen geheel getal is wordt het lastig om alle individuele scores op te tellen met de definitional formula.

Question 40

Q

Wanneer is een sample statistiek unbiased, en wanneer biased?

Answer

A

Unbiased: sample gemiddelde gelijk aan populatiegemiddelde
Biased: sample gemiddelde boven of onder populatiegemiddelde

Question 41

Q

Wanneer je … (veel/weinig) scores hebt, is een grafische weergave beter dan een frequentie tabel.

Question 42

Q

Wanneer je bij een continuous variabele veel identieke scores meet, wat kun je dan concluderen?

Answer

A

Er is waarschijnlijk een slechte meting uitgevoerd, aangezien de kans op identieke scores zeer klein is vanwege de oneindigheid van de variatie in continue variabelen.

Question 43

Q

Wanneer je met een steekproefgemiddelde werkt, gebruik je … Standaarddeviatie/Standaarderror.

Answer

A

Standaarderror

Question 44

Q

Wanneer n = 1, zal de standaarderror gelijk zijn aan …

Answer

A

De standaarddeviatie van de populatie.

Question 45

Q

Wat betekent: H1 : Mu met rood shirt =/= 15.9?

Answer

A

De alternatieve hypothese stelt dat met een rood shirt, de behaalde score anders dan 15.9 zal zijn.HHH

Question 46

Q

Wat geeft de central tendency weer?
(mediaan, modus, gemiddelde)

Answer

A

Het middenpunt

Question 47

Q

Wat is binominal data?

Answer

A

Data waarbij twee categorieën de opties waren. B.v. winnen of verliezen, coin flips.

Question 48

Q

Wat is de standaarddeviatie van een z-score distributie?

Question 49

Q

Wat is de variantie voor de set: 2,2,2,2,2.?

Answer

A

0.

Deviatie is 0 en 0 squared is 0 * 5 is 0.

Question 50

Q

Wat is de breedte van het interval 20-24?

Answer

A

Je telt 20 en 24 mee

Question 51

Q

Wat is de relatie tussen de modus, de mediaan en het gemiddelde bij een skewed distribution?

Answer

A

Het gemiddelde gaat naar de extreme scores in de staart, en de modus gaat naar het hoogtepunt van de skewed piek. De mediaan is meestal ergens tussen deze twee.