Theorie PT3 Flashcards

1
Q

Polygons

A

Rechte lijn getrokken door verbonden datapunten met 2 assen

Kan bij Interval en Ratio schalen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Populatie

A

Alle individuen waarin een studie geïnteresseerd is. De originele populatie waaruit een sample komt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Probability values:

A

uitgedrukt in fracties. Kan ook in percentage.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Probability:

A

de kans op een specifieke uitkomst wanneer meerdere uitkomsten mogelijk zijn. Gegeven als een fractie. Dus de kans van alle opties bij elkaar is altijd 1.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Proportion / Proportie definitie

A

Relatieve frequentie van een waarde in relatie tot het totale aantal.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Random Sampling:

A

elk individu uit een populatie heeft een gelijke kans om geselecteerd te worden voor een sample. Resulteert in een simple random sample.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Range:

A

Verschil tussen hoogste en laagste score.

stap 1 om variability vast te stellen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Ratio scale

A

Data met een rangorde, gelijke intervallen én een absoluut nulpunt.
B.v. lengte, gewicht, inkomsten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Real limits

A

Het bereik waarin de ware waarde van de meting van een interval ligt. B.v. +/- 1.5cm (boven en onder)
Hierbij heb je upper en lower- real limits.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Rekenvolgorde met sommatie

A

Haakjes
Machten
Keer en delen
Sommatie
Verder optrekken/aftrekken

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Relatie Alpha level en Type I error?

A

Alpha level is de kans dat een experiment in een Type I error resulteert.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Ruwe score (raw)

A

Onverwerkte score, zoals 40/50 goed. Dus niet omgezet naar cijfer van 1 tot 10.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

s =

A

Sample SD

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Sample

A

Een set van individuen uit een populatie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Sampling error

A

Verschil tussen waarden berekend in de steekproef en de ware waarden uit de populatie. ontstaat omdat je een DEEL van de populatie meet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Sampling Error:

A

natuurlijke meetfout tussen steekproef en populatie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Scale of measurement

A

Categorieën die gebruikt worden om een variabele te meten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Score definitie

A

Score op een test, zoals 85 van de 100. Dit kan verwerkt zijn, b.v. als t-score

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Smooth curves worden gebruikt voor …

A

Populaties

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Standaardisatie =

A

alle ruwe scores omzetten in z-scores. Handig voor hypothese-testing.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Standardized distribution:

A

een getransformeerde distributie (normale distributie naar z-score) waarbij mu = 0 en SD = 1.

22
Q

Statistiek

A

Numerieke waarde die een sample beschrijft, gemeten uit die sample.

23
Q

Stel je voor dat je toetst of mensen met rode shirts meer complimenten krijgen dan mensen met andere kleuren. Je toetst dit met een sample van N = 200. Wat zijn de 2 hypothesen voor de hypothesetest?

A
  1. Nulhypothese N0 = de mensen wie rood dragen krijgen niet meer complimenten dan de andere kleuren.
  2. Alternatieve hypothese N1 = de mensen wie rood dragen krijgen meer complimenten.
24
Q

Stem-and-leaf display

A

Scores opknippen in losse getallen, 1e los.

Dus

1 | 1415
2 | 1266
3 | 87
4 | 55

3 heeft dan: 38 en 37.

25
Q

Tail of the distribution =

A

de lage kant in een asymmetrische distributie, waar het naar afzwakt.

26
Q

Type I en II error

A

Type I error: wanneer nulhypothese verworpen wordt terwijl de nulhypothese klopt. Dus onterecht aannemen dat er een effect was. De kans hiervoor is gedetermineerd door het Alpha level.
Type II error: wanneer nulhypothese niet wordt verworpen terwijl hij niet klopt. Dus onterecht aannemen dat er geen effect was. Komt vaak voor wanneer het effect klein is.

27
Q

Undetermined values:

A

waarden die niet ingevuld zijn bij datapunt, b.v. als de test nooit afgerond is en dus geen tijd voor de test beschikbaar is.

28
Q

Unimodale verdeling =

A

Symmetrische smooth curve waarin de piek het midden is

29
Q

Variability:

A

Beschrijft distributie, hoeveel afstand we kunnen verwachten tussen individu en gemiddelde. Mate waarin scores verspreid of geclusterd zijn. kwantitatieve meting van verschil tussen scores in een distributie. Meestal uitgedrukt in distance.

SD en Variance.

30
Q

Variance en standaarddeviatie kunnen gebruikt worden bij … scales.
1. Nominal
2. Ordinal
3. Ratio
4. Interval

A

Ratio en Interval, omdat ze gemeten worden in numerieke scores in termen van afstand van het gemiddelde. Aangezien alleen Ratio en Interval gelijke numerieke afstanden hebben. Een gemiddelde voor Nominal is onmogelijk en voor Ordinal is het onpasselijk.

31
Q

Verschil discrete/continuous variabele?

A

Continuous variables kunnen opgedeeld worden in oneindig delen. B.v. lengte tot cm, tot 1 punt achter komma of 2, etc.

Discrete variabelen zijn categorieën die ongerelateerd en apart zijn.

32
Q

Verschil simple random sampling en (independent) random sampling?

A

independent random sampling vereist dat de kans op selectie gelijk blijft naarmate mensen worden geselecteerd. Random sampling verwijst naar independent random sampling, dus de kans blijft gelijk.

33
Q

Voor de hypothese Mu > 15.8 is het beter om een … te gebruiken. 1) Directionele test 2) Two-tailed test.

A

Een directionele, want je stelt de alternatieve hypothese dat het effect groter zal zijn dan 15.8.

34
Q

Voordeel stem & leaf display over frequency distribution table:

A

stem & leaf geeft je specifieke waarde, frequency distribution geeft je sneller idee van frequentie.

35
Q

Waarom gebruik je real limits bij het inschatten van z-scores of probability bij een binominal distributie?

A

Een score van b.v. 6 is gerepresenteerd door een staaf in een histogram, en de volgende is 7. Dus 5,5 – 6,5 is 6.

36
Q

Waarom is de onbekende populatie (unknown population) hypothetisch?

A

Deze populatie is hypothetisch omdat de manipulatie nooit aan de hele populatie wordt geadministreerd. Dus het is een hypothese over de populatie op basis van sample data. De hypothese test is slechts een gestandaardiseerde methode om de sample data te testen.

37
Q

Waarom is er een normal approximation voor binominal distributies, en niet gewoon een normaaldistributie?

A

Omdat het geen continuous data is (1 of 2, niets tussen). Het komt wel erg dichtbij als je groot genoeg n hebt.

38
Q

Waarom wordt Variance gebruikt, waarbij je kwadraten gebruikt ipv de ruwe scores van Deviatie?

A

Omdat de som anders altijd 0 is.

39
Q

Wanneer gebruik je de Definitional Formula voor SS, en wanneer de Computational Formula?

A

Wanneer het gemiddelde geen geheel getal is wordt het lastig om alle individuele scores op te tellen met de definitional formula.

40
Q

Wanneer is een sample statistiek unbiased, en wanneer biased?

A

Unbiased: sample gemiddelde gelijk aan populatiegemiddelde
Biased: sample gemiddelde boven of onder populatiegemiddelde

41
Q

Wanneer je … (veel/weinig) scores hebt, is een grafische weergave beter dan een frequentie tabel.

42
Q

Wanneer je bij een continuous variabele veel identieke scores meet, wat kun je dan concluderen?

A

Er is waarschijnlijk een slechte meting uitgevoerd, aangezien de kans op identieke scores zeer klein is vanwege de oneindigheid van de variatie in continue variabelen.

43
Q

Wanneer je met een steekproefgemiddelde werkt, gebruik je … Standaarddeviatie/Standaarderror.

A

Standaarderror

44
Q

Wanneer n = 1, zal de standaarderror gelijk zijn aan …

A

De standaarddeviatie van de populatie.

45
Q

Wat betekent: H1 : Mu met rood shirt =/= 15.9?

A

De alternatieve hypothese stelt dat met een rood shirt, de behaalde score anders dan 15.9 zal zijn.HHH

46
Q

Wat geeft de central tendency weer?
(mediaan, modus, gemiddelde)

A

Het middenpunt

47
Q

Wat is binominal data?

A

Data waarbij twee categorieën de opties waren. B.v. winnen of verliezen, coin flips.

48
Q

Wat is de standaarddeviatie van een z-score distributie?

49
Q

Wat is de variantie voor de set: 2,2,2,2,2.?

A

0.

Deviatie is 0 en 0 squared is 0 * 5 is 0.

50
Q

Wat is de breedte van het interval 20-24?

A
  1. Je telt 20 en 24 mee
51
Q

Wat is de relatie tussen de modus, de mediaan en het gemiddelde bij een skewed distribution?

A

Het gemiddelde gaat naar de extreme scores in de staart, en de modus gaat naar het hoogtepunt van de skewed piek. De mediaan is meestal ergens tussen deze twee.