Week 1 Flashcards
Wat betekent beschrijvende statistiek?
Hoe ziet de data eruit? Bijvoorbeeld: je hebt een enquête afgenomen onder 10 studenten en beschrijft hoe de data eruit ziet (wat is het gemiddelde, hoe enthousiast zijn de studenten etc.)
Wat betekent inferentiële statistiek?
Voorspellen (speculeren). Uitspraken en voorspellingen doen over de hele populatie, op basis van de verkregen data (steekproef). Bijvoorbeeld: opiniepeilingen.
Waar heeft het boek het er in de terminologie over?
Sample statistic (beschrijvende statistiek) en population parameter (inferentiële statistiek).
Wat betekent een univariaat?
Dat zijn de vele verschillende manieren om de gegevens van één variabelen te beschrijven.
Wat zijn variabelen?
Het kenmerk, of de kenmerken waarnaar je onderzoek doet.
Wat is een categorische variabelen?
Die hebben als waarde geen getallen, maar alleen kenmerken of categorieën. Deze kunnen worden verdeeld in nominaal en ordinaal.
Wat betekent nominaal (en waar valt het onder)?
De variabelen heeft meerdere groepen maar er is geen rangordening. Bijvoorbeeld: wat is je lievelingskleur, nationaliteit of religie.
Kan je met een nominale variabelen wiskundige berekeningen doen?
Nee, dit is enkel puur voor de kwalitatieve gegevens.
Wat betekent dichotoom en onder welke variabele valt het?
Het valt onder de nominale variabelen. Het kan slechts twee waarden aannemen. Bijvoorbeeld: ja of nee, geslacht (man of vrouw) of een testresultaat (positief of negatief).
Wat betekent ordinaal (en waar valt het onder)?
Rangordening is wel mogelijk, maar er is geen vaste afstand. Bijvoorbeeld: rangen in het leger of opleidingsniveau. De stap van havo naar vwo is misschien niet hetzelfde als van hbo naar wo.
Wat is een kwantitatieve variabel?
Variabelen die als waarde getallen aannemen. Bijvoorbeeld: gewicht, leeftijd en inkomen. Verschillen tussen de waarden van deze schaal hebben een betekenis (optellen en aftrekken is mogelijk). Verhoudingen hebben geen betekenis (je kunt niet vermenigvuldigen of delen).
Waar heeft het mee te maken dat verschil tussen waarden betekenis hebben (optellen en aftrekken) en verhouding niet (niet vermenigvuldigen en delen)?
Omdat variabelen op intervalschaal geen vast nulpunt hebben.
Wat is een synoniem voor kwantitatieve variabelen?
Interval/Ratio
Waarin zijn kwantitatieve variabelen onder te delen?
Discreet en continu
Wat betekent een discrete variabel?
Dat zijn variabelen waarbij slechts bepaalde (gehele) waarden kunnen voorkomen en tussenliggende waarden niet mogelijk zijn. Bijvoorbeeld: aantal kinderen, huisdieren. De rangorde, de afstand tussen variabelen is even lang. Je kan niet 3.5 kind hebben.
Wat betekent een continu variabel?
Dat zijn variabelen waarbij oneindig veel mogelijkheden zijn in de waarde. Bijvoorbeeld: tijd, afstand en gewicht. De tijdsduur van een college is 44,99999 minuten.
Waarom is het onderscheidt in meetniveaus belangrijk?
Ze staan verschillende rekenkundige/statistische operaties toe.
Waar zegt een centrummaat niks over?
Over hoeveel alle waarden op elkaar lijken.
Wat is een andere belangrijke benaming van het gemiddelde?
De verwachting.
Wanneer maak je gebruik van het gemiddelde?
Als je verder nog niks weet.
Waarvoor staat de X-bar (X̄)?
Dat is het symbool voor het gemiddelde.
Wat is de mediaan (Md)?
Het middelpunt van de observaties als je ze van laag naar hoog ordent.
Wanneer maak je gebruik van de mediaan?
Als er grote uitschieters zitten inde te berekenen waarde (oftewel, grote variantie tussen waardes).
Wat is de modus?
Dit is de waarde die het vaakst voorkomt en dus de grootste categorie is.
Bij welke variabel gebruik je de modus?
Bij categorische variabelen.
Bij welke variabel gebruik je het gemiddelde (mean)?
Bij kwantitatieve variabelen.
Bij welke variabel gebruik je de mediaan?
Bij kwantitatieve variabelen.
Wat is je overweging tussen de keuze bij centrummaten bij kwantitatieve variabelen?
Je kiest de mediaan als je een invloedrijke outlier hebt. Als je dat niet hebt, dan kies je voor het gemiddelde.
Wat betekent verdeling van de data?
De waarden die een variabele aanneemt en hoevaak elke waarde voorkomt. Bijvoorbeeld: welk cijfer ga ik halen?
Wat is een datamatrix?
Dat is een overzicht van alle variabelen en cases.
Hoe kun je categorische data uitdrukken (in welke visualisatie?)
- Frequentietabel
- Taartdiagram
- Staafdiagram
Hoe kun je kwantitatieve data uitdrukken (in welke visualisatie?)
- Dot plot (puntdiagram)
- Steam and leaf plot (stamdiagram)
- Histogram
Hoe noem je het als onderzoekers kwantitatieve variabelen omzetten in ordinale categorieën?
Hercoderen.
Kan je ordinale variabelen hercoderen in kwantitatieve variabelen?
Nee dat kan niet, maar andersom kan wel. Dus van kwantitatieve variabelen omzetten in ordinale variabelen met bijvoorbeeld vijf categorieën.
Wanneer heeft een staafdiagram voordelen ten opzichte van een cirkeldiagram?
Als het aantal categorieën in een variabel toenemen.
Wanneer kan je een puntdiagram niet meer gebruiken en wat gebruik je dan?
Als de steekproef te groot wordt, je gebruikt dan een histogram.
Wat is het verschil tussen een histogram en staafdagram?
Bij een histogram raken de bars elkaar aan. Dat komt omdat de waarden van een interval ratio een onderliggende continue schaal presenteren.
Bij een staafdiagram moet er een witregel tussenzitten omdat het geen vloeiende lijn is, het is namelijk een categorische variabelen.
Er zijn dus twee verschillende concepten voor twee variabelen.
Wat is een proportie?
Dat is een verhouding.
Waartussen wordt een proportie altijd uitgedrukt?
Tussen 0 en 1.
Hoe bereken je een proportie?
Aantal observaties in een categorie/totaal aantal observaties.
Percentages kunnen ook worden uitgedrukt als proporties. Hoe noem je deze dan?
Conditionele proporties.
Waarom worden percentages die in proporties uit worden gedrukt conditionele proporties genoem?
De formatie is afhankelijk van een andere variabele.
Wat betekent unimodaal?
Er is één meestvoorkomende waarde, die zit in het midden.
Wat is bimodaal?
Er zijn twee modussen. Bijvoorbeeld: de een is heel positief en de ander is heel negatief. Meningen zijn erg verdeeld waardoor er meerdere pieken ontstaan.
Teken skewed to the right
Dus:
- Heuvel linkerkant
- Volgorde van hoog naar laag modus, mediaan, gemiddelde
Teken skewed to the left
Dus:
- Heuvel rechterkant
- Volgorde van laag naar hoog gemiddelde, mediaan, modus
Wat betekent spreiding?
Afwijkingen van het gemiddelde
Teken twee lijnen (een rode en een zwarte) waarin je een grote spreiding laat zien en een kleine spreiding.
Grote spreiding: lage lijn (zwart, verspreid).
Lage spreiding: hoge lijn (rood, een piek)
Hoe wordt de spreiding ook wel genoemd?
De variantie van de data.
Hoe wordt de spreidingsbreedte berekend?
Het verschil tussen de hoogste en laagste waarde.
Waar is de spreidingsbreedte gevoelig voor?
Het is heel gevoelig voor outliers.
Wat kan er beter gebruikt worden in plaats van de spreidingsbreedte en waarom?
Het interkwartielafstand (IQR) kan beter worden gebruikt. Het laat de extreme waarden buiten beschouwing.
Hoe groter de variantie…?
Hoe groter de variabiliteit. Dat betekent hoe groter de variantie, hoe meer waardes rondom het gemiddelde verspreid zijn.
Wat is het nadeel van de variantie?
Het is een gekwadrateerde maat (positieve en negatieve waarden zijn gekwadrateerd zodat ze elkaar niet opheffen).
Waarom is het gebruik van de standaarddeviatie belangrijk?
Het is belangrijk om de zekerheid te bekijken.
Teken een normale verdeling (klokvormig) met de bijbehorende tekens en percentages.
Zie samenvatting.
Hoe bereken je de deviatie?
Dat is x - x-bar (dus waarde - gemiddelde).
Wat geeft een standaarddeviatie aan?
Hoeveel de data gemiddeld afwijkt van het gemiddelde.
Waarvoor gebruik je een Z-score?
Om te berekenen hoeveel standaarddeviaties een bepaalde observatie van het gemiddelde afligt.
Welke score krijg je als je alle Z-scores bij elkaar optelt?
0, de negatieve en positieve Z-scores heffen elkaar op.
Hoe bereken je een Z-score?
Geobserveerde waarde - gemiddelde / standaarddeviatie.
Wat geeft een percentiel aan?
Geeft aan hoeveel procent de observaties op of onder een bepaald punt ligt.
Hoe bereken je de interquartile range?
Q3 - Q1
Welk type grafiek is heel handig wat betreft het beschrijven van het centrum, variabiliteit en het opsporen van outliers?
De Boxplot
Wanneer is het een outlier?
Als een observatie meer dan 1,5 keer de IQR onder het eerste kwartiel of boven het derde kwartiel ligt.