AVV blok 3 Flashcards
Cel absoluut maken (niet laten meebewegen)
F4 (dollar tekens)
Filter selecteren
titels van de rijen die je wilt filteren selecteren –> rechts bovenin naar sorteren en filter –> filter
Optellen
= SOM
Gemiddelde
= GEMIDDELDE
Maximum
= MAX
Minimum
= MIN
Tekst samenvoegen (bijv. januari en 2020 bij elkaar)
= B1&D1 –>januari2020
Tekst samenvoegen met een spatie erbij (bijv. jan. en 2020)
= B1&” “&D1 –> januari 2020
Voorwaarden opgeven (bijv. bruto winst hoger dan 0)
= ALS(G3>0;”ja”;”nee”)
2 ALS formules in 1 (omzet tussen 50 en 100)
= EN formule (geeft dan zelf aan ‘waar’ of ‘onwaar’ als de cel wel/niet voldoet aan de voorwaarden –> EN(E3>49;E3<101)
Berekenen minimum, 1e kwartiel, mediaan, 3e kwartiel, maximum:
kwartiel.inc (kies je een van de opties)
Berekenen range
= max - min
Inclusieve medium
rechtermuisnop, format data settings, inclusieve medium
Interquartile range (IQR)
verschil tussen Q1 en Q3, dus Q3-Q1
‘outlier’ vinden
- moet groter zijn dan = IQR * 1,5 en dit tel je op bij Q3
- moet kleiner zijn dan = IQR * 1,5, afgetrokken van Q1
Waarom gebruik je een paretodiagram?
Om inzicht te krijgen in knelpunten en welke het meeste voorkomen
Maken van een paretodiagram (4 stappen)
- Lijst met alle voorkomende redenen maken (grote lijst kopiëren en dan remove duplicants)
- Tellen hoe vaak elke rede voorkomt in de grote lijst (countif/aantal.als en range absoluut maken)
- Zet de tabel om in een frequentiediagram (deze is alleen niet in de volgorde van meest vaak naar minst vaak)
- Omzetten naar paretodiagram (data selecteren –> data sorteren –> op frequentie sorteren –> van groot naar klein)
Scatterplot
= relatie tussen 2 verschillende variabele (bijv. leeftijd en ontslagvertraging)
verschillende verbanden
Sterk positief = diagonale lijn naar boven met stipjes dicht bij elkaar
Zwak Positief = diagonale lijn naar boven, stipjes meer verspreid
Sterk negatief= diagonale lijn naar beneden met stipjes dicht bij elkaar
Zwak negatief = diagonale lijn naar beneden, stipjes meer verspreid
Correlatie scatterplot:
Rxy =1 (perfecte correlatie)
Rxy = -1 (negatieve correlatie)
Rxy = 0 (geen verband)
Rxy= 0,6 (geen perfect verband, maar wel een verband)
Sterkte van het verband scatterplot
sterk = 0,81-1 gematigd = 0,61-0,8 zwak = 0,41-0,6 zeer zwak = 0,21-0,4 geen verband = 0-0,20
Runchart
- bijhouden van 1 prestatie indicator (bijv. gemiddelde wachttijd röntgen) en dat houdt je een bepaalde tijd bij (bijv. een maand of een week of dag)
- -> je kunt dan zien of er trends zijn en of er problemen voordoen
x-diagram
run chart van gemiddelden
r-diagram
run chart van range
histogram
- frequentietabel maken met categorieën
- minimale en maximale berekenen
- =frequency/interval
- bereik aangeven (niet met dollar tekens) en dan de categorieën behalve de laatste (die wordt automatisch ingevuld
- histogram maken van het hele databereik (insert histogram)
ondergrens en bovengrens berekenen
gemiddelde + (3*stdev) –> bovengrens
gemiddelde - (3*stdev) –> ondergrens
Type data
- hoe zijn data precies gemeten? –> soorten meetschalen
- hoe zien de data eruit? beschrijvende statistiek
- mate van centrale tendentie (gemiddelde)
- mate van spreiding
meetschalen belangrijk omdat?
voor keuze van de juiste analysetechniek is de meetschaal van de gehanteerde data van groot belang
4 meetschalen door 3 vragen:
- is er een logische volgorde? nee, nominale schaal (bijv. kleur)
- is er een meeteenheid? nee, ordinale schaal (bijv. schooldiploma)
- Heeft die meeteenheid vaste verhoudingen? nee, intervalschaal (bijv. rapportcijfer)
- Alleen na 3 keer ja heb je een ratioschaal
Overzicht meetschalen kenmerkend volgorde verschillen nulpunt
kenmerkend: alle 4
volgorde: ordinaal, interval, ratio
verschillen: interval, ratio
nulpunt: ratio
Soorten variabelen
Nominaal: categorieën
Ordinaal: categorieën met een logische volgorde
Interval: kwantitatief zonder logische volgorde (niet hoeven leren)
Ratio: kwantitatief met vaste verhoudingen
Mediaan
middelste getal als je alles op volgorde hebt gezet (meestal bij ordinale schaal)
Modus
meest voorkomende hoeveelheid (als je het niet kunt ordenen, maar alleen losse groepen hebt)
Spreiding
= max - min
verdelingen
- uniforme verdeling - alles is gelijk verdeeld
- driehoeksverdeling - gemiddelde is het hoge punt, loopt gelijkmatig af naar de zijkant
- normaalverdeling - klokvormige verdeling
Vuistregels normaalverdeling
- 68% van de gegevens, hoogstens 1 keer de standaarddeviatie afwijkt van de standaardwaarde (gemiddelde) gemiddelde +/ - stdev
- 95% van de gegevens, valt hoogstens binnen 2x de standaarddeviatie genomen vanaf het gemiddelde. Gemiddelde +/- stdev *2
- 99,7% van de gegevens valt binnen hoogstens 3x de standaarddeviatie vanaf het gemiddelde. Gemiddelde +/- stdev *3
normale verdeling wordt gebruikt om
- de spreiding van variabelen weer te geven (beschrijvend): bijv. de spreiding van tentamencijfers, bloeddruk, tevredenheid
- de spreiding van steekproeven weer te geven (beschrijvend/toetsend)
wanneer gebruik je stdev.p
als je uitspraken doet over de GEHELE populatie. Dus als je data hebt van 400 mensen en uitspraken doet over al deze mensen. Niet wanneer je 1000 mensen hebt, maar alleen data hebt over 400. Dn kun je dus geen uitspraken doen over de gehele populatie, want deze groep kan bijv. niet representatief zijn
standaardiseren, z-formule maken
z= (x - gemiddelde) / stdev