BI en andere soorten toetsende statistiek Flashcards
Wat zegt de 95% BI
Dat de werkelijke waarde van het verschil binnen de 95% zit. Als een meting 100 keer wordt herhaald zal de waarde 95 x binnen deze waarden liggen. In de overige 5% zal het buiten deze waarde liggen = statistisch significant.
Wanneer je een steeds kleinere P waarde hebt dan
is de kans steeds groter dat het gemeten verschil niet toevallig is.
Een smallere boog bij de BI geeft aan
preciezere schatting van de meting (vaak meer metingen) en meer betrouwbaar.
Wanneer wordt vaak BI ingezet
als er iets gezegd moet worden rondom de schatting van een bepaald effect
Als je voldoende data hebt : normaalverdeling: zie je een
klokvorm
De SE wordt kleiner naarmate er
meer metingen zijn gedaan (N groter wordt) (standard error)> hoe meer metingen>hoe smaller de verdeling > hoe dichter je bij het ‘ware’ gemiddelde komt = hoge klokvorm
waar zit 95% BI tussen
-2 SD en +2SD
Wat als 0% in de 95% BI zit?
dan is het nooit significant!, evenals de 1
: stel je doet een RCT naar nieuw medicijn x. In vergelijking met placebo heb je in de behandelgroep 55% mannen, in de controle groep 40%, hoe kun je bepalen of dit verschil significant is?
Chi 2 toets (2 categorische variabelen aan elkaar gerelateerd?) = non parametrische toets = als je een hypothese wilt toetsen!
Wat doet een Chi 2 toets
test over verschil is in proporties > berekend de kans P waarde dat je deze % vindt terwijl de verdeling hetzelfde is en het dus neit meer op toeval berust (treatment/controle/male/female: als een soort kruistabel)\
Met wat voor waarden reken je bij een Chi 2 toets?
nominale en ordinale variabelen : categorische variabelen.
Bijv. welke haarkleur (bruin, rood, blond) vinden mannen/vrouwen mooier = voorbeeld van 2 nominale variabelen
Wanneer verwerp je H0 bij een Chi 2 toets?
indien je uitgerekende data hoger is dan je kritieke waarde dan is er een significant verschil en wordt de alternatieve hypothese aangenomen
Waarom moet bij een Chi 2 toets 80% van de uitkomst van je variabele groter zijn dan 5?
dan heb je genoeg data gebruikt om aan te tonen dat er veschil is tussen wat je verwacht en hebt gevonden.
: in de behandel groep met medicijn X veranderd de systolische RR, deze neemt gemiddeld 8mmHg af. Hoe kun je bepalen of deze afname significant is?
Met een T toets > ongepaard want metingen in 2 groepen)
Op welk niveau doe je een T toets?
INTERVAL (schaal zoals rapportcijfer of tevredenheid ergens over )
OF RATIO (alles met aantal en natuurlijk 0 punt hebben)
Hoeveel groepen kun je vergelijken in een T toets
maximaal 2 groepen T van Twee
Waaronder kun je de uitslag van de T test vinden in SPSS
Sig 2 (en bij een waarde <0.05 kan H0 verworpen worden)
Wat meet een gepaarde T toets
vergelijking binnen zelfde groep: bijv voor - na meting.
Wat is een voorwaarde voor een gepaarde T toets
normaalverdeling
Waneer een ongepaarde T toets?
bij 2 onafhankelijke groepen , zoals in een RCT (koffiedrinkers en geen koffiedrinkers en uitslag RR)
Wat meet de one-sample T toets?
1 groep/steekproef zet je af tegen gemiddelde van een populatie (bijv. lengte basketballers tov Nederlanders en lengteverschil vergelijken).
Wat is de ANOVA?
Bij een groepsgrootte >3. of minimaal 2 onafhankelijke groepen: 1. tussenvariatie = spreiding groepsgemiddelden en 2: binnen variatie (spreiding binnen groep)
Is de ANOVA een parametrische of nonparametrische toets
parametrisch met normaalverdeling
Toets voor ratio-interval met normaalverdeling
t toets
Steekproef op nominaal niveau
Chi 2 toets
Steekproef met afhankelijke variabele op interval/ratio en niet normaal verdeeld
Wilcoxon
Steekproef met onafhankelijke varibale op ratio/interval of ordinaal niveau
mann whitne
Wat is een power analyse?
Aantal mensen dat nodig is om een effect aan te tonen en het voorkomen van over- of onderschatting en kans op type 1 fout te verkleinen en dus H0 terecht wordt verworpen
Wat doe je met een poweranalyse
berekening om minimale steekproefgrootte
Welke 4 componenten heb je nodig voor poweranalyse?
- statistische power (beta) : vaak 0.80
- steekproefomvang + welke data nodig (nominaal/ordinaal)
- significantieniveau (alpha): vaak 0.05
- verwachtte effectgrootte (gem groep 1 en 2 - SD)
Wat gebeurd er bij onderschatting van steekproefgrootte
wordt effect niet gedetecteerd waardoor fout negatieve conclusie = type 2 fout, wel belasting voor patiënt.
Wat is de power van een studie?
1 minus beta = 1 minus kans op het ten onrechte accepteren van H0. Power van een studie is de kans om een werkelijk verschil in de populatie op te pikken.
Wat is power 0.80
de keuze van powerniveau bepaald hoe zeker je kunt zijn dat type 2 fout (fout negatief:H0 ten onrechte accepteren) vermeden wordt = 0.80 => je accepteerd dus 0.20 kans om werkelijk effect te missen in een studie (dus met 0.80 zekerheid zegen dat je H0 kunt verwerpen)
Wat gebeurd er als je je power verhoogd
dan heb je een grotere sample size
Benjamin Franklin stated it as: “it is better 100 guilty Persons should escape than that one innocent Person should suffer”.
Where:
1) One innocent person suffer = type 1 error (alpha error) = more severe
2) 100 guilty persons escape = type 2 error (beta error)
3) You have more authority (increase Power) in a prison when you reduce type 2 error
a) by having a bigger prison (larger sample size)
and
b)counting prisoners (increase precision of measurement)
herhaal
Wat is significantie niveau (alpha)
- de kans dat je accepteert om een type 1 fout te maken (onterecht verwerpen H0) : je accepteert de kans van 5% dat je conclusies trekt over het verschil en dit een fout positieve uitslag is.
Wat als je je significantie niveau verlaagd?
dan moet je sample size groter: want kans op een fout positieve conclusie is lager (minder kans op type 1 fout)
Noem een voorbeeld bij de wens voor een zo laag mogelijk significantieniveau
bij nieuw medicament (wel een goedkoper alternatief, maar geen ander effect gewenst)
Wat is erger: een type 1 of 2 fout
type 1 fout weegt zwaarder
Wanneer je power wilt hebben in een studie wil je dan type 1 of 2 fouten laten afnemen?
type 2 fouten reduceren (ten onrechte H0 accepteren = fout negatief): denk aan gevangenis: 1 persoon ten onrechte vast
Wanneer je meer power wilt hebben wat doe je dan met je sample size
groter maken en preciezer kiezen (denk aan grotere gevangenis en gevangen tellen)
Wat is correlatie
maat voor samenhang tussen 2 variabelen (bijv. lengte en gewicht) : hoe deze elkaar beïnvloeden
Correlatie kun je meten aan de hand van welke meetniveau’s
interval of ratio
Wat is correlationeel onderzoek
niet-experimentele variant van kwantitatief onderzoek
Wat betekend een positieve correlatie
dat beide variabelen samen toenemen of afnemen. R>0 (>0.5)
Wat is een negatieve correlatie
als de ene variabele toeneemt en de andere afneemt.R<0 (<0.3)
Verschil tussen correlatie en causauliteit
- correlatie: statische indicator als ene veranderd dan veranderd de ander ook (kwantitatief onderzoek)
- causaliteit: oorzaak > gevolg (experimenteel onderzoek)
Correlatie bereken je met
Pearson correlation coefficient (interval of ratio niveau)
Wat is een regressieanalyse
Wanneer je de ene variabele wilt voorspellen uit de andere (onafhankelijke variabele ) Bijv. RR en gewicht. :
Kenmerken van een regressieanalyse
- afhankelijke (ratio of interval niveau) en onafhankelijke variabele hebben verschillend meetniveau
- de verbanden zijn niet om te wisselen
- doel = ontdekken patroon van samenhang, maar gaat verder dan correlatie
Uit welke punten bestaat een enkelvoudige regressie vergelijking/lijn?
- interceptpunt (alpha of beta 0) = constante (zelfs met 0 min. huiswerk heb je toch nog een 3 bijv of lengte 0cm heeft altijd wel een basisgewicht)
- regressiecoefficient (beta 1) of richtingscoefficient: geeft toename gewicht (Y) aan als verklarende variabele (X) lengte met 1cm toeneemt
Waarvoor kun je een regressie analyse gebruiken
- samenhang tussen 2 variabelen
- verandering van afhankelijke variabele voorspellen
- toekomstige waarde voorspellen
Wanneer gebruik je een enkelvoudige regressie
als je effect van 1 onafhankelijke (verklarende) varibale wilt testen op een afhankelijke verklarende (lengte vs gewicht)
Wat geeft de regressiecoëfficiënt (beta) aan?
hoe waarde van de afhankelijke variabele (y-as) gemiddeld veranderd wanneer de onafhankelijke variabele (x-as) veranderd (Schoenmaten en leeftijden): geeft een indicatie over de richting van het effect
Wat is een liniaire uitkomstmaat
continue (lengte/gewicht)
Wat is een logistische uitkomstmaat
uitkomstmaat voor een categorie bijv. wel/geen ziekte, wel/geen overlijden : mild-matig-ernstig
Rangsom toets
- Rangsom toets: Wilcoxon of Mann-Whitney zijn grofweg zelfde testen en testen voor 2 onafhankelijke groepen! (bijv: is er een verschil tussen het type uitgaansdrug en depressie score van feestgangers (gemeten met de Beck Depression Inventory) op de dag na uitgaan (zondag) en op de woensdag na uitgaan. = non-parametrische tegenhanger van de t-toets.
Rangtekentoets: Wilcoxon
- Rangtekentoets: Wilcoxon signed-rank test = test voor 2 metingen binnen dezelfde groep. (bijv: is er een verschil tussen depressie score van XTC gebruikers (gemeten met de Beck Depression Inventory) op de dag na uitgaan (zondag) en op de woensdag na uitgaan? = non-parametrische tegenhanger van de gepaarde T-toets.
Kruskal Wallis toets
- Kruskall Wallis toets: Test voor het vergelijken van >2 onafhankelijke groepen (bijv: wat is het effect van modus partus (natuurlijk, VE, Sectio) op de bevallingservaring (6-punts Likertscale) = non parametrische tegenhanger van de ANOVA.