H7 Betrouwbaarheid en Statistiek Flashcards

1
Q

Wat houdt de betrouwbaarheid in?

A

De precisie van een meetinstrument en het vermogen van het meetinstrument om bij herhaling dezelfde resultaten te produceren
(bij een inhoudsanalyse slaat dit op een proces, het coderen van de data)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wat is Intercodeursbetrouwbaarheid?

A

(= intercoder/interrater / interjudge reliability) = Inter annotater agreement = de betrouwbaarheid waarmee menselijke codeurs een verzameling kunnen labelen of categoriseren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wat zijn de meest gebruikte statistieken voor de intercodeursbetrouwbaarheid?

A
  1. Percentage agreement
  2. Cohen’s kappa
  3. Kirppendorff’s Alpha
  4. (Fleiss’ kappa: wordt verder niet besproken)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wat houdt een percentage agreement in?

A

Hoe vaak zijn de codeurs het eens als percentage

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wat zijn de voordelen van percentage agreement?

A

Voordeel: eenvoudig
Voordeel: score geeft direct inzicht (je weet het meteen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wat is het nadeel van percentage agreement?

A

Nadeel: Geen kanscorrectie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wat houdt Kanscorrectie in?

A

Kanscorrectie verwijst naar het idee dat je ook kijkt naar de kans dat de codeurs het per toeval eens zijn. De kans dat codeurs het met elkaar eens zijn is afhankelijk van de mate waarin ze allebei voor de verschillende opties hebben gekozen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wat is de Cohen’s kappa?

A

De Cohen’s kappa berekend intercodeursbetrouwbaarheid waarbij gecorrigeerd wordt voor de gokkans
Uitkomst is een score tussen 0 (=overeenkomst op kansniveau) en 1 (=perfecte overeenkomst), Kan ook negatief zijn, per toeval of wanneer codeurs het met elkaar oneens zijn

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wat is de formule van de Cohen’s kappa?

A

(Geobserveerde overeenkomst - verwachte overeenkomst) : (1-verwachte overeenkomst) = kappa

(Geobserveerde overeenkomst = de proportie van items waar codeurs het over eens waren
&
Verwachte overeenkomst = de proportie die je zou verwachten op basis van gedrag van de codeurs
-
Gedrag = hoe vaak ze voor verschillende categorieën hebben gekozen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wat zijn de nadelen van de Cohen’s kappa?

A
  • Kan alleen 2 codeurs vergelijken
  • Kan alleen nominale variabele vergelijken (categorieën)
  • Niet alle disagreements zijn even erg, daar houdt kappa geen rekening mee
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hoe is de interpretatie van de Cohen’s kappa?

A
  • kappa score van > 0.6 om voorzichtige conclusies te kunnen trekken
    -Liefst score van > 0.8 of hoger
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hoe kan het gebeuren dat er een hoge overeenstemming is maar een lage kappa score?

A

Oorzaak: Verdeling van de data, als een niveau relatief weinig voorkomt vergeleken met de andere heeft dat gevolgen

-Onenigheid over laagfrequente categorieën zorgt slechts voor een lichte afname in overeenstemmingspercentage. Immers een klein aantal in het geheel en overeenstemmingsprecentage kijkt naar het geheel
- Onenigheid over laagfrequente categorieën zorgt voor een sterke afname van de kappa-score. Misschien zijn ze het in absolute getallen helemaal niet vaak oneens, maar wel relatief in opzichte van de totale (kleine) hoeveelheid

(klein verschil overeenstemmingspercentage, groot verschil kappa score)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wat is de Krippendorff’s Alpha?

A

De Krippendorff’s Alpha
- Corrigeert ook voor gokkans
-Meerdere codeurs
-Verschillende soorten variabele: Nominaal, ordinaal, interval en ratio
-Houdt rekening met de grootte van verschillende codeurs
- -1 (tegenovergestelde mening) / +1 (exact dezelfde mening)

!Niet hetzelfde als Cronbach’s alpha, deze kun je hier niet gebruiken

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Waar hangt je keuze voor welke statistiek je gebruikt af?

A

Het is afhankelijk van:
- Algemene voorwaarden: nominale data kan alles, maar voor andere soorten moet je Krippendorff’s alpha kiezen. Ook met 2 codeurs kan alles, maar met meer kan je geen Cohen’s kappa doen.

–> Conventie = wat doen andere onderzoekers? Vaak voorkeur afhankelijk van vakgebied.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wat doe je bij een lage betrouwbaarheid?

A
  • Na pilotstudie –> codeerboek herzien
    -Anders -> Dubbel gecodeerde data: betrouwbaar, maar kost veel tijd
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wat te doen bij verschillen tussen codeurs?

A
  • Alle verschillen bespreken met de hele groep (= meteen punten voor de discussie)
    -Onenigheid tussen codeurs laten oplossen door extra codeurs die de knoop doorhakt
    -Alleen data meenemen waar codeurs het over eens waren (problematisch, introduceert mogelijk een bias)
  • Bij systematische verschillen:
  • Specifieke delen van data opnieuw coderen
  • Twee of meerdere categorieën samenvoegen (als onderscheid achter te fijnmazig is)
  • Categorieën weglaten als ze niet betrouwbaar te coderen zijn, en eventuele conclusies die je trekt op basis van die data daarmee ook onbetrouwbaar zouden zijn.
17
Q

Wat te doen bij ambigue codeertaken?

A
  • Alle data door één codeur laten beoordelen
  • Alle ambigue gevallen laten markeren door een codeur en apart analyserenW
18
Q

Hoe noem je een tabel waarin je de betrouwbaarheid kan visualiseren?

A

Een Heatmap table, waarbij de intensiteit van de kleuren aangeeft hoe vaak iedere combinatie van categorieën voorkomt

19
Q

Waar hangt de steekproefgrootte van af?

A

(Betrouwbaarheid en intercodeursbetrouwbaarheid zijn afhankelijk van de steekproefgrootte. Grootte hangt onder andere af van:
1. Hoe gevarieerd is het corpus dat je wil onderzoeken: meer variatie = grotere steekproef
2. Hoe vaak komen de verschillende categorieën voor die je wil coderen: meer categorieën = grotere steekproef
3. Hoe betrouwbaar moet de betrouwbaarheidsscore zijn: grotere steekproef = nauwkeurigere betrouwbaarheidsscore
4. Hoeveel tijd heb je om de data te coderen : geen zuivere reden, maar soms kan je niet anders

20
Q

Wat is de norm van steekproef volgens Lombard en collega’s (2010)?

A

De steekproef moet minimaal 50 items of 10% van de data, zelden meer dan 300 items nodig

21
Q

Wat is descriptieve statistiek?

A

Beschrijving van hoe je de gecodeerde data eruit ziet. Vaak het beste met een frequentietabel waarin de groepen die je vergelijkt naast elkaar zet, met de categorieën onder elkaar.

22
Q

Welke keuzes moet je maken bij de descriptieve statistiek?

A
  • Absolute getallen vs. percentages (kan ook allebei)
    • Absolute getallen: concreet, maar kunnen ook misleiden als bv. groepen niet even groot zijn
  • Percentages: overzichtelijk, wel duidelijk maken waar het percentage over gaat
    -Gemiddelde vs. mediaan
    • Gemiddelden: soms beïnvloed door extreme getallen (=outliers)
    • mediaan: getal dat in het midden ligt als je alle waarden op grootte sorteert
23
Q

Welke toetsen heb je bij de toetsende statistiek?

A

-Chi-kwadraat
- Correlatie
-Regressie
-T-toets
-F-toets

24
Q

Waar kunnen de onafhankelijke en afhankelijke variabelen uit bestaan bij de Chi-kwadraat?

A

Onafhankelijke variabele: Nominaal
Afhankelijke variabele: Nominaal

25
Q

Waar kunnen de onhartelijke en afhankelijke variabelen uit bestaan bij Correlatie?

A

Onafhankelijke variabele: Ordinaal/Interval/Ratio
Afhankelijke variabele:
Ordinaal/Interval/Ratio

26
Q

Waar kunnen de onhartelijke en afhankelijke variabelen uit bestaan bij Regressie?

A

Onafhankelijke variabele: Nominaal, Interval, Ratio
Afhankelijke variabele:
Interval/Ratio

27
Q

Waar kunnen de onhartelijke en afhankelijke variabelen uit bestaan bij T-toets?

A

Onafhankelijke variabele: Interval/Nominaal (1factor)
Afhankelijke variabele: Interval/Ratio

28
Q

Waar kunnen de onhartelijke en afhankelijke variabelen uit bestaan bij F-toets?

A

Onafhankelijke variabele: Interval/ Nominaal (1 of meer factoren)
Afhankelijke variabele: Interval/ Ratio