H7 Betrouwbaarheid en Statistiek Flashcards

Question 1

Q

Wat houdt de betrouwbaarheid in?

Answer

A

De precisie van een meetinstrument en het vermogen van het meetinstrument om bij herhaling dezelfde resultaten te produceren
(bij een inhoudsanalyse slaat dit op een proces, het coderen van de data)

Question 2

Q

Wat is Intercodeursbetrouwbaarheid?

Answer

A

(= intercoder/interrater / interjudge reliability) = Inter annotater agreement = de betrouwbaarheid waarmee menselijke codeurs een verzameling kunnen labelen of categoriseren.

Question 3

Q

Wat zijn de meest gebruikte statistieken voor de intercodeursbetrouwbaarheid?

Answer

A

Percentage agreement
Cohen’s kappa
Kirppendorff’s Alpha
(Fleiss’ kappa: wordt verder niet besproken)

Question 4

Q

Wat houdt een percentage agreement in?

Answer

A

Hoe vaak zijn de codeurs het eens als percentage

Question 5

Q

Wat zijn de voordelen van percentage agreement?

Answer

A

Voordeel: eenvoudig
Voordeel: score geeft direct inzicht (je weet het meteen)

Question 6

Q

Wat is het nadeel van percentage agreement?

Answer

A

Nadeel: Geen kanscorrectie

Question 7

Q

Wat houdt Kanscorrectie in?

Answer

A

Kanscorrectie verwijst naar het idee dat je ook kijkt naar de kans dat de codeurs het per toeval eens zijn. De kans dat codeurs het met elkaar eens zijn is afhankelijk van de mate waarin ze allebei voor de verschillende opties hebben gekozen.

Question 8

Q

Wat is de Cohen’s kappa?

Answer

A

De Cohen’s kappa berekend intercodeursbetrouwbaarheid waarbij gecorrigeerd wordt voor de gokkans
Uitkomst is een score tussen 0 (=overeenkomst op kansniveau) en 1 (=perfecte overeenkomst), Kan ook negatief zijn, per toeval of wanneer codeurs het met elkaar oneens zijn

Question 9

Q

Wat is de formule van de Cohen’s kappa?

Answer

A

(Geobserveerde overeenkomst - verwachte overeenkomst) : (1-verwachte overeenkomst) = kappa

(Geobserveerde overeenkomst = de proportie van items waar codeurs het over eens waren
&
Verwachte overeenkomst = de proportie die je zou verwachten op basis van gedrag van de codeurs
-
Gedrag = hoe vaak ze voor verschillende categorieën hebben gekozen)

Question 10

Q

Wat zijn de nadelen van de Cohen’s kappa?

Answer

A

Kan alleen 2 codeurs vergelijken
Kan alleen nominale variabele vergelijken (categorieën)
Niet alle disagreements zijn even erg, daar houdt kappa geen rekening mee

Question 11

Q

Hoe is de interpretatie van de Cohen’s kappa?

Answer

A

kappa score van > 0.6 om voorzichtige conclusies te kunnen trekken
-Liefst score van > 0.8 of hoger

Question 12

Q

Hoe kan het gebeuren dat er een hoge overeenstemming is maar een lage kappa score?

Answer

A

Oorzaak: Verdeling van de data, als een niveau relatief weinig voorkomt vergeleken met de andere heeft dat gevolgen

-Onenigheid over laagfrequente categorieën zorgt slechts voor een lichte afname in overeenstemmingspercentage. Immers een klein aantal in het geheel en overeenstemmingsprecentage kijkt naar het geheel
- Onenigheid over laagfrequente categorieën zorgt voor een sterke afname van de kappa-score. Misschien zijn ze het in absolute getallen helemaal niet vaak oneens, maar wel relatief in opzichte van de totale (kleine) hoeveelheid

(klein verschil overeenstemmingspercentage, groot verschil kappa score)

Question 13

Q

Wat is de Krippendorff’s Alpha?

Answer

A

De Krippendorff’s Alpha
- Corrigeert ook voor gokkans
-Meerdere codeurs
-Verschillende soorten variabele: Nominaal, ordinaal, interval en ratio
-Houdt rekening met de grootte van verschillende codeurs
- -1 (tegenovergestelde mening) / +1 (exact dezelfde mening)

!Niet hetzelfde als Cronbach’s alpha, deze kun je hier niet gebruiken

Question 14

Q

Waar hangt je keuze voor welke statistiek je gebruikt af?

Answer

A

Het is afhankelijk van:
- Algemene voorwaarden: nominale data kan alles, maar voor andere soorten moet je Krippendorff’s alpha kiezen. Ook met 2 codeurs kan alles, maar met meer kan je geen Cohen’s kappa doen.

–> Conventie = wat doen andere onderzoekers? Vaak voorkeur afhankelijk van vakgebied.

Question 15

Q

Wat doe je bij een lage betrouwbaarheid?

Answer

A

Na pilotstudie –> codeerboek herzien
-Anders -> Dubbel gecodeerde data: betrouwbaar, maar kost veel tijd

Question 16

Q

Wat te doen bij verschillen tussen codeurs?

Answer

A

Alle verschillen bespreken met de hele groep (= meteen punten voor de discussie)
-Onenigheid tussen codeurs laten oplossen door extra codeurs die de knoop doorhakt
-Alleen data meenemen waar codeurs het over eens waren (problematisch, introduceert mogelijk een bias)
Bij systematische verschillen:
Specifieke delen van data opnieuw coderen
Twee of meerdere categorieën samenvoegen (als onderscheid achter te fijnmazig is)
Categorieën weglaten als ze niet betrouwbaar te coderen zijn, en eventuele conclusies die je trekt op basis van die data daarmee ook onbetrouwbaar zouden zijn.

Question 17

Q

Wat te doen bij ambigue codeertaken?

Answer

A

Alle data door één codeur laten beoordelen
Alle ambigue gevallen laten markeren door een codeur en apart analyserenW

Question 18

Q

Hoe noem je een tabel waarin je de betrouwbaarheid kan visualiseren?

Answer

A

Een Heatmap table, waarbij de intensiteit van de kleuren aangeeft hoe vaak iedere combinatie van categorieën voorkomt

Question 19

Q

Waar hangt de steekproefgrootte van af?

Answer

A

(Betrouwbaarheid en intercodeursbetrouwbaarheid zijn afhankelijk van de steekproefgrootte. Grootte hangt onder andere af van:
1. Hoe gevarieerd is het corpus dat je wil onderzoeken: meer variatie = grotere steekproef
2. Hoe vaak komen de verschillende categorieën voor die je wil coderen: meer categorieën = grotere steekproef
3. Hoe betrouwbaar moet de betrouwbaarheidsscore zijn: grotere steekproef = nauwkeurigere betrouwbaarheidsscore
4. Hoeveel tijd heb je om de data te coderen : geen zuivere reden, maar soms kan je niet anders

Question 20

Q

Wat is de norm van steekproef volgens Lombard en collega’s (2010)?

Answer

A

De steekproef moet minimaal 50 items of 10% van de data, zelden meer dan 300 items nodig

Question 21

Q

Wat is descriptieve statistiek?

Answer

A

Beschrijving van hoe je de gecodeerde data eruit ziet. Vaak het beste met een frequentietabel waarin de groepen die je vergelijkt naast elkaar zet, met de categorieën onder elkaar.

Question 22

Q

Welke keuzes moet je maken bij de descriptieve statistiek?

Answer

A

Absolute getallen vs. percentages (kan ook allebei)
- Absolute getallen: concreet, maar kunnen ook misleiden als bv. groepen niet even groot zijn
Percentages: overzichtelijk, wel duidelijk maken waar het percentage over gaat
-Gemiddelde vs. mediaan
- Gemiddelden: soms beïnvloed door extreme getallen (=outliers)
- mediaan: getal dat in het midden ligt als je alle waarden op grootte sorteert

Question 23

Q

Welke toetsen heb je bij de toetsende statistiek?

Answer

A

-Chi-kwadraat
- Correlatie
-Regressie
-T-toets
-F-toets

Question 24

Q

Waar kunnen de onafhankelijke en afhankelijke variabelen uit bestaan bij de Chi-kwadraat?

Answer

A

Onafhankelijke variabele: Nominaal
Afhankelijke variabele: Nominaal

Question 25

Q

Waar kunnen de onhartelijke en afhankelijke variabelen uit bestaan bij Correlatie?

Answer

A

Onafhankelijke variabele: Ordinaal/Interval/Ratio
Afhankelijke variabele:
Ordinaal/Interval/Ratio

Question 26

Q

Waar kunnen de onhartelijke en afhankelijke variabelen uit bestaan bij Regressie?

Answer

A

Onafhankelijke variabele: Nominaal, Interval, Ratio
Afhankelijke variabele:
Interval/Ratio

Question 27

Q

Waar kunnen de onhartelijke en afhankelijke variabelen uit bestaan bij T-toets?

Answer

A

Onafhankelijke variabele: Interval/Nominaal (1factor)
Afhankelijke variabele: Interval/Ratio

Question 28

Q

Waar kunnen de onhartelijke en afhankelijke variabelen uit bestaan bij F-toets?

Answer

A

Onafhankelijke variabele: Interval/ Nominaal (1 of meer factoren)
Afhankelijke variabele: Interval/ Ratio

Brainscape's Knowledge GenomeTM

H7 Betrouwbaarheid en Statistiek Flashcards

Brainscape's Knowledge Genome^TM