7+8 Flashcards

Question 1

Q

Wat is het percentage agreement en wat is het voordeel en nadeel

Answer

A

Pecentage hoeveel overeenkomst tussen codeurs bijvoorbeeld 40 van 100 is 40 procent
Voordeel: makkelijk te berekenen
Nadeel: geen kanscorrectie

Question 2

Q

Met welke testen kan je de betrouwbaarheid berekenen

Answer

A

● Percentage agreement
● Cohen’skappa
● Fleiss’ kappa
● Krippendorff’s Alpha

Question 3

Q

Welke verschillende meetniveaus zijn er

Answer

A

Nominaal: de data kunnen alleen worden gecategoriseerd, zonder duidelijke rangorde gender
Ordinaal: de data kunnen worden gecategoriseerd en er is sprake van een duidelijke rangorde top tien bestsellers
Interval: de data kunnen worden gecategoriseerd, er is sprake van een rangorde en de intervallen tussen de categorieën zijn gelijk temperatuur
Ratio: de data kunnen worden gecategoriseerd, er is sprake van een rangorde, de intervallen tussen de categorieën zijn gelijk en er is een betekenisvol nulpunt lengte

Question 4

Q

Wat zijn de nadelen van de cohen’s kappa

Answer

A

Cohen’s Kappa is alleen maar te gebruiken voor twee codeurs.
● Zoals gezegd is Kappa alleen maar te gebruiken voor nominale variabelen.
● Nie talle disagreements zijn even erg (sommige categorieën liggen dichter bij elkaar dan andere), maar Kappa houdt daar geen rekening mee

Question 5

Q

Wat is kanscorrectie

Answer

A

Wanneer er een multiple choice toets is heb je altijd kans dat je 25 procent goed hebt
Stel een toets heeft 40 vragen heb je er automatisch 10 goed maar met kanscorrectie om een voldoende te halen moet je bijvoorbeeld de helft goed hebben dan doe 10 die je automatisch goed hebt plus 30/2 is 25 antwoorden goed voor een voldoende hetzelfde geldt voor coderen

Question 6

Q

Wanneer kan je de cohen’s kappa gebruiken

Answer

A

Je kunt Cohen’s kappa alleen gebruiken om twee codeurs met elkaar te vergelijken, en alleen voor nominale variabelen. (Dus wel het
categoriseren van items, maar geen Likert-scores om de items te beoordelen.)
Score van 0.6 of meer voorzichtige conclusies
0.8 of meer is goed

Question 7

Q

Hoe kan er een hoge overeenstemming zijn en een lage kappa

Answer

A

Wanneer er laag frequente categorieen zijn en in die lage categorieen is er weinig overeenkomst is er een hoge agreement omdat die naar het geheel kijkt maar een lage kappa omdat die gaat erom dat codeurs de twee categorieën goed van elkaar kunnen onderscheiden

Question 8

Q

Wat is de krippendorff’s alpha

Answer

A

Reguleert ook gokkans maar kan ook meerdere codeurs berekenen en nominale, ordinale, interval en ratio
En houdt rekening met de grootte van de verschillen wanneer codeurs bijvoorbeeld
verschillende scores geven op een Likert-schaal
-1 is tegenovergestelde mening 1 is hetzelfde

Question 9

Q

Welke betrouwbaarheid kies je

Answer

A

Hangt af van het aantal codeurs en nominale data of niet maar je moet kijken van andere onderzoekers doen op het vakgebied en je kan altijd alles geven om een goed beeld te geven

Question 10

Q

Wat moet je doen bij ambigutieit (soms past iets bij meerdere categorieen

Answer

A

Alle data door éénc odeur laten beoordelen
Alle ambigue gevallen laten markeren door de codeurs, en apart analyseren

Question 11

Q

Wat is het minimale en maximale om dubbel te coderen

Answer

A

Minimaal 50 items of 10% en maximaal 200 items

Question 12

Q

Wat moet je doen bij een lage dubbel gecodeerde betrouwbaarheids score

Answer

A

Als 2 het hebben gecodeerd bespreken met meerdere de meerderheid kiezen
Alleen data meenemen die hetzelfde is
3e codeur beslissing laten nemen

Question 13

Q

Wat zijn belangrijke regels om rekening mee te houden als je twijfelt of je de data analyse door een computer laat doen of niert

Answer

A

Als een mens het niet kan (ook niet met veel moeite), kan een computer het ook niet
Hoe abstracter (of latenter) de analyse, des te moeilijker wordt het voor de computer: computers kunnen geen achterliggende gedachten herkennen
Technologie is nooit objectief

Question 14

Q

Wat kan je met het programma T-scan

Answer

A

Complexiteit van teksten meten

Question 15

Q

Op welke manier kan je tekst analyseren

Answer

A

Gebruik van een woordenlijst:
Om bijvoorbeeld verontschuldigingen te meten een lijst maken met alle woorden daarvoor en dan meten

Question 16

Q

Wat zijn de nadelen van een woordenlijst

Answer

A

Mensen kunne ook op een manier buiten de woordenlijst om excuses aanbieden
Soms gebruiken mensen excuses woorden zonder daadwerkelijk excuses aan te bieden bijvoorbeeld op een sarcastische manier

Question 17

Q

Wat is LIWC

Answer

A

Idee: de woorden die mensen gebruiken zijn gecorreleerd met hoe mensen zich voelen.
Benadering: tel verschillende soorten woorden, en bereken de proportie (relatieve frequentie) van die categorieën in een tekst

Question 18

Q

Wat is een sentiment analyse

Answer

A

Programma’s die ontwikkeld zijn om te meten of een tekst positief of negatief is
Aan de hand van machine learning en opgegeven zinnen van de makers die positief en negatief zijn wordt het steeds uitgebreider in beter dan enkel een woordenlijst

Question 19

Q

Wat zijn de nadelen van een sentiment analyse

Answer

A

Computers zijn minder goed in het begrijpen van niet-letterlijke betekenis. Humor en sarcasme worden dus niet altijd begrepen, omdat de juiste interpretatie sterk afhankelijk is van de context.
Wanneer je weet hoe positief of negatief mensen zijn in hun tekst, weet je nog niet waarover ze zich positief of negatief uitlaten stance detection

Question 20

Q

Hoe kunnen we ervoor zorgen dat een taalmodel model valide en betrouwbare resultaten geeft

Answer

A

Taalmodellen hebben duidelijke instructies nodig: duidelijke prompts
Taalmodellen moeten getest worden:
behandelen als een pilotstudie en de fouten eruit halen om een werkende versie te hebben

Question 21

Q

Wat is semi automatisch data analyse

Answer

A

Alle data automatisch laten coderen en vervolgens zelf checken of het klopt

Question 22

Q

Wat is modulariteit en wat zijn de voordelen

Answer

A

Verschillende onderdelen van je project splitst in losse eenheden, of modules. Dat heeft een aantal voordelen. Wanneer je verschillende taken scheidt van elkaar:
● Krijg je een beter overzicht van de taken die nog verricht moeten worden binnen het project.
● Kunnen verschillende groepsleden tegelijkertijd werken aan verschillende onderdelen.
● Is het achteraf ook duidelijker hoe je verschillende onderdelen aangepakt hebt.
● Kun je in toekomstige projecten eenvoudiger onderdelen uit eerdere studies hergebruiken

Question 23

Q

Hoe kan je modulariteit toepassen op een opdracht

Answer

A

Dataverzameling en data analyse van elkaar scheiden
Verschillende variabelen scheiden
Coderen en resultaten scheiden:
Nooit automatisch coderen en toetsende statistieken tegelijkertijd berekenen