10+11 Flashcards
Wanneer botsen privacy en transparantie met elkaar
Als onderzoeker heb je de verantwoordelijkheid om de data van mensen die je gebruikt te anonimiseren daarentegen moet je wel transparant zijn en dat botst soms
Wat is het verschil tussen anonimiseren en pseudonimiseren
Anonimiseren betekent dat je de identificerende gegevens van iemand verwijdert, zodat de data niet
meer aan die persoon gekoppeld kunnen worden. Pseudonimiseren betekent dat je de
identificerende gegevens van iemand versleutelt, waardoor de identiteit van de betrokken personen verborgen is, maar je verschillende soorten data van dezelfde persoon (bijvoorbeeld verschillende posts op sociale media) wel aan elkaar kunt koppelen
Op welke verschillende manieren kan je data anonimiseren
- De auteurs naam verwijderen, of (bij pseudonimiseren) vervangen door een code.
- Verwijzingen naar bestaande personen uit een tekst verwijderen.
- Gezichten uit foto’s of video’s vervagen (blurren) zodat ze onherkenbaar zijn.
- Stemmen van personen in geluidsopnames vervormen zodat ze onherkenbaar zijn
Op welke verschillende momenten kan je data anonimiseren en wat zijn de voor- en nadelen
1: Meteen na het verzamelen:
Hierdoor kun je ervoor zorgen dat codeurs ook niet blootgesteld worden aan de auteurs van de data of de personen die worden afgebeeld. Dat heeft het grote voordeel dat codeurs onbevooroordeeld zijn bij het coderen
Het nadeel van anonimiseren is dat er ook een deel van de inhoud en context
verloren gaat
2: Bij het publiceren van de data:
Hierdoor kun je ervoor zorgen dat de identiteit van de belanghebbenden niet publiek bekend wordt
3: Bij het schrijven van het verslag:
Het is belangrijk om inzichtelijke
voorbeelden te geven, maar die voorbeelden komen onder een vergrootglas te liggen door de anonimisering. Dat maakt het extra belangrijk om je voorbeelden goed te kiezen, en ervoor te zorgen dat de belanghebbenden geen nadelen ondervinden van de publicatie van je onderzoek
Wat is het risico als je tweets direct citeert maar wel anonimiseert
Je kan ze terug opzoeken en er achter komen wie het heeft gestuurd
Wat is transparantie
Het inzichtelijk maken van het onderzoeksproces. Als onderdeel van het
inzichtelijk maken van dat proces kun je ervoor kiezen om de data openbaar beschikbaar te maken
Wat is descriptieve statistiek
Frequenties en betrouwbaarheid
Op welke verschillende manieren kan je je onderzoek open maken
1: De data openbaar maken. Dit is de meest open optie: je publiceert eigenlijk gewoon alles wat je hebt
2: Alleen de metadata openbaar maken
3: De data op verzoek ter beschikking stellen: de data veilig archiveren en als mensen er om vragen geven
Het voordeel hiervan is dat je volledige controle houdt over je gegevens en waar ze belanden. Het nadeel is dat deze methode extra drempels opwerpt voor andere onderzoekers om de data te krijgen. Bovendien is het onduidelijk hoe
houdbaar deze methode is op de lange termijn
4: De data op verzoek ter beschikking stellen, na het ondertekenen van een geheimhoudingsverklaring
Wat is toetsende statistiek
Chi-kwadraattoets, t-toets,ANOVA
Welke twee checklists zijn om de toegankelijkheid van je visualisatie te meten
Inhoud en visuele eigenschappen
Waaruit bestaat de checklist van inhoud
1: Zorg voor een duidelijke titel
2: Geef aan samenvatting in de tekst wat er te zien valt
3: Visualisaties zelf dienen begrijpelijke taal te bevatten, waarbij de X-as en de Y-as van grafieken duidelijk gelabeld worden.
4: Getallen moeten zo gepresenteerd worden dat lezers zelfstandig kunnen bepalen hoe vaak iets voorkomt
Waaruit bestaat de checklist over visuele eigenschappen
1: Juiste tekstgrootte
2: Zorg voor genoeg contrast tussen tekst en achtergrond
3: Redundantie: zorg ervoor dat kleur niet het enige onderscheid is tussen de verschillende categorieën
4: Schreefloos lettertype
Wat is een exploratieve analyse
De data ook gebruiken om nieuwe vragen te verkennen waar je geen hypothesen voor hebt opgesteld
Bijvoorbeeld de samenstelling van de populatie benoemen