H10 Datamanagement Flashcards
Wat is een projectmap?
Een centrale map waarin alle relevante data, software, aantekeningen en andere relevante bestanden opgeslagen zijn
Wat is README in een projectmap?
README = algemene beschrijving van de inhoud en indeling van de map
Waarin kan je terug zien het verloop van het project?
Het verloop is zichtbaar in
- De verschillende versies van het codeerboek (apart opgeslagen in één map)
-De indeling van de data-map: ruwe data, gecodeerde data eigen sub-folder
-De losse Python-scrips
Wat is er belangrijk voor de bestandsnamen?
- De namen moeten leesbaar en begrijpelijk zijn
- De namen moeten eenvoudig te vinden en sorteren zijn op de computerer (beperk je tot letter, cijfers, - en _)
-Denk na over de volgorde omdat het soms ingekort wordt en dan is het onduidelijk waar het over gaat
Wat sla je op en waar sla je dit op?
- Transparantie: alles wat inzicht geeft in je keuzes moet je opslaan. Ook als het vanwege paginalimiet niet in je eindverslag komt
- Reproduceerbaarheid: om te zorgen dat andere het onderzoek ook kunnen doen, moet je niet alleen definitieve onderzoeksgegevens, maar ook tussenliggende versies opslaan
- Je slaat alles op op je eigen computer georganiseerd, maar maak ook zeker back-ups of zorg dat het in een online cloud staat.
Wat is de onderzoekers zijn verantwoordelijkheid?
Mensen beschermen tegen potentieel ongewenste aandacht/ zorgen voor de privacy van de belanghebbenden.
Inhoudsanalyses zijn transformatief van karakter: data wordt beter doorzoekbaar en belanghebbenden kunnen (potentieel) meer in de schijnwerpers komen te staan dan ze zelf hadden verwacht
Wat betekent Anonimiseren en Pseudonimiseren?
Anonimiseren: identificerende gegevens verwijderen
Pseudonimiseren: identificerende gegevens versleutelen, je kan verschillende data van dezelfde persoon wel nog aan elkaar koppelen
Wat zijn manieren om te anonimiseren?
- Auteursnaam verwijderen (vervangen door code bij pseudonimiseren)
- Verwijzingen naar bestaande personen uit tekst verwijderen
-Gezichten uit foto’s of video’s blurren
-Stemmen van personen in geluidsopnames vervormen
Op welke drie momenten zijn er voor anonimiseren?
- Meteen na het verzamelen
- Bij het publiceren van de data
-Bij het schrijven van het verslag
Wat is een voor en nadeel van het anonimiseren meteen na het verzamelen?
Voordeel: Codeurs ook niet blootgesteld = codeurs onbevooroordeeld
Nadeel: deel van inhoud en context verloren
Wat is een voor en nadeel van het anonimiseren bij het publiceren van de data?
- Voordeel: identiteit van belanghebbende onherkenbaar
-Nadeel: gebruikte data volledig onbruikbaar
Wat is het voordeel van het anonimiseren bij het schrijven van het verslag?
Voordeel: belanghebbende geen nadeel ondervinden aan onderzoek
Nadeel: extra belangrijk om goede voorbeelden te kiezen die wel nog inzichtelijk zijn
Wat is deface?
Programma dat werk om video’s en foto’s te anonimiseren
Wat is een voordeel en nadeel aan deface?
- Voordeel: niet altijd arbeidsintensief alsnog de data kunnen pubiceren
- Nadeel: altijd tekortkomingen en uitzonderingsgevallen en moet dus handmatig gecheckt worden
Wat is nog een gevaar van technologie en anonimisatie?
Technologie kan ook de-anonimiseren, stop geanonimiseerde berichten in een online zoekmachine en kijk of je de originele berichten kunt vinden. Goed om te weten als je volledige citaten gebruikt.