H10 Datamanagement Flashcards

1
Q

Wat is een projectmap?

A

Een centrale map waarin alle relevante data, software, aantekeningen en andere relevante bestanden opgeslagen zijn

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wat is README in een projectmap?

A

README = algemene beschrijving van de inhoud en indeling van de map

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Waarin kan je terug zien het verloop van het project?

A

Het verloop is zichtbaar in
- De verschillende versies van het codeerboek (apart opgeslagen in één map)
-De indeling van de data-map: ruwe data, gecodeerde data eigen sub-folder
-De losse Python-scrips

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wat is er belangrijk voor de bestandsnamen?

A
  • De namen moeten leesbaar en begrijpelijk zijn
  • De namen moeten eenvoudig te vinden en sorteren zijn op de computerer (beperk je tot letter, cijfers, - en _)
    -Denk na over de volgorde omdat het soms ingekort wordt en dan is het onduidelijk waar het over gaat
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wat sla je op en waar sla je dit op?

A
  • Transparantie: alles wat inzicht geeft in je keuzes moet je opslaan. Ook als het vanwege paginalimiet niet in je eindverslag komt
  • Reproduceerbaarheid: om te zorgen dat andere het onderzoek ook kunnen doen, moet je niet alleen definitieve onderzoeksgegevens, maar ook tussenliggende versies opslaan
  • Je slaat alles op op je eigen computer georganiseerd, maar maak ook zeker back-ups of zorg dat het in een online cloud staat.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wat is de onderzoekers zijn verantwoordelijkheid?

A

Mensen beschermen tegen potentieel ongewenste aandacht/ zorgen voor de privacy van de belanghebbenden.

Inhoudsanalyses zijn transformatief van karakter: data wordt beter doorzoekbaar en belanghebbenden kunnen (potentieel) meer in de schijnwerpers komen te staan dan ze zelf hadden verwacht

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wat betekent Anonimiseren en Pseudonimiseren?

A

Anonimiseren: identificerende gegevens verwijderen
Pseudonimiseren: identificerende gegevens versleutelen, je kan verschillende data van dezelfde persoon wel nog aan elkaar koppelen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wat zijn manieren om te anonimiseren?

A
  • Auteursnaam verwijderen (vervangen door code bij pseudonimiseren)
  • Verwijzingen naar bestaande personen uit tekst verwijderen
    -Gezichten uit foto’s of video’s blurren
    -Stemmen van personen in geluidsopnames vervormen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Op welke drie momenten zijn er voor anonimiseren?

A
  • Meteen na het verzamelen
  • Bij het publiceren van de data
    -Bij het schrijven van het verslag
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wat is een voor en nadeel van het anonimiseren meteen na het verzamelen?

A

Voordeel: Codeurs ook niet blootgesteld = codeurs onbevooroordeeld
Nadeel: deel van inhoud en context verloren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wat is een voor en nadeel van het anonimiseren bij het publiceren van de data?

A
  • Voordeel: identiteit van belanghebbende onherkenbaar
    -Nadeel: gebruikte data volledig onbruikbaar
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wat is het voordeel van het anonimiseren bij het schrijven van het verslag?

A

Voordeel: belanghebbende geen nadeel ondervinden aan onderzoek
Nadeel: extra belangrijk om goede voorbeelden te kiezen die wel nog inzichtelijk zijn

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wat is deface?

A

Programma dat werk om video’s en foto’s te anonimiseren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wat is een voordeel en nadeel aan deface?

A
  • Voordeel: niet altijd arbeidsintensief alsnog de data kunnen pubiceren
  • Nadeel: altijd tekortkomingen en uitzonderingsgevallen en moet dus handmatig gecheckt worden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wat is nog een gevaar van technologie en anonimisatie?

A

Technologie kan ook de-anonimiseren, stop geanonimiseerde berichten in een online zoekmachine en kijk of je de originele berichten kunt vinden. Goed om te weten als je volledige citaten gebruikt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wat zijn de meerdere gradaties van openheid/transparantie?

A
  1. De data openbaar maken
  2. Alleen de metadata openbaar maken
  3. Data op verzoek ter beschikking stellen
  4. De data op verzoek ter beschikking stellen, na het ondertekenen van een geheimhoudingsverklaring
17
Q

Wat houdt de data openbaar maken in als gradatie van openheid?

A

Alles publiceren wat je hebt, met een README om overzicht te geven
–> voor data zonder privacy problemen of copyright

18
Q

Wat houdt alleen de metadata openbaar maken in als gradatie van openheid?

A

Al het werk van de codeurs openbaar, maar de gegevens die je gecodeerd hebt zijn geen onderdeel van de publicatie; er zijn slechts verwijzingen naar originele boodschappen die gecodeerd zijn.

19
Q

Wat is een voor en nadeel van alleen de metadata openbaar maken?

A

Voordeel: datasets kunnen gereconstrueerd worden, maar originele auteurs volledige controle over hun data
Nadeel: originele auteurs kunnen hun berichten verwijderen

20
Q

Wat zijn voordeel en nadelen van data op verzoek ter beschikking stellen?

A

-Voordeel: volledige controle over de gegevens behouden
-Nadeel: extra drempels voor andere onderzoekers om gegevens te krijgen
-Nadeel: mogelijk niet houdbaar op lange termijn

21
Q

Wat zijn de voordelen en nadelen van data op verzoek ter beschikking stellen, na het ondertekenen van een geheimhoudingsverklaring?

A

Voor en nadelen optie 3:
-Voordeel: volledige controle over de gegevens behouden
-Nadeel: extra drempels voor andere onderzoekers om gegevens te krijgen
-Nadeel: mogelijk niet houdbaar op lange termijn

plus
Voordeel: extra middel om participanten te beschermen

22
Q

Wat is versiebeheer?

A

Het bijhouden van de verschillende veranderingen die optreden in de bestanden die je produceert tijdens het onderzoek
- sla bij elke stap een versie op voor het archief en een om verder mee te werken:
- war dataverzameling klaar is, 2x ruwe data
- ontwikkelen codeerbeok meerdere versies op wanneer je hem verbetert/aanpast
-gecodeerde data ook meerdere keren, per codeurs, en samengevoegd bestand.