Week 2 - Introductie domein kunstmatige intelligentie & data science Flashcards

1
Q

Er zijn verschillende definities van AI. Wat is de definitie volgens Andrew Moore?

A

AI is de wetenschap en techniek om computers zich op dusdanige manier te laten acteren, waarvoor we tot voor kort dachten dat daarvoor menselijke intelligentie noodzakelijk zou zijn geweest.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Waarom is de definitie van AI, volgens Andrew Moore, een open norm?

A

Dit komt doordat onderdeel van zijn betekenis is dat we voor kort dachten dat er menselijke intelligentie voor noodzakelijk geweest is.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Welke vormen van AI kennen we? Leg ook uit wat deze inhouden.

A
  1. General AI. De toepassing van de AI is gericht op één taak.
  2. Narrow AI. De toepassing van de AI is het toepassen van kennis en kunde in verschillende contexten. Dit bestaat nog niet.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wat betekent de ‘massa-focus’ op Narrow AI voor de voorlopige toekomst van de fiscalist?

A

Narrow AI is gericht op het overnemen van taken, niet op het opereren als een mens. Derhalve zal AI voorlopig alleen ondersteunend zijn door bepaalde taken over te nemen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wat is data science?

A

Data science is een interdisciplinair domein waarin een variëteit aan technieken worden ingezet om kennis en inzichten op te doen vanuit data. Het gaat dus om het converteren van data naar informatie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hoe verhoudt AI zich tot data science?

A

Hier is geen eensgezindheid over.
- De één zegt dat AI een subdomein is van data science.
- De ander zegt dat data science een subdomein is van AI.
- Andrew NG zegt dat data science een overlappende set tools is met AI en eigen tools.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hoe kan je, volgens Andrew Ng, het beste in een casus data science of AI herkennen en van elkaar onderscheiden?

A

AI leidt tot een software-oplossing, data science tot een rapportage.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wat is correlatie? Geef voorbeelden.

A

Dit is een statistische samenhang tussen twee variabelen, bijvoorbeeld lengte en gewicht of werkgelegenheid en IB opbrengst.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wat is de correlatiecoëfficiënt?

A

De correlatiecoëfficiënt geeft de sterkte van de samenhang aan.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Welke vormen van samenhang kennen we? Leg uit wat deze inhouden.

A
  1. Positieve samenhang. Een stijging van A gaat gepaard met een stijging van B.
  2. Negatieve samenhang. Een stijging van A gaat gepaard met een daling van B.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Welke waarden kan het correlatiecoëfficiënt aannemen?

A

De waarde is altijd tussen de -1 en de 1.

Hierbij betekent een waarde van -1 dat er een perfecte negatieve samenhang is, en een waarde van 1 dat er een perfecte positieve samenhang is.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wat betekent causaliteit?

A

Causaliteit is houdt in dat een verandering in A direct verantwoordelijk is voor de verandering in B. Het is dus een oorzaak-gevolg relatie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hoe verhouden causaliteit en correlatie zich tot elkaar?

A

Wanneer er sprake is van causaliteit, is er altijd sprake van correlatie. Echter, wanneer er sprake is van correlatie, is er niet altijd sprake van causaliteit.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Welke rol speelt data in ons leven?

A

Data is een bouwsteen voor het vergaren van kennis.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wat is data?

A

Data is elke digitaal opgeslagen vorm van informatie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wat is een dataset?

A

Een dataset is een digitaal opgeslagen verzameling van verschillende data. Denk aan personeelsgegevens (leeftijd, salaris, rekeningnummer etc.)

17
Q

Welke categorieën van data kennen wij? Leg uit wat ze inhouden.

A
  1. Gestructureerde data. Georganiseerde data, bijvoorbeeld door middel van kolommen en rijen.
  2. Ongestructureerde data. Deze data is feitelijk niet gestructureerd. Denk aan stemopnames of kranten.
18
Q

Wat is big data?

A

Big data is een op data gedreven analyse. Er wordt gekeken naar correlaties in de data, om kennis te vergaren.

19
Q

Wat zijn de kenmerken van big data?

A
  1. Velocity. Ziet op de snelheid van de data.
  2. Variety. Ziet op de verschillende vormen van gegevens.
  3. Volume. Ziet op de hoeveelheid van de gegevens.
  4. Veracity. Ziet op de kwaliteit van de gegevens.
  5. Value. De waarde die de data weergeeft.
20
Q

Wat wordt weergegeven in een confusion matrix?

A
  1. False negatives. Er is geen verband gevonden, terwijl deze in werkelijkheid wel aanwezig is. Dit kan veroorzaakt worden door volume, iets komt incidenteel voor.
  2. False positive. Er is een verband gevonden, maar deze is in werkelijkheid niet aanwezig. Dit kan komen door variëteit, denk aan fishing expedition.
  3. True negatives. Er is geen verband gevonden, en deze is er in werkelijkheid ook niet.
  4. True positive. Er is een verband gevonden, en deze is er in werkelijkheid ook.
21
Q

Welke conclusie trekt Hardford met betrekking tot correlaties?

A

Zonder theoretische onderbouwing voor correlatie en zonder goede aanwijzingen dat correlaties causaal zijn, kunnen op correlaties gebaseerde interventies volledig de plank misslaan.

22
Q

Wat is data mining?

A

Data mining is het geautomatiseerd ontdekken van patronen in grote datasets door middel van algoritme.

23
Q

Wat is het doel van data mining?

A

Het doel van data mining is het herkennen van verborgen trends, correlaties en waardevolle informatie.

24
Q

Welke vormen van data mining kennen we?

A
  1. Classificatietechniek.
  2. Regressietechniek.
  3. Clustertechniek.
  4. Associatietechniek.
25
Q

Leg uit wat het doel van de classificatietechniek is en hoe dit bereikt kan worden.

A

Het doel is om iets of iemand met bepaalde kenmerken voorspellend toe te wijzen aan vooraf vastgestelde klassen.
Dit kan gedaan worden door gegevens onder te brengen in vooraf vastgestelde klassen. Het algoritme leert van een set reeds geclassificeerde voorbeelden uit verschillende categorieën. Op basis van het geleerde volgt de classificatie van een nieuw geval.

26
Q

Bij de classificatietechniek moeten vooraf klassen opgesteld worden. Waar moeten deze klassen aan voldoen?

A

De klassen moeten elkaar uitsluiten. Voorbeeld: iemand kan niet zowel beperkt als onbeperkt belastingplichtig zijn.

27
Q

Leg uit wat het doel van de regressietechniek is en hoe dit bereikt kan worden.

A

Het doel is om een numerieke waarde te voorspellen aan de hand van iets of iemand met bepaalde kenmerken.
Dit wordt gedaan door gegevens vooraf een waarde mee te geven. Het algoritme leert van een set reeds gewaardeerde voorbeelden. Op basis van het geleerde volgt de voorspelde waarde van een nieuw geval, zoals bijvoorbeeld de kans op een onjuiste aangifte.

28
Q

Leg uit wat het doel van de clustertechniek is en hoe dit bereikt kan worden.

A

Het doel is om gegevens te groeperen op basis van hun overeenkomsten, zonder vooraf vastgestelde categorieën.
Dit kan gedaan worden door groeperingen van gegevens met bepaalde kenmerken binnen groepen die op elkaar lijken. De data wordt dus onderverdeeld in homogene groepen. De groepen kunnen elkaar overlappen.

29
Q

Leg uit wat het doel van de associatietechniek is en hoe dit bereikt kan worden.

A

Het doel is om associatieregels van gebeurtenissen die vaak samen gaan te formuleren.
Dit kan gedaan worden door naar correlaties en verbanden tussen gegevens te zoeken.