Week 3 - Machine Learning Flashcards

1
Q

Wat is machine learning volgens Arthur Samuel?

A

Dit is het in staat stellen van computers om ‘zelf’ te leren op basis van eerdere ervaringen, zonder daartoe expliciet geprogrammeerd te zijn.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Welke soorten machine learning kennen we?

A
  1. Supervised learning.
  2. Unsupervised learning.
  3. Semi-supervised learning.
  4. Reinforcement learning.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wat is supervised learning?

A

Bij supervised learning leert de machine op basis van voorbeelden. Het bestaat uit input en output, waarbij de input gelabeld wordt met de gewenste waarde . Door middel van herkenning van overeenkomsten, verschillen en andere punten van logica volgt de juiste output. Denk aan verkeersanalyseapps, die de snelste route proberen uit te rekenen.

Voorbeeld: doel is onderscheiden honden en katten. Het gewenste resultaat is het identificeren van de katten. Vooraf wordt een foto van een kat geïdentificeerd als juiste antwoord.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wat is unsupervised learning?

A

Modellen voor unsupervised learning hebben geen vooraf gegeven antwoordsleutel. Het bestudeert de input, en begint patronen en overeenkomsten te identificeren. Als je een groep foto’s hebt van honden en katten, dan zal het de foto’s groeperen in een groep met foto’s van honden en een groep met foto’s van katten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wat is semi-supervised learning?

A

Wanneer er sprake is van een enorme set ongestructureerde data, dan is semi-supervised learning een werkbare oplossing. Er wordt een kleine set gelabelde data ingevoerd. De machine zal vervolgens de gelabelde data analyseren op overeenkomsten die worden toegepast op de ongelabelde data.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wat is reinforcement learning?

A

Bij deze vorm van machine learning is er geen antwoordsleutel (zoals bij supervised learning), maar worden een reeks toegestane acties, regels en potentiële eindstatussen ingevoerd. De computers kunnen vervolgens leren op basis van voorbeelden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wat zijn onafhankelijke variabelen?

A

Dit zijn kenmerken of feiten van de observatie die invloed hebben op hetgeen je probeert te meten/voorspellen, zoals leeftijd, geslacht of lengte.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wat zijn afhankelijke variabelen?

A

Dit is de uitkomst die je probeert te voorspellen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wat is de gelabelde waarde?

A

Dit is de werkelijke uitkomst van hetgeen je geprobeerd hebt te voorspellen. De computer gebruikt dus de onafhankelijke variabelen (features) om de gelabelde waarde te voorspellen waarbij de error wordt geminimaliseerd.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wat is het verschil tussen regressie en classificatie?

A

Bij regressie probeert de computer continue om een waarde te bepalen, zoals WOZ-waarde, inkomen, leeftijd.
Bij classificatie voorspelt of classificeert het algoritme de afzonderlijke waarden, zoals waar of onwaar, man of vrouw, spam of geen spam.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Tegen welke problemen kan een machine aanlopen bij het voorspellen van de gelabelde waarde?

A
  1. Wat als de features weinig voorspellend zijn?
  2. Wat als de data inaccuraat zijn?
  3. Wat als de best voorspellende variabelen worden gemist?
  4. Wat als de omstandigheden veranderen, zoals de stijgende vastgoedprijzen?
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wat is generaliation?

A

Dit is het toepassen van ‘het geleerde’ uit trainingsdata toepassen op nieuwe, nog niet eerder geobserveerde gevallen door een machine learning model.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wat is machine learning volgens Tom Mitchell?

A

Een computerprogramma leert op basis van ervaring (E). Dit is de trainingsdata.
Vervolgens wordt de taak omschreven in een takenpakket (T). Dit wordt dus ingegeven door de programmeur.
Vervolgens wordt de prestatiemaatstaf (P) ingegeven. Op basis hiervan wordt beoordeeld of de voorspelling juist is en hoeveel die afwijkt.

Voorbeeld
Ervaring E: database met getaxeerde panden
Takenpakket T: voorspel (WOZ-)waarde
Prestatiemaatstaf P: verschil geschatte en werkelijke (WOZ)-waarde.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Noem drie kenmerken van een causaal verband.

A
  1. A gaat vooraf aan B;
  2. Er is een samenhang tussen A en B;
  3. De samenhang tussen A en B kan niet door iets anders worden verklaard.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wat is het verschil bij prestatiemaatstaven bij regressie en classificatie?

A

Bij regressie is de prestatiemaatstaf de mate van error, dus hoe ver de voorspelde waarde af zat van de werkelijke waarde.
Bij classificatie is dit iets complexer, aangezien er enkel goed en fout is.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wat kan voorspeld worden aan de hand van een confusion matrix? Kan deze gebruikt worden bij classificatie of regressie?

A

De confusion matrix kan gebruikt worden bij classificatie.

Door middel van de confusion matrix wordt de voorspelde waarde beoordeeld naast de gelabelde waarde.

17
Q

Welke mogelijkheden kunnen de voorspelde waarden onder geplaatst worden in de confusion matrix?

A
  1. True positive. Voorspelde waarde is positief, de gelabelde waarde is ook positief.
  2. False positive. Voorspelde waarde is positief, maar de gelabelde waarde is negatief.
  3. False negative. Voorspelde waarde is negatief, maar de gelabelde waarde is positief.
  4. True negative. Voorspelde waarde is negatief, de gelabelde waarde is ook negatief.
18
Q

Welke prestatiemaatstaven (P) kennen we bij classificatie nadat we een confusion matrix hebben opgesteld?

A

ASS
1. Accuracy (accuraatheid van de voorspellingen)
2. Sensitivity (sensitiviteit van het vinden van alle ‘positieven’)
3. Specificity (specifiteit in het vinden van alle ‘negatieven’)

19
Q

Hoe kan de prestatiemaatstaf (P) ‘accuracy’ berekend worden?

A

Accuracy = (True positives + true negatives) / aantal observaties.

Ofwel
Accuracy = correcte classificaties / aantal observaties.

20
Q

Hoe kan de prestatiemaatstaf (P) ‘sensitivity’ berekend worden?

A

Sensitivity = true positives / (true positives + false negatives).

Ofwel
Sensitivity = correcte positive classificaties / potentiële aantal positieve classificaties.

21
Q

Hoe kan de prestatiemaatstaf (P) ‘Specificity’ berekend worden?

A

Specificity = true negatives / (true negatives + false positives).

Ofwel
Specificity = correcte negatieve classificaties / potentiële aantal negatieve classificaties.

22
Q

Waarom maakt de belastingdienst gebruik van aangifteselectie?

A

Een volledige controle is onmogelijk gelet op de hoeveelheid aangiftes die binnenkomen. Hierom moet geselecteerd worden welke aangiftes gecontroleerd moeten worden en welke niet.

23
Q

Voor de aangifteselectie gebruikt te belastingdienst een risicomodel. Wat is dit?

A

Dit is een berekening op basis van data die de kans op een fout in de aangifte weergeeft met een percentage.

24
Q

“What is machine learning?”

Wat zijn de risico’s waar we op moeten letten bij machine learning?

A
  1. Het moeten eerlijke en onbevooroordeelde uitkomsten zijn. Soms trekt het algoritme bepaalde groepen voor.
  2. Privacy. We moeten zorgen dat mensen hun persoonlijke gegevens veilig blijven.
  3. Machine learning neemt banen weg. We moeten zorgen dat mensen andere kansen op banen krijgen.
  4. Om er voor te zorgen dat machine learning goed werkt, moeten we open en transparant zijn over hoe het werkt.
25
Q

“Introduction machine learning: definition, how it works, and methods!”

Wat is het verschil tussen machine learning, deep learning en neurol networks?

A

Machine learning dient geprogrammeerd te worden door mensen.
Deep learning kan het programma leren alsof het menselijke hersenen heeft.
Neural network is het ‘brein’ wat het programma heeft bij deep learning.