Week 1 - Introductie Flashcards

1
Q

Wat is Supervised Learning?

A

Vorm van Machine Learning waarbij een specifieke uitkomst of waarde wordt voorspeld.
- Training data met bekende uitkomsten
- Classification, Regression/Prediction

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wat is Unsupervised Learning?

A

Vorm van Machine Learning waarbij patronen worden herkent in data.
- Geen ‘target outcome variable’ om te voorspellen.
- Association rules, collaborative filters
- Data reduction & exploration, visualisation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wat zijn de stappen in het proces van Data Mining?

A
  1. Begrijp het doel
  2. Data verzamelen
  3. Data exploration, cleaning & preprocessing
  4. Data reduction / partitioning
  5. Taak specificeren
  6. Kies techniek
  7. Iteratieve implementatie en ‘tuning’
  8. Beoordeel resultaten & vergelijk modellen
  9. Beste model inzetten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Welke vormen van Supervised Learning zijn er?

A
  1. Classification
  2. Regression / Prediction
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Welke vormen van Unsupervised Learning zijn er?

A
  1. Association rules
  2. Collaborative filtering
  3. Clustering
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wat is Overfitting?

A

Wanneer een model té ‘gepast’ is op specifieke (trainings)data. Het heeft de karakteristieken van de trainingsdata geleerd i.p.v. de structuur of de logica die het volgt.
- Antwoorden oefentoets uit je hoofd leren, waardoor je de echte toets niet goed kan maken.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wat houdt het partitioneren van data in?

A

Het verdelen van data in niet-overlappende delen, zodat alles gebruikt wordt.
- Data ==> trainingset, validationset, testset

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wat houdt Classification in?

A

Het voorspellen van een categorie voor onbekende data.
- Vaak binaire (ja/nee)
- Fraud/No fraud
- Aankoop/geen aankoop

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wat houdt Regression in?

A

Het voorspellen van nummerische waarden.
- Vormt samen met Classification “Voorspellende analytics”
- Verkopen, winst, prestaties

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wat houden Association Rules in?

A

Vormen regels die definiëren: “wat gaat met wat?”
- Aanbevelingssystemen (shoppen)
- Als eieren gekocht, dan ook melk (voor cake)
- Algemeen, los van individu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wat houdt Collaborative Filtering in?

A
  • Aanbevelingssystemen (Netflix)
  • Als jij God of War leuk vindt, zal jij God of War 2 ook leuk vinden (gebaseerd op jouw gelijkenis aan Personen A & B die GoW 1 én 2 leuk vonden)
  • Individueel / persoonlijk niveau
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wat is SEMMA?

A

SEMMA is een methode:
Sample
Explore
Modify
Model
Assess

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wat zijn de 7C’s?

A

(LOS VAN ML)
Handleiding van het Data Lectoraat van Zuyd over hoe je een programma goed kan coderen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wat houdt Clustering in?

A

Het vormen van groepen van soortgelijke records.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wat is het verschil tussen normalisatie en standaardisatie?

A

Normalisatie brengt alle waarden naar 0 tot 1.
STANDAARDisatie deelt de deviaties door de STANDAARDdeviatie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hoe bereken je MAE? En wat heb je hieraan?

A

Geen idee.

17
Q

Hoe bereken je MPE? En wat heb je hieraan?

A

Geen idee.

18
Q

Hoe bereken je MAPE? En wat heb je hieraan?

A

Geen idee.

19
Q

Hoe bereken je RMSE? En wat heb je hieraan?

A

Geen idee.

20
Q

Hoe bereken je RMSE? En wat heb je hieraan?

A

Geen idee.