VO.3 - Voorspellen mbv data Flashcards
Wat is een feature?
meetbare data dat gebruikt kan worden voor analyse
Wat is een label?
Het wordt gebruikt voor het identificeren van data om er een meer betekenisvolle en meer informatieve label aan te geven zodat de machine context heeft waar hij van kan leren
Wat is het target?
Waar je je op richt
Wat is een instance?
voorbeeld
Wat zijn de vijf stappen van data analyse?
- Identificeren
- data verzameling
- clean: dubbel of inconsistente data verwijderen
- analyse
- interpretatie
Wat doe je bij data exploratie?
Een visuele manier om inzicht te krijgen in de data en het beginnen met leren van verschillende informatieve verdelingen
Wat kan het gevolg zijn van te veel features?
Overfitting: waarbij het slecht generaliseerbaar is
Waarin splitsen we data en waar worden deze groepen voor gebruikt?
- Test set voor training
- validation set voor finetuning en evaluatie
- Test set: final performance evaluation
Wat is Orange?
- Open bron data visualisatie
- machine learning
- Data mining toolkit
Voor snelle kwalitatieve data analyse en interactieve data visualisatie
Je hoeft niet alles te begrijpen om de basis van machine learning te snappen
Wat is data mining?
Het proces van het sorteren door grote data sets om patronen en relaties te identificeren met data analyse
Welke vijf stappen moet je doorlopen om een machine learning model te maken?
- data set exploration/visualisation
- feature selectie
- splitsen van data sets
- model creating en testing
- evaluatie