Apprendimento Supervisionato Flashcards

1
Q

Cosa fa l’apprendimento supervisionato? Perchè si chiama supervisionato?

2 tipologie di problemi che risolve

Alcuni algoritmi di apprendimento supervisionato

A

Prende in input dati etichettati e costruisce un modello con cui si cerca di fare previsioni.
Supervisionato perchè nel campione di input il segnale di output che si vuole predire è già noto.

Risoluzione problemi di:
- classificazione: associa ad un dato pattern una certa classe (es spam/no spam)
-regressione: si associa ad un dato pattern un valore numerico reale (es previsione vendite)

ALGO:
- regressione
- regressione logistica
- reti neurali
- Support vector machine
- Decision Tree
- Naive Bayes
- Random Forest

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Regressione Lineare:
- obiettivo
- quale relazione stimo?
- quale è la loss function?
- un possibile ottimizzatore

A
  • cerco una relazione tra variabili indipendenti X (es caratteristiche appartamento) e variabili dipendenti Y (es stima valore casa)
  • relazione Y = WX + b
  • loss function: MSE= 1/n * sommatoria yvera-y predetta
  • discesa del gradiente
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Regressione Logistica:
- obiettivo

A

dati degli input, stimare la classe di appartenenza del dato.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Support vector Machine:
- obiettivo del modello
- cerco quello che massimizza il …
- cosa sono i support vectors
- kernel trick

A

-Trovare l’iperpiano che separa il più possibile i punti di una classe da quelli di un’altra classe
- Cerco l’iperpiano con il margine maggiore tra le due classi.
- SV: osservazioni che identificano la posizione dell’iperpiano di separazione.
- Kernel Trick: applico una trasformazione (funzione kernel) per ottenere classi più facilmente separabili.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Decision Tree:
- tipologia di apprendimento, a cosa serve
- idea

A
  • apprendimento supervisionato volto a problemi di regressione o classificazione.
  • uso le features del dataset per creare delle domande si/no volte a splittare fin quando non isolo tutte le osservazioni di ciascuna classe
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Decision Tree:
- entropia cosa misura, come si calcola, che valori assume e quando
- come scelgo la feature migliore su cui fare lo split. (+esempio)

A

Misura il disordine in un sistema.
Entropia= - sommatoria p(classe) * log2(p(classe)).
Oscilla tra 0 (se tutti stessa classe) e 1 (disordine massimo).

-> Cerco la feature che genera il maggior guadagno informativo: la maggior riduzione dell’entropia.

es. calcolo entropia tennis si/no.
calcolo entropia vento forte.
calcolo entropia vendo debole.

Guadagno Informativo=
EntrTennis - ggForteV/ggTot * entrForteV - ggDeboleV/ggTot * entrDeboleV

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Ensemble Learning

A

Diversi alberi decisionali, alla fine si fa una media o maggioranza dei risultati.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Random Forest:
- 3 iperparametri
- come funziona e come arriva alla risposta

A

1) dimensione dei nodi.
2) numero degli alberi.
3) numero di features che vengono campionate.

Più strutture ad albero decisionali che operano ciascuna in sottoinsieme diverso:
x regressione faccio la media; x classificazione faccio maggioranza.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly