Lezioni Flashcards

Question

ROC Curve

Answer 1

Indica migliori classificatori (grande area sotto la curva), peggior classificatore diagonale (poiché se peggiore di diaognale mi basta fare 1- classificatore per risposta esatta. y = TP x = FP

Answer 2

Colleziono dati: selezione, integration, cleaning Data rappresentazione: seleziono feature, trovo outliers Scelgo modello, costruisco, valuto e deploy del modello.

Answer 3

Per ogni modello statistico, posso avere casuality che non possiamo comprendere da analisi dei dati.

Answer 4

Cerco funzione lineare che fitta meglio i miei dati y = m * x + b

Answer 5

sommatoria in p ... l (yp - hw(xp))ˆ2 , dove hw(xp) = m * x + b . Calcolo il gradiente, ora il gradiente se raggiunge zero, vuol dire che sono in un minimo locale , altrimenti sposto parametri verso segno del gradiente.

Answer 6

Dato un punto calcolo distanza con tutti gli altri punti, ordino distanze e in base a valore di k restituisco valore piu presente nei retrieved values.

Answer 7

Rappresenta il minimo errore teorico che possiamo ottenere

Answer 8

Weights delle features in accordo alla loro importanza, eliminando quelle meno relevant.

Answer 9

Nel task di classificazione ogni input ha una label, w^T X = w0 + w1x1 + w2x2 = 0 Dove w0 é detto bias, definiamo invece threshold = h(w1x1 + w2x2) > -w0

Answer 10

Uno basato su SVD, applicabile solo a linear models Uno basato su gradient descent, dove aggiungo delta w ai pesi, delta w influenzato da gradiente. Online aggiorna continuamente i pesi, batch raccoglie l elementi e li aggiunge per computare l'errore.

Answer 11

language bias ci limitiamo a linear model, search bias supponiamo che diminuendo LMS andremo a risolvere problema.

Answer 12

Possiamo aggiungere dimensionality semplicmente trasformando x -> xˆ2 o rad(x) o norma di x. problema siamo limitati da dimensionality e potremmo andare in overfitting

Answer 13

Per diminuire complessitá del modello utilizziamo tikhonow che aggiunge alla loss + delta ||w||^2

Answer 14

Eagar analizzo tutti i dati e creo modello, lazy prima creo modello e poi imparo dai dati.

Answer 15

K-NN per piu classi, assegno la classe piu presente K-NN pesato, il peso che hanno i punti nella media, viene diviso per la distanza al quadrato di questi dal punto che vogliamo assegnare al cluster.

Answer 16

curse of dim, all'aumentare del numero di dimensioni, abbiamo bisogno di un numero di elementi esponenzialmente maggiore di prima. costo computazionale. scelta di K. Sensibilitá al rumore.

Answer 17

Abbiamo una sommatoria di inputs con weights, e a questa sommatoria andiamo ad applicare una funzione di activation: linear, threshold, altre (tipo sigmoide).

Answer 18

over parametrizzazione. valori iniziali randomici, da evitare pesi troppo grandi o tutti zero, meglio in un range. Piu punti di minimo locali, utile effettuare avg minimi locali.

Answer 19

Per inseguirlo possiamo andare a creare un modello troppo complesso.

Answer 20

Con modalità online (stocastica) vado a ad effettuare upgrade per ogni pattern. Con batch sommo tutti i gradienti e poi effettuo modifiche. Mini batch migliore, poichè sommo un btach di k gradienti, fino ad arrivare a tutti i pattern. (SGD minibatch) i batch prendono dei set randomici dai sampling.

Answer 21

Aggiungo al gradiente anche il delta world, che sarebbe gradiente precedentemente calcolato. Questo per evitare convergenza verso minimi locali.

Answer 22

Aggiungo prima il momentum e poi applico gradiente.

Answer 23

Posso utilizzare un learning rate ns = (1 - alfa) n0 + alfa nt.

Answer 24

Di base si utilizza errore medio minore di E. per classification #miss per tollerance registro il max. Spesso utilizzo nessun cambio di peso rilevante, gradiente quasi pari a zero.

Answer 25

Aggiungo alla loss i weights (Tikhonov)

Answer 26

No, aiuta a diminuire complessità modello.

Answer 27

costruttivo, inizio con una rete piccola ed aggiungo units. Pruning, inizio con rete grande e poi elimino pesi o units.

Answer 28

Inzio con inputs collegati ad outputs, se non raggiungo errore desiderato, aggiungo unit e cosi in modo iterativo.