Chapter 5: Loss Functions Flashcards

Question 1

Q

what is a loss function

Answer

A

describes how well a model fits training data

Question 2

Q

what are other names for loss function

Answer

A

error
cost
objective

Question 3

Q

what do we do with the loss function

Answer

A

aim to minimise or maximise it

Question 4

Q

give 5 loss functions

Answer

A

sum of squares error

mean squared error

hinge loss

cross entropy loss

likelihood, log likelihood

Question 5

Q

describe sum of squares error

Answer

A

1/2 (sum (Yi - yi)^2)

Question 6

Q

how do we calculate classification error

Answer

A

classes are calculated using thresholding

we use one hot encoding for multi class classification

Question 7

Q

what is regularisation

Answer

A

it prevents overfitting by drawing attention away from the error function

by adding a regularisation term to the error function

Question 8

Q

give a regularised least squares equation

Answer

A

normal squares + param/2 w^t w

Question 9

Q

give l1 regularisation

Answer

A

least squares + param/2 sum of dimensions |wj|^1

Question 10

Q

give l2 regularisation

Answer

A

least squares + param/2 sum of dimensions |wj|^2

Question 11

Q

what is another name for l2 regularisation

Question 12

Q

what is another name for l2 regularisation

Answer

A

ridge regression

Question 13

Q

give mean squared error

Answer

A

1/N (sum to N (Yi - yi)^2)

Question 14

Q

what is hinge loss

Answer

A

models the classification error

Question 15

Q

give hinge loss

Answer

A

sum to N( max(0, 1- Yi*yi))

Question 16

Q

give a regularised hinge loss

Answer

Study These Flashcards

A

C sum to N( max(0, 1- Yi*yi)) + 1/2 wTw

Question 17

Q

what is cross entropy loss

Answer

Study These Flashcards

A

measures the distance between two probability distributions

Question 18

Q

give cross entropy loss

Answer

Study These Flashcards

A

H(p,q) = - sum of possible values P(x) log (q(x))

Question 19

Q

give likelihood

Answer

Study These Flashcards

A

likelihood(parameters | perceived data) = P(perceived data | parameters)

Question 20

Q

what is log likelihood

Answer

Study These Flashcards

A

exactly what it says

Question 21

Q

what is MLE

Answer

Study These Flashcards

A

maximum likelihood estimator

max(data | parameters)

Question 22

Q

how do we calculate

likelihood(labels, data | parameters)

Answer

Study These Flashcards

A

Number of training samples (label | output?)

Chapter 5: Loss Functions Flashcards

(22 cards)