Week 5 Flashcards

Question 1

Q

M

Answer

A

The size of the hypothesis set H

Question 2

Q

What does sample complexity denote?

Answer

A

Denotes how many training examples N are needed to achieve a certain generalization performance.

Question 3

Q

What does the parameter epsilon denote?

Answer

A

the error tolerance, determines the allowed generalization error.

Question 4

Q

What does the parameter delta denote?

Answer

A

the confidence parameter, determines how often the error tolerance (epsilon) is violated.

Question 5

Q

Als dvc eindig is, dan is mH(N)…

Answer

A

mH(N) <_ N^(dvc + 1)

Question 6

Q

Bij een kleine dvc en een grote N is de kans groot dat…

Answer

A

Eout ~~ Ein

Question 7

Q

Kunnen verschillende hypothesen dezelfde dichotomie geven?

Answer

A

Ja, vaak zelfs.

Question 8

Q

Wat denoteert de VC-dimensie dvc?

Answer

A

Het is de grootste N zodat mH(N) = 2^N. Meet de complexiteit van hypotheseruimte H.

Question 9

Q

Wat is de formule voor het kleinste breekpunt van een hypotheseruimte H?

Question 10

Q

Wat is de Bias-variance analyse voor iets?

Answer

A

Een andere manier om naar het effect van model-complexiteit te kijken.

Question 11

Q

g(D)

Answer

A

de hypothese g die het algoritme zou kiezen bij data D.

Question 12

Q

Bias

Answer

A

Het kwadraat van de afstand tussen de gemiddelde hypothese -g- en de target functie f.

Question 13

Q

Waar kun je de groeifunctie en de VC-dimensie voor gebruiken?

Answer

A

Om te laten zien dat bij kleine dvc en grote N, de kans groot is dat E.in ~~ E.out.

Question 14

Q

Waar is de bias-variance analyse vooral goed voor?

Answer

A

Regressie met kwadratische fout.

Question 15

Q

Wat is de manier om E.out(g) op te splitsen in bias-variance analysis?

Answer

A

De afstand tussen f en de gemiddelde g, en de afstand tussen de gemiddelde g en g.

Question 16

Q

Wat is g(D) in bias-variance analysis?

Answer

A

De hypothese die ons algorithme zou kiezen bij dataset D.

Question 17

Q

Geef de formule voor de out-of-sample error bij kwadratische ruis:

Answer

A

E.out ( g(D) ) = E.x ( g(D)*x - f(x) ) ^2

Question 18

Q

Variance

Answer

A

Maat voor de gemiddelde afstand tussen hypothese g en de gemiddelde hypothese.

Question 19

Q

Wat is de bias-variance trade-off bij grotere hypotheseklasse?

Answer

A

Kleinere bias, maar grotere variance.

Question 20

Q

Welke twee eigneschappen tel je op als je wordt gevraagd: welke is beter in termen van kwadratische error?

Answer

A

Error = Bias + variance.

Question 21

Q

What is B(N,k) for k=1?

Question 22

Q

What is B(N,k) for N=1 and k>2?

Question 23

Q

What is a popular rule of thumb for the size of N in order to get a decent generalization?

Answer

A

N = 10 x dvc