9. predavanje: Uvod u nendazirano strojno učenje Flashcards

1
Q

Koji je zadatak kod nenadziranog strojnog učenja?

A

Dani su podatci X (bez oznaka y) te je potrebno oblikovati funkciju y=f(x) takvu da je jednostavnija reprezemtacija podataka.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Definirati problem grupiranja.

A

Zadan je skup točaka, zajedno s pojmom udaljenosti između njih potrebno je grupirati točke u neki broj grupa tako da:

a) članovi iste grupe su blizu jedan drugom
b) članovi različitih grupa su daleko jedan od
drugoga

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Nabrojiti svojstva metoda grupiranja.

A
  • Kvantitativne
  • Kvalitativne
  • Robusnost
  • Korisnička interkacija
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Navesti vrste grupiranja.

A
  • Hijerarhijsko: grupe stablaste hijerarhijske
    strukture
  • Ravno: nema strukture između grupa
  • Čvrsto: svaki objekt pripada samo jednoj grupi
  • Meko: pripadnost grupi modelira se pomoću
    teorije vjerojatnosti ili neizrazitom logikom
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Navesti problem koji se pojavljuje zbog prokletstva dimenizionalnosti.

A

Gotovo svi parovi točaka su otprilike jednako udaljeni.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Objasniti ideju iza korištenja Pearsonove koerlacijske udaljenosti za dva vektora.

A

Dva objekta su slična ako su njihove značajke korelirane (iako mogu biti daleko u smislu euklidske metrike).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Kakve vrste hijerarhijskog grupiranja postoje i što je rezultat hijerarhijskog grupiranja?

A
  • Aglomerativno (bottom up)
  • Divizivno (Top down)

Rezultat hijerarhijskog grupiranja je dendrogram.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Navesti pristupi prilikom definiranja bliskosti grupa.

A
  • međugrupna udaljenost: minimum, maskimum,
    prosjek udaljenosti svih točaka u grupi
  • pojam kohezije (povezanosti unutar grupe)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Navesti vrste povezivanja grupa.

A

a) maksimum (complete linkage)
b) minimum (single linkage)
c) srednja vrijednost (average linkage)
d) centroid (linkage)
e) Wardova metoda (min variance method)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Koju informaciju je moguće dobiti iz konstruiranog dendrograma?

A

Dendrogram u potpunosti omogućuje rekonstrukciju slijeda grupiranja.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Navesti algoritme grupiranja temeljene na pridruživanju točaka.

A

Algoritam k-srednjih vrijednosti, K-means++, DBSCAN.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Objasniti princip rada algoritma k-srednjih vrijednosti.

A

Clij je pridružiti svaku točku jednoj od k grupa tako da je udaljenost točaka od centroida minimalna.

  1. nađi najbliži centroid grupe za svaki element i
    pridruži element toj grupi
  2. ponovno izračunaj nove centroide
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Navesti niz koraka algoritma k-srednjih vrijednosti.

A
  1. izaberi broj grupa k
  2. inicijaliziraj k centara klastera (random)
  3. svaki od n primjera priduži najbližem
    centroidu
  4. ponovno izračunaj cnetroide klastera na
    temelju primjera za svaku grupu
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Navesti nedostatke algoritma k-srednjih vrijednosti.

A

Obično završava u lokalnom optimumu, potrebno je odrediti broj k (broj grupa) unaprijed, ne ponaša se dobro na podacima sa šumom i stršećim vrijednostima, grupa imaju samo konveksne oblike.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly