Dodatne metode klasifikacije Flashcards

1
Q

Прецизност и одзив правила

A

Одзив правила: проценат броjа слогова коjи
задовољаваjу леву страну правила

Прецизност правила: проценат броjа слогова коjи
задовољаваjу десну страну правила од слогова коjи
задовољаваjу леву страну правила

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Ogranicenja pravila skupa

A

Uzajamno iskljuciva pravila:
-ne postoje 2 pravila koja pokrivaju istu instancu
-svaki slog je pokriven najvise jednim pravilom
Pravila pokrivaju sve mogucnosti:
-svaki slog je pokriven sa bar 1 pravilom

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Problemi i resenja klasifikacije zasnovane na pravilima

A

1.Pravila nisu uzajamno iskljuciva
2.Neke slogove moze da pokriva vise pravila–>skup pravila uredjen po redosledu,
neuredjen skup pravila(glasacki sistem)
3.Pravila ne moraju da pokrivaju sve mogucnosti –>moze se desiti nepokriven slog niti jednim pravilom, koristi se predefinisana klasa

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

C4.5 algoritam

A

formira pravila na osnovu drveta odlucivanja formiranog c4.5 algoritmom ,predstavlja indirektnu metodu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Direktna metoda(1R,CN2,RIPPER)

A

1.1R(one rule)
Za svaki atribut u skupu podataka formira se jedno pravilo ,a zatim bira pravilo sa najvecom preciznoscu.
Nepoznate vrednosti tretira kao izdvojene vrednosti u skupu vrednosti atributa

2.CN2
formira uredjen skup pravila,prema kvalitetu.Koristi sekvencijalno pakovanje i odredjuje naredno pravilo bez fiksiranja klase unapred
Posledica = pravila za razlicite klase su pomesana

3.RIPPER
Koristi sekvencijalno pakovanje,formira uredjen skup pravila,unapred se fiksira klasa i odrede sva pravila za tu klasu .Na narednu klasu se prelazi tek kada se kompletira prethodna klasa .Redosled pravila unutar grupe koja odredjuje jednu klasu nije bitan,bok je redosled pravila u uredjenoj listi direktan velicinom klase odnosno redosledom odredjivanja pravila

Osobine sekvencijalnog pakovanja(CN2,RIPPER)
porast skupa pravila,uklanjanje odredjenih instanci,provera pravila,kriterijum zaustavljnja ,potkresivanje pravila

CN2 algoritam:
1.{}
2.dodaj konjukte koji minimizuju entropiju:
3.odredi redosled pravila uzimajuci u najbolje klase instance koje pokrivaju pravilo

RIPPER
1.pocni od {}
2.Dodaj konjukte koji maksimizuju FOIL-ovu meru dobiti kvalitet informacije

uklanjanje instanci:
bez eliminacije instanci naredno pravilo bi bilo identicno prethodnom pravilu
Eliminacijom pozitivnih insanci obezbedjuje se da se sledece pravilo razlicito od postojecih
Eliminacijom negativnih instanci omoguceno je smanjene preciznosti pravila

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Kriterijumi zaustavljanja i potkresivanje pravila

A

Izracunavanje dobiti, ako dobit nije znacajna odbaci pravilo

Potkresivanje pravila:
Slicno potkresivanju drveta odlucivanja ,smanjivanje gresake potkresivanjem

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Prednosti klasifikatora zasnovanih na pravilima

A

Imaju istu moc kao i drveta odlucivanja,jednostavna interpretacija,jednostavno formiranje , mogu brzo da klasifikuju nove instance,uporedive sa drvetima odlucivanja

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Klasifikatori zasnovani na instancama

A

Ne postoji model,lenji klasifikatori..
Osnovna ideja:
Potrebno -skup sacuvanih slogova,metrika za racunanje ,vrednost k koja predstavlja broj najblizih suseda

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Izbor vrednosti k

A

Ako je k jako malo klasifikacije je osetljiva na sum
Ako je k veliko susedi mogu da ukljuce tacke iz drugih klasa

How well did you know this?
1
Not at all
2
3
4
5
Perfectly