Mere interesantnosti pravila Flashcards
Sta je mera interesantnosti i cemu sluzi
Често се добиjа jако велики броj правила придруживања.
Велики броj правила из формираног скупа често ниjе користан за даље истраживање/анализу,може да доведе до тога да се превиди неко од потенциjално интересантних правила,потребно jе дефинисати мере коjе ће бити коришћене у процесу
елиминациjе неинтересантних правила
Tabela kontigenata
За илустрациjу мера се обично користи скуп коjи садржи учесталост
поjављивања ставки представљен у облику табеле контингената.
A - присутно у трансакциjи
A - ниjе присутно у трансакциjи
fij - броjач учесталости
Lift
Jедна од мера коjа коригуjе недостатак поузданости и коjа узима у
обзир и подршку десног дела правила A −→ B) jе Лифт.
Lift(A, B) = I (A, B) =conf (A −→ B)/sup(B)
Лифт вредности веће од 1 означаваjу да jе последична (десна)
страна правила много чешћа у трансакциjама коjе садрже леву
(узрочну) страну правила него у трансакциjама коjе jе не садрже, док
вредност мања од 1 означаваjу правила чиjа jе позданост мања од
очекиване.
Piatetsky-Shapiro мера
1.правило коjе има мању подршку и већи Лифт може у неким
случаjевима да буде мање интересантно од правила коjе има већу
подршку и мањи Лифт пошто jе такво правило применљиво на већи
део материjала
2.у случаjу потрошачке корпе на већи броj потрошача коjи купуjу неке
артикле добит од куповине неког артикла од стране већег броjа
потрошача би у том случаjу била задовољаваjућа
Мера коjа спаjа величину и jачину ефекта правила придруживања jе
Piatetsky-Shapiro. У литератури се ова мера jош назива и мера полуге (енг.
leverage) или моћ правила
PS = s(A, B) − s(A) × s(B)
PS(A, B) = 0 −→ A и B су међусобно независни
PS(A, B) > 0 −→ A и B су позитивно корелисани
PS(A, B) < 0 −→ A и B су негативно корелисани
Коефициjент корелациjе
За бинарне променљиве, Пирсонов коефициjент корелациjе може да
се мери користећи ρ коефициjент
ρ = f11 · f00 − f01 · f10 /sqrt(f1+ · f+1 · f0+ · f+0)
ИС мера
ИС мера jе алтернативна мера коjа може да се примени у случаjу
асиметричних бинарних променљивих. Укључуjе однос између
sup(A, B) и sup(A) и sup(B):
IS(A, B) =sqrt (I (A, B) × sup(A, B) )
-ИС расте када расту И (однос камате) и подршка
-Ако два обрасца имаjу исти однос камате ИС даjе предност
ономе са већом подршком
-ИС jе еквиваленетан косинусноj мери за бинарне променљиве
Simpsonov paradoks
Skrivene promenljive koje ne ucestuju u analizi mogu da uticu na rezultat pri. u celom skupu pravila ima pouzdanost >50%, ali kada se skup podeli na neke grupe/kategorije unutar svake od tih grupa nema cenf > 50%
bez obzira na meru stavke su pozitivno povezane kada su podaci kombinovani,
negativno povezane kada su podaci stratifikovani