Podaci i Karakteristike Flashcards
Асиметрични атрибути
Jедино се присуство не-нула вредности сматра
значаjним
Бинарни атрибути код коjих су битне не-нула
вредности се зову асиметрични бинарни атрибути
Типови атрибута према операциjама
Категорички атрибути: именски и редни
Непрекидни атрибути: интервални и размерни
Мултидимензионални Подаци и карактеристике
подаци
Наjедноставниjи облик независних података
Састоjе се од слогова (инстанци, трансакциjа,
ентитета, торки, обjекта, вектора-особина,…)
Слог се састоjи од поља (атрибути,
димензиjе, …)
tablica za multidimenz. skup i definicija
sparse matrix
Дискретне секвенце и ниске
Могу да се посматраjу као категорички
еквивалент временских сериjа
Контекстуални атрибут jе временска тачка
или позициjа у уређењу
Атрибут коjи
одређуjе понашање
jе категоричког
типа
Дискретна секвенца дужине n и
димензиjе d садржи d особина са дискретним вредностима
за сваку од n различитих временских тачака t1 , t2 , …tn .
Свака од n компоненти Yi садржи атрибуте са дискретним
карактеристикама (понашањем) коjи су прикупљени у i-тоj
временскоj тачки.
Наjзначаjниjи градивни блокови у ИП
Подаци
Правила придруживања
Класификациjа
Кластеровање
Анализа и визуелизациjа резултата
Аномалиjе и елементи ван граница
Дефинициjа 6. (Откривање аномалиjа) За дату матрицу
података D одредити редове у матрици коjи су jако
различити од остатка редова
Податак jе елемент ван граница (енг. outlier) ако jе у
значаjноj мери различит од осталих података
medjusobno zavisni i nezavisni podaci,
vremenske serije i prostorne serije?
Grafovski i mrezni podaci
Bukv graf imas, povezani su podaci preko grana, itd.
Podaci vezani za vremenske sesije
Sadrze vrednosti dobijene neprekidnim merenjem kroz vreme, implicitna zavisnost od prethodnih merenja
Kontekstualna zavisnost- zavisnost definisana preko sadrzaja
Zavisnost ponasanja - vrednosti koje su izmerene u odgovarajucem kontekstu
Vremenska sesija duzine n i dimenzije d sadrzi d numerickih karakteristika za svaku od n vremenskih tacaka t1,t2,…tn. Svaka vremenska tacka sadrzi komponentu za svaku od d sesija, tako da su vrednosti dobijene u vremenskom trenutku ti jednake Yt=(y1,y2..yd).