Test Flashcards

1
Q

Co poskytují Stock servery

A

zpoplatněná anotovaná multimédia

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Co je explicitní graf v kontextu brouzdání (browsing) v multimédiích?

A

hiearchie multimediálních kategorií, modelovaná explicitně

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

V kontextu vyhledávání v multimediálních databázích termínem Benchmarking označujeme

A

platformu vyhodnocování kvality vyhledávacího systému vzhledem k nějaké anotované „golden-standard“ kolekci

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Přesnost (precision) a úplnost (recall) vyhledávání se reálně chovají tak, že

A

když roste přesnost, klesá úplnost, a naopak

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Podobnostní vyhledávání (vyhledávání podle podobnosti; similarity search) je

A

vyhledávací model založený na univerzu deskriptorů multimediálních objektů a funkcí ohodnocující podobnost libovolných dvou deskriptorů z univerza

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Funkce podobnosti je

A

libovolná funkce vracející pro dva deskriptory z univerze podobnostní skóre

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Nemetrické vzdálenosti, narozdíl od metrických

A

dovolují modelovat robustnější podobnosti

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Dynamic time warping distance (DTW) se používá pro měření podobnosti na

A

časových řadách

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Earth mover’s distance (EMD) je vhodná pro modelování podobnosti na histogramech, když

A

nestačí pouhá korelace dimenzí (sloupců), ale řeší se „nejmenší přesun ‘masy’ mezi histogramy“

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

SIFT je

A

detektor a deskriptor lokálních vlastností v obrázcích

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Matice pro výpočet QFD (quadratic form distance) pro histogramy barev obsahuje

A

korelace mezi reprezentanty barev vyskytujícími se v obrázcích

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Noty u podobnostního skóre monofóní melodie (monophonie melody) jsou modelovány

A

v 2D prostoru pomocí výšky a pozice v čase a navíc používá váhy

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Termín „query-by-humming“ při vyhledávání např. hudební skladby znamená

A

že jako dotaz je použito audio zapískané/zazpívané uživatelem

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

M-strom je

A

inspirován R-stromem, využívá hiearchické hnízdění metrických regionů a je vyvážený

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

T-chyba (T-error) vyžaduje

A

proporce trojic v datové sadě porušujících trojúhelníkovou nerovnost

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Metrické přístupové metody (metric access methods) jsou

A

datové struktury a algoritmy umožňující rychlé vyhledávání v metrickém modelu podobnostního vyhledávání

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Vysoká vnitřní dimenze (intrinsic dimensionality) značí, že

A

data netvoří shluky (clustery) a tedy jsou špatně strukturovaná

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Mezi metrické přístupové metody (metric access methods) patří

A
  • D-index
  • mvp-tree
  • LAESA
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Mezi axiomy metriky (metric postulates) patří

A
  • symetrie (symmetry)
  • reflexivita (reflexivity)
  • trojúhelníková nerovnost (triengle inequality)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Globální pivoti jsou

A

statické objekty (platné po celý život indexu)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Úplnost vyhledávání (retrieval recall) označuje

A

pravděpodobnost, že objekt relevantní k dotazu je v jeho výsledku

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Co je virtuální/implicitní graf v kontextu brouzdání (browsing) v multimédiích?

A

série dotazů v multimediálním prostoru tvořící cestu virtuálním grafem

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Booleovský model vyhledávání je založen na:

A

reprezentaci obsahu dokumentů množinou termů a na dotazování boolovskými výrazy a termy

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Výpočet Earth mover’s distance (EMD) má časovou složitost

A

2^n

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Vektorový model vyhledávání je založen na
reprezentaci obsahu dokumentů a dotazů vektory, a vektorové míře sloužící jako podobnost
26
Editační vzdálenost (edit distance) slouží k měření podobností
řetězů, kde spočítá nejmenší počet operací nutných ke konverzi jednoho řetězce do druhého
27
Pro vektorový model dotazování platí, že
- obsahuje váhy jednotlivých termů dotazu - uživatel může zadat váhy všech termů v dotazu shodně - výsledek je založen na frakvenci výskytu termů v dokumentu a dotazu
28
Vážení podle tf-idf schématu
je populární technika konstrukce vah termů ve vektorovém modelu
29
Podobnostní přístup pro symbolicky reprezentované polyfonní melodie je aplikovatelný na
pouze MIDI soubory
30
Standard MPEG7 popisuje
definice deskriptorů bez popisu algoritmů jejich extrakce
31
TV-modifikátor (TV-modifier) je
striktně konvexní SP modifikátor, což zajišťuje vyšší hodnotu T-chyby (T-error)
32
Termín Retrieval Efficiancy znamená
efektivita vyhledávače ve smyslu rychlosti vyhledávání
33
Lower-bounding je
obecný mechanismus pro efektivní podobnostní vyhledávání
34
Podobnost zachovávající modifikátor (similarity preserving modifier) je
rostoucí funkce f pro kterou f(0) = 0
35
Přesnost (precision) a úplnost (recall) vyhledávání se reálně chovají tak, že
když roste přesnost, klesá úplnost, a naopak
36
Podobnostní vyhledávání (vyhledávání podle podobnosti; similarity search) je
vyhledávací model založený na univerzu deskriptorů multimediálních objektů a funkcí ohodnocující podobnost libovolných dvou deskriptorů z univerza
37
Funkce podobnosti je
libovolná funkce vracející pro dva deskriptory z univerze podobnostní skóre
38
Nemetrické vzdálenosti, narozdíl od metrických
dovolují modelovat robustnější podobnosti
39
Dynamic time warping distance (DTW) se používá pro měření podobnosti na
časových řadách
40
Earth mover's distance (EMD) je vhodná pro modelování podobnosti na histogramech, když
nestačí pouhá korelace dimenzí (sloupců), ale řeší se „nejmenší přesun 'masy' mezi histogramy“
41
Matice pro výpočet QFD (quadratic form distance) pro histogramy barev obsahuje
korelace mezi reprezentanty barev vyskytujícími se v obrázcích
42
Metrické přístupové metody (metric access methods) jsou
datové struktury a algoritmy umožňující rychlé vyhledávání v metrickém modelu podobnostního vyhledávání
43
Globální pivoti jsou
statické objekty (platné po celý život indexu)
44
Pro vektorový model dotazování platí, že
- obsahuje váhy jednotlivých termů dotazu - uživatel může zadat váhy všech termů v dotazu shodně - výsledek je založen na frakvenci výskytu termů v dokumentu a dotazu
45
TG-modifikátor
striktně konkávní SP modifikátor, což zajišťuje nízkou hodnotu T-chyby (T-error)
46
false hit
dokument, který není relevantní k dotazu, ale byl vybrán
47
proces vyhledáváni na webu se typicky skládá z fází
- stahování stránek (crawling), - indexování stránek (indexing), - vyhledávání (searching)
48
fulltextový index slouží
k urychlení vyhledávání na základě booleovského nebo vektorového dotazu
49
invertovaný index je
reprezentován term-by-document maticí, udržující pro každý term množinu dokumentů, kde se term vyskytuje
50
SVD
dekompozice na singulární čísla matice
51
vektorový model využívá v typickém případě jako vzdálenostní funkci
kosinovou podobnost
52
základem Google matice je
matice sousednosti stránek
53
Hub je
stránka s mnoha outlinky
54
Autorita je
stránka s mnoha inlinky
55
ontologií v kontextu sémantického webu se rozumí
formální specifikace znalostí v konkrétní doméně a vztahů mezi znalostmi
56
SPARQL
dotazovací jazyk na RDF modelem
57
SIFT a SURF jsou metody pro
extrakci deskriptorů z obrázků
58
korelovaná data vedou u skyline operátoru k
malé skyline
59
mezi Minkowského vzdálenosti nepatří
kosinová podobnost
60
GNAT
n-ární strom využívající dělení prostoru (zobecněnými) nadrovinami
61
metrický model podobnostního vyhledávání je založen na
univerzu (množině) deskriptorů a metrické vzdálenosti sloužící jako podobnost na deskriptorech
62
metoda FastMap
je metoda pro mapování obecných metrických dat do euklidovského prostoru
63
kNN algoritmus v M-stromu je založen na heuristice používající
prioritní frontu a pole kandidátů na nejbližší sousedy
64
Distance distribution histogram nám umožňuje
stanovit, zda-li máme data vhodná pro indexování pomocí (metrických) indexů
65
PAC jsou
pravděpodobně přibližně korektní dotazy
66
aproximativní vyhledávání je výhodné, když
chceme výrazně rychlejší vyhledávání za cenu malého snížení přesnosti vyhledávání
67
Co je metavyhledávač
Vyhledávač, který pouze agreguje výsledky z jiných vyhledávačů
68
Čím se odlišuje Web 2.0 od původního konceptu webu
Orientací na uživatelem generovaný obsah a sociální sítě
69
Nevýhody Booleovského modelu jsou
Neuspořádanost výsledku dotazu
70
Mezi nevýhody LSI patří
- drahé zpracování matice - hustá matice - těžká vyjádřitelnost konceptů
71
Paramentr \alfa v Google matici vyjadřuje
Pravděpodobnost skoku na stránku, na kterou vedou odkazy ze stávající stránky (= Damping factor)
72
Podobnostní operátor narozdíl od dotazu
není často parametrizovaný a vrací velkou odpověď
73
operátor pojmy existují
- skyline operátor - top-k operátor - podobnostní spojení
74
kNN dotaz (range query)
je vhodný pro dotazování nad objekty u kterách uživatel nezná sémantiku extrahovaných vektorů a sémantiku podobnostní funkce
75
AESA
tabulka vzdáleností mezi všemi dvojicemi objektů v databázi
76
Nevýhoda měření výkonu metrického indexu reálným časem je
závislost na platformě, optimalizaci, operačním systému a hardware