Test Flashcards

1
Q

Co poskytují Stock servery

A

zpoplatněná anotovaná multimédia

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Co je explicitní graf v kontextu brouzdání (browsing) v multimédiích?

A

hiearchie multimediálních kategorií, modelovaná explicitně

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

V kontextu vyhledávání v multimediálních databázích termínem Benchmarking označujeme

A

platformu vyhodnocování kvality vyhledávacího systému vzhledem k nějaké anotované „golden-standard“ kolekci

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Přesnost (precision) a úplnost (recall) vyhledávání se reálně chovají tak, že

A

když roste přesnost, klesá úplnost, a naopak

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Podobnostní vyhledávání (vyhledávání podle podobnosti; similarity search) je

A

vyhledávací model založený na univerzu deskriptorů multimediálních objektů a funkcí ohodnocující podobnost libovolných dvou deskriptorů z univerza

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Funkce podobnosti je

A

libovolná funkce vracející pro dva deskriptory z univerze podobnostní skóre

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Nemetrické vzdálenosti, narozdíl od metrických

A

dovolují modelovat robustnější podobnosti

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Dynamic time warping distance (DTW) se používá pro měření podobnosti na

A

časových řadách

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Earth mover’s distance (EMD) je vhodná pro modelování podobnosti na histogramech, když

A

nestačí pouhá korelace dimenzí (sloupců), ale řeší se „nejmenší přesun ‘masy’ mezi histogramy“

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

SIFT je

A

detektor a deskriptor lokálních vlastností v obrázcích

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Matice pro výpočet QFD (quadratic form distance) pro histogramy barev obsahuje

A

korelace mezi reprezentanty barev vyskytujícími se v obrázcích

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Noty u podobnostního skóre monofóní melodie (monophonie melody) jsou modelovány

A

v 2D prostoru pomocí výšky a pozice v čase a navíc používá váhy

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Termín „query-by-humming“ při vyhledávání např. hudební skladby znamená

A

že jako dotaz je použito audio zapískané/zazpívané uživatelem

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

M-strom je

A

inspirován R-stromem, využívá hiearchické hnízdění metrických regionů a je vyvážený

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

T-chyba (T-error) vyžaduje

A

proporce trojic v datové sadě porušujících trojúhelníkovou nerovnost

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Metrické přístupové metody (metric access methods) jsou

A

datové struktury a algoritmy umožňující rychlé vyhledávání v metrickém modelu podobnostního vyhledávání

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Vysoká vnitřní dimenze (intrinsic dimensionality) značí, že

A

data netvoří shluky (clustery) a tedy jsou špatně strukturovaná

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Mezi metrické přístupové metody (metric access methods) patří

A
  • D-index
  • mvp-tree
  • LAESA
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Mezi axiomy metriky (metric postulates) patří

A
  • symetrie (symmetry)
  • reflexivita (reflexivity)
  • trojúhelníková nerovnost (triengle inequality)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Globální pivoti jsou

A

statické objekty (platné po celý život indexu)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Úplnost vyhledávání (retrieval recall) označuje

A

pravděpodobnost, že objekt relevantní k dotazu je v jeho výsledku

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Co je virtuální/implicitní graf v kontextu brouzdání (browsing) v multimédiích?

A

série dotazů v multimediálním prostoru tvořící cestu virtuálním grafem

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Booleovský model vyhledávání je založen na:

A

reprezentaci obsahu dokumentů množinou termů a na dotazování boolovskými výrazy a termy

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Výpočet Earth mover’s distance (EMD) má časovou složitost

A

2^n

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Vektorový model vyhledávání je založen na

A

reprezentaci obsahu dokumentů a dotazů vektory, a vektorové míře sloužící jako podobnost

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Editační vzdálenost (edit distance) slouží k měření podobností

A

řetězů, kde spočítá nejmenší počet operací nutných ke konverzi jednoho řetězce do druhého

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Pro vektorový model dotazování platí, že

A
  • obsahuje váhy jednotlivých termů dotazu
  • uživatel může zadat váhy všech termů v dotazu shodně
  • výsledek je založen na frakvenci výskytu termů v dokumentu a dotazu
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Vážení podle tf-idf schématu

A

je populární technika konstrukce vah termů ve vektorovém modelu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Podobnostní přístup pro symbolicky reprezentované polyfonní melodie je aplikovatelný na

A

pouze MIDI soubory

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Standard MPEG7 popisuje

A

definice deskriptorů bez popisu algoritmů jejich extrakce

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

TV-modifikátor (TV-modifier) je

A

striktně konvexní SP modifikátor, což zajišťuje vyšší hodnotu T-chyby (T-error)

32
Q

Termín Retrieval Efficiancy znamená

A

efektivita vyhledávače ve smyslu rychlosti vyhledávání

33
Q

Lower-bounding je

A

obecný mechanismus pro efektivní podobnostní vyhledávání

34
Q

Podobnost zachovávající modifikátor (similarity preserving modifier) je

A

rostoucí funkce f pro kterou f(0) = 0

35
Q

Přesnost (precision) a úplnost (recall) vyhledávání se reálně chovají tak, že

A

když roste přesnost, klesá úplnost, a naopak

36
Q

Podobnostní vyhledávání (vyhledávání podle podobnosti; similarity search) je

A

vyhledávací model založený na univerzu deskriptorů multimediálních objektů a funkcí ohodnocující podobnost libovolných dvou deskriptorů z univerza

37
Q

Funkce podobnosti je

A

libovolná funkce vracející pro dva deskriptory z univerze podobnostní skóre

38
Q

Nemetrické vzdálenosti, narozdíl od metrických

A

dovolují modelovat robustnější podobnosti

39
Q

Dynamic time warping distance (DTW) se používá pro měření podobnosti na

A

časových řadách

40
Q

Earth mover’s distance (EMD) je vhodná pro modelování podobnosti na histogramech, když

A

nestačí pouhá korelace dimenzí (sloupců), ale řeší se „nejmenší přesun ‘masy’ mezi histogramy“

41
Q

Matice pro výpočet QFD (quadratic form distance) pro histogramy barev obsahuje

A

korelace mezi reprezentanty barev vyskytujícími se v obrázcích

42
Q

Metrické přístupové metody (metric access methods) jsou

A

datové struktury a algoritmy umožňující rychlé vyhledávání v metrickém modelu podobnostního vyhledávání

43
Q

Globální pivoti jsou

A

statické objekty (platné po celý život indexu)

44
Q

Pro vektorový model dotazování platí, že

A
  • obsahuje váhy jednotlivých termů dotazu
  • uživatel může zadat váhy všech termů v dotazu shodně
  • výsledek je založen na frakvenci výskytu termů v dokumentu a dotazu
45
Q

TG-modifikátor

A

striktně konkávní SP modifikátor, což zajišťuje nízkou hodnotu T-chyby (T-error)

46
Q

false hit

A

dokument, který není relevantní k dotazu, ale byl vybrán

47
Q

proces vyhledáváni na webu se typicky skládá z fází

A
  • stahování stránek (crawling),
  • indexování stránek (indexing),
  • vyhledávání (searching)
48
Q

fulltextový index slouží

A

k urychlení vyhledávání na základě booleovského nebo vektorového dotazu

49
Q

invertovaný index je

A

reprezentován term-by-document maticí, udržující pro každý term množinu dokumentů, kde se term vyskytuje

50
Q

SVD

A

dekompozice na singulární čísla matice

51
Q

vektorový model využívá v typickém případě jako vzdálenostní funkci

A

kosinovou podobnost

52
Q

základem Google matice je

A

matice sousednosti stránek

53
Q

Hub je

A

stránka s mnoha outlinky

54
Q

Autorita je

A

stránka s mnoha inlinky

55
Q

ontologií v kontextu sémantického webu se rozumí

A

formální specifikace znalostí v konkrétní doméně a vztahů mezi znalostmi

56
Q

SPARQL

A

dotazovací jazyk na RDF modelem

57
Q

SIFT a SURF jsou metody pro

A

extrakci deskriptorů z obrázků

58
Q

korelovaná data vedou u skyline operátoru k

A

malé skyline

59
Q

mezi Minkowského vzdálenosti nepatří

A

kosinová podobnost

60
Q

GNAT

A

n-ární strom využívající dělení prostoru (zobecněnými) nadrovinami

61
Q

metrický model podobnostního vyhledávání je založen na

A

univerzu (množině) deskriptorů a metrické vzdálenosti sloužící jako podobnost na deskriptorech

62
Q

metoda FastMap

A

je metoda pro mapování obecných metrických dat do euklidovského prostoru

63
Q

kNN algoritmus v M-stromu je založen na heuristice používající

A

prioritní frontu a pole kandidátů na nejbližší sousedy

64
Q

Distance distribution histogram nám umožňuje

A

stanovit, zda-li máme data vhodná pro indexování pomocí (metrických) indexů

65
Q

PAC jsou

A

pravděpodobně přibližně korektní dotazy

66
Q

aproximativní vyhledávání je výhodné, když

A

chceme výrazně rychlejší vyhledávání za cenu malého snížení přesnosti vyhledávání

67
Q

Co je metavyhledávač

A

Vyhledávač, který pouze agreguje výsledky z jiných vyhledávačů

68
Q

Čím se odlišuje Web 2.0 od původního konceptu webu

A

Orientací na uživatelem generovaný obsah a sociální sítě

69
Q

Nevýhody Booleovského modelu jsou

A

Neuspořádanost výsledku dotazu

70
Q

Mezi nevýhody LSI patří

A
  • drahé zpracování matice
  • hustá matice
  • těžká vyjádřitelnost konceptů
71
Q

Paramentr \alfa v Google matici vyjadřuje

A

Pravděpodobnost skoku na stránku, na kterou vedou odkazy ze stávající stránky (= Damping factor)

72
Q

Podobnostní operátor narozdíl od dotazu

A

není často parametrizovaný a vrací velkou odpověď

73
Q

operátor pojmy existují

A
  • skyline operátor
  • top-k operátor
  • podobnostní spojení
74
Q

kNN dotaz (range query)

A

je vhodný pro dotazování nad objekty u kterách uživatel nezná sémantiku extrahovaných vektorů a sémantiku podobnostní funkce

75
Q

AESA

A

tabulka vzdáleností mezi všemi dvojicemi objektů v databázi

76
Q

Nevýhoda měření výkonu metrického indexu reálným časem je

A

závislost na platformě, optimalizaci, operačním systému a hardware