algoweb Flashcards

1
Q

struttura web, motore di ricerca e idea crawling

A

papillon, tre fasi motore di ricerca, crawler come visita grafo, bontà seed, cicli

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

gestione frontiera offline

A

concetto crivello, frontiera offline, crivello mercator

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

LSTM tree

A

perchè, in cosa funzionano bene, operazioni e miglioramenti

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

filtri bloom

A

idea, operazioni, dimostrazione FPR, miglioramenti

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

politeness e quasi duplicati

A

sim hash, politness relativa e assoluta, robot.txt, gestione quai duplicati

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

concorrenza web crawler

A

idea distribuzione per fetching, lock ipotesi, algoritmo per coda con test and set

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

distribuzione carico

A

possibilità per dividere gli url fra gli host, utilizzo di sistemi esterni (paxos), utilizzo di funzioni locali (carattersitiche funzioni), modulo, permutazioni, min hash e hash coerente

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

architettura web crawler

A

immagine architettura, tutti gli elementi e i possibili filtri

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

codici (intro)

A

cos’è un codice, cos’è un codice istantaneo e cosè un istantaneo completo, unario e disuguaglianza craft mcMillan

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

codifica binaria ridotta, conversione codice -> istantaneo, codice istantaneo e probabilità

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

codice universale,pfor-delta,compressione aritmetica, compressione numerica asimmetrica

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

codice binario minimale

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

rappresentazione documento (indexing), struttura dati per effettuare indexing, merge multi via

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

hash minimali perfetti e come utilizzarli per creare un ordinamento lessicografico,Firma per verificare elemento in ordinamento, hash minimale perfetto per verificare appartenenza di un elemento ad un insieme

A

codici per salvare e strategie per salvare in memoria, lettura codice

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

salvare dati indicizzazione, inversione matrice, hash minimali perfetti e come utilizzarli per creare un ordinamento lessicografico,Firma per verificare elemento in ordinamento, hash minimale perfetto per verificare appartenenza di un elemento ad un insieme

A

codici per salvare e strategie per salvare in memoria, lettura codice

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

stemming, motore ricerca binario, query or e query and (modo migliore per utilizzare skip-to)

A
17
Q

idea iteratori per motore query, operatori not, frasali, finestra, skip to

A

dello skip to parlo dell’implementazione sui vari operatori

18
Q

betwennes, calcolo metriche ranking esogenti e intro ranking spettrali

A

idea dietro, prodotto matrici, A^t

19
Q

autovettori e autovalori (cosa sono), correlazione autovettore dominante-> ranking spettrale, indice di ceedy

A
20
Q

pagerank, da ceedy a matrice, catene markov

A
21
Q

dimostrazione pagerank,indice di kats, hyperbal, computazione su matrici del web

A
22
Q

funzionamento hyperlog counter e broadboard

A
23
Q

metriche per valutare il ranking, costruzione groundTruth

A
24
Q

information theoretical lower bound, strutture succinte, alberi binari, rango e selezione

A
25
Q

elias fano (costruzione, spazio, ranking e selezione), come usarlo per rappresentare le liste di affissioni e come effettuare le operazioni in maniera ottimale dal punto di vista ingegneristico

A
26
Q

compressione grafo

A

metodo “naive”, utilizzo di bitmap, utilizzo di block e copy block, utilizzo di range

27
Q

riduzione di dimensionalità

A

solo idea

28
Q

product quantization

A

scopo, tecnica per velocizzare il prodotto, tecnica per limitare lo spazio di ricerca

29
Q

leggere codice efficente, memorizzare indici, inversione di matrice

A