algoweb Flashcards

1
Q

struttura web, motore di ricerca e idea crawling

A

papillon, tre fasi motore di ricerca, crawler come visita grafo, bontà seed, cicli

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

gestione frontiera offline

A

concetto crivello, frontiera offline, crivello mercator

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

LSTM tree

A

perchè, in cosa funzionano bene, operazioni e miglioramenti

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

filtri bloom

A

idea, operazioni, dimostrazione FPR, miglioramenti

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

politeness e quasi duplicati

A

sim hash, politness relativa e assoluta, robot.txt, gestione quai duplicati

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

concorrenza web crawler

A

idea distribuzione per fetching, lock ipotesi, algoritmo per coda con test and set

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

distribuzione carico

A

possibilità per dividere gli url fra gli host, utilizzo di sistemi esterni (paxos), utilizzo di funzioni locali (carattersitiche funzioni), modulo, permutazioni, min hash e hash coerente

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

architettura web crawler

A

immagine architettura, tutti gli elementi e i possibili filtri

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

codici (intro)

A

cos’è un codice, cos’è un codice istantaneo e cosè un istantaneo completo, unario e disuguaglianza craft mcMillan

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

codifica binaria ridotta, conversione codice -> istantaneo, codice istantaneo e probabilità

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

codice universale,pfor-delta,compressione aritmetica, compressione numerica asimmetrica

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

codice binario minimale

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

rappresentazione documento (indexing), struttura dati per effettuare indexing, merge multi via

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

hash minimali perfetti e come utilizzarli per creare un ordinamento lessicografico,Firma per verificare elemento in ordinamento, hash minimale perfetto per verificare appartenenza di un elemento ad un insieme

A

codici per salvare e strategie per salvare in memoria, lettura codice

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

salvare dati indicizzazione, inversione matrice, hash minimali perfetti e come utilizzarli per creare un ordinamento lessicografico,Firma per verificare elemento in ordinamento, hash minimale perfetto per verificare appartenenza di un elemento ad un insieme

A

codici per salvare e strategie per salvare in memoria, lettura codice

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

stemming, motore ricerca binario, query or e query and (modo migliore per utilizzare skip-to)

17
Q

idea iteratori per motore query, operatori not, frasali, finestra, skip to

A

dello skip to parlo dell’implementazione sui vari operatori

18
Q

betwennes, calcolo metriche ranking esogenti e intro ranking spettrali

A

idea dietro, prodotto matrici, A^t

19
Q

autovettori e autovalori (cosa sono), correlazione autovettore dominante-> ranking spettrale, indice di ceedy

20
Q

pagerank, da ceedy a matrice, catene markov

21
Q

dimostrazione pagerank,indice di kats, hyperbal, computazione su matrici del web

22
Q

funzionamento hyperlog counter e broadboard

23
Q

metriche per valutare il ranking, costruzione groundTruth

24
Q

information theoretical lower bound, strutture succinte, alberi binari, rango e selezione

25
elias fano (costruzione, spazio, ranking e selezione), come usarlo per rappresentare le liste di affissioni e come effettuare le operazioni in maniera ottimale dal punto di vista ingegneristico
26
compressione grafo
metodo "naive", utilizzo di bitmap, utilizzo di block e copy block, utilizzo di range
27
riduzione di dimensionalità
solo idea
28
product quantization
scopo, tecnica per velocizzare il prodotto, tecnica per limitare lo spazio di ricerca
29
leggere codice efficente, memorizzare indici, inversione di matrice