SDD Flashcards

Question 1

Q

In cosa consiste la SDD? Quali sono i punti di vista che il cloud provider deve tenere conto?

Cosa ci si aspetta che un data center cloud rispetti?

Answer

A

La SDD nasce dalla necessità di avere un sistema elastico e flessibile, questo è possibile tramite tecniche di virtualizzazione e IaaC.

____
Il cloud provider tiene conto dell’utente: che deve percepire di avere una macchina per sè, la scalabilità deve essere istantanea (per l’utente devono essere disponibili macchine in pochi istanti), garantire la sicurezza(manteniamo la piattaforma sicura), il servizio deve essere affidabile (available tramite rindondanza) e il downtime all’ordine minuti/anno.

Dal punta di vista ingegneristico: L’infrastruttura deve essere gestita a livello hw in particolare termini di consumo energetico, raffreddamento e sicurezza. Con il sw monitoriamo l’utilizzo e consumo, mentre a lato hw raggruppiamo i nodi in rack e a loro volta in pods che presentano tre cavi 1 energia, 1 rete e 1 raffreddamento, possono essere considerati come dei mini data center.
____
Un data center cloud deve rispettare:
- sicurezza
- availability
- scalabilità
- elasticità
- realizzabile
- conveniente
- internet based

Question 2

Q

Come vengono organizzati i data center?

Quali sono i tipi di switch all’interno di un rack?

Quali sono le caratteristiche tecniche tipiche di un data center?

Answer

A

Usano dei blade systems composti da tipicamente 4 blades (unità computazionale vera e propria) inserite all’interno di un chassis che ha sistema di alimentazione, raffreddamento e monitoraggio. Essi sono organizzati in armati chiamati Rack con degli switch per permettere l’interconnessione dei blade systems e con il resto dei data center.
____
top of rack: per connettere gli elementi dello stesso rack
end of row per connessione dei rack nella stessa file
____
Tipicamente i blades hanno storage di piccole dimensioni, NVRAM o SSD di 500gb/1Tb per il caching e far girare l’hypervisor. E poi c’è uno storage vero e proprio sotto forma di SAN che tiene le immagini delle VM.

Question 3

Q

Qual’è la struttura di una rete di un datacenter?

Quali sono i limiti della topografia? come si potrebbe risolvere?

Quale configurazione di rete viene usata per ottenere questi risultati?

Answer

A

Abbiamo una struttura ad albero che parte dal basso con:

Servers: blade systems interconnessi con cavi 1-10Gbps
Edge layer(Access layer): composto da switch on top of rack e end of row, i blade systems sono connessi e s’implementano funzioni di isolamento del traffico e gestione dei guasti
Aggregation layer: interconnette zone separate del data center, implementa QoS per i flussi di dati, e fa traffic shaping per carichi alti
Core layer: lavora a livello di rete, gestisce le connesiioni con l’esterno e l’instradamento delle failures, interagisce con la SAN.
____
I livelli superiori possono diventare colli di bottiglia o soggetti a failures, un modo per rimediare sarebbe fare una Fat Tree, cioè mettere più link nella parte superiore ottenendo una banda maggiore e quindi più scalabilità e tolleranza
___
Una volta si usava n^2 dove numero di punti d’incrocio=n ingressi * n uscite. Usiamo CLOS network, se consideriamo i datacenter come grafi con nodi gli switch/server, l’obbiettivo di una rete è quello di minimizzare il numero di connessioni. Nel CLOS ci sono switch a 3 stadi, ingresso, intermedio e output. Questo permette di avere una topologia non bloccante che richiede meno punti d’incrocio, che permette di riorganizare la rete per trovare un percorso che sembrava inaccessibile.

Question 4

Q

Quali sono i metodi di replicazione?

In cosa consiste il Web Cluster?

Quali sono i limiti?

Answer

A

orinzontale: replichiamo oggetti identici (più economica)
verticale: suddivisione di un servizio complesso in sottoservizi che stanno in macchine diverse.
____
E’ un architettura che fa uso di entrambi i tipi di replicazione e si divide in 2 livelli:
Front: Web swtich con ip pubblico detto Virtual IP, hanno il ruolo di orchestrare. Operano su più livelli (hw, kernel, applicativo). Fa utilizzo di bilanciamento del traffico ed ha 2 opzioni:
- Switch livello 4 (Transporto): usa binding tables per tracciare conn TCP, il 3 way handshake viene mediato dallo witch e poi portato avanti dal backend (fa il primo SYN)
- Switch livello 7 (applicativo): lavorano in termini di richiesta, possono tenere traccia di sessioni utente. Gestito totalmente dallo switch che deve conosccere la richiesta per sapere dove inoltrarla
Backend: server configurati con ip privati che usano il front end per comunicare con l’esterno

Il limite è la consistenza dato che le repliche devono essere aggiornate, gli switch possono essere colli di bottiglia

Question 5

Q

Come viene gestito il traffico?

Answer

A

In un datacenter per traffico parliamo in termini di gruppi di cluster connessi, si possono identificare pattern nella comunicazione tra i nodi di un cluster. I nodi di un rack parlano tipicamente fra di loro, non neccessariamente nella stessa macchina per evitare copetizioni per le risorse d non troppo lontani per evitare grandi quantità di trafffico. Un altro pattern sono i nodi che ricevono da tutti e devono essere messi nel baricentro.

Una buona pratica è fare i backup di notte.

Question 6

Q

Quali sono i punti di congestione?

Quali sono le possibili soluzioni?

Com’è è costruita l’infrastruttura Google cloud?

Answer

A

I punti di congestione sono_
- last mile: dall’uscita della rete al client
- first mile: dal datacenter all’ingresso della rete
- peering point: punti di scambio fra AS
Il last mile è un problema che il provider non può risolvere perchè lato client, può agire sul first e il peering point (anche se tipicamente gli AS non hanno problemi di congestione).

Le possibili soluzioni sono:
- aumento connettività datacenter
- replicazione service point
- gestione del data center e delle che li interconnettono

____
Abbiamo 3 layer concentrici
- al centro i data center distribuiti nella località dove google stessa offre i servizi
- nell’anello successivo ci sono i point of presence che si occupano d’instradare i pacchetti preferibilimente all’interno della propria reta (policy cold potato), ottimizzando il traffico e si ricorre agli ISP sono nel last mile
- migliaia di edge nodes che formano la CDN google, sono più numerosi e replicati che si occupano di contenuti statici, preferibilmente posizionati negli AS dove si trova l’utente, in questo modo minimizziamo gli hops

Question 7

Q

In cosa consistono i software defined data center?

Quali sono gli inibitori del SDDC?

Answer

A

Nei data center tradizionali fanno distinzione fra il livello computazionale (gestione delle VM) e quello della comunicazione di rete, i SDD li unisce. La visione è ora di reti virtuali formati da VM e VR (virtual router).
___
Gestione della rete statica: Usiamo VLAN per la sicurezza e gestire il traffico ed è difficile da aggiustare quando le VM migrano, inoltre ogni cambiamento porta alla riconfigurazione.

Frammentazione delle risorse: Mappare i Virtual IP su Direct IP è un problema non banale. Per fare balancing.

P2P poor connectivity: bisogna evitare il problema della oversubscription.

Question 8

Q

Quali sono le tecnologie abilitanti per SDDC?

Answer

A

Iperconvergenza: è un sistema hw verticalizzato, che integra elementi di computazione, storage e networking. E’ praticamente un tentativo di condensare in un livello d’intelligenza tutte le funzioni di gestione del dc. Praticamente dei piccoli DC già testati per non essere colli di bottiglia, si autoconfigurano riducendo CAPEX e OPEX. Ci sono vari tipi:
- sis stack integrati: Server+storage+network+app sw all’interno
- integrated infrastructure: server + storage + net + virtualization, per una risorsa di computazione generica
- in combinazione con il fabric computing

Riduzione della topologia di rete(Fabric computing): virtualizzazione delle risorse di rete in modo di avere una visione semplificata. Gli elementi di switching multipli vengono condensati in uno solo, l’idea è di avere un mesh network che interconnette dispositivi di rete e storage, realizzato con SDN. Possiamo scalare, ricongigurare e non preoccupparci della topologia.

Mice and elefants: sfrutta la non uniformità nei dc, abbiamo 2 tipi di flussi brevi detti topi e lunghi detti elefanti, abbiamo tati topi e pochi elefanti. Ci possono essere link in over e altri under. Usiamo set di link riconfigurabili dinamicamente in base alla richiesta, in questo modo dirottiamo gli elefanti in certi link e i topi in altri. Usiamo tipicamente cavi ottici con switch ottico meccanici.

Question 9

Q

Come va progettato un data center?

Answer

A

Energia: Raffredamento e alimentazione, servono generatori di potenza sui MW, con gruppi di continuità a gasolio. e devono essere rindondanti.
raffeddamento: Possiamo posizionare i DC in luoghi freedi, accurandoci di filtrare l’umidità. Mettiamo i server rivolti alla stessa direzione creando dei corridoi alternati di aria calda e fredda (usiamo tende per non mischiarle), usiamo condizionatori grossi con aria che passa per piastrelle perforate e gestiamo i guasti. Cerchiamo di non spegnere e riaccendere le CPU spesso (usiamo metriche come l’acceleration factor) dato che aumenta l’usura.
sicurezza: fattore umano, analisi del comportamento elle persone, prima dell’assunzione e durante il lavoro. Sistemi di sorverglianza e guardie, accesso con badge o biometrico.
Posizione: evitare centri storici, zone strategiche, zone soggette a fenomeni naturali, lontani da impianti chimici, nucleari, logistica, e impatto sul tempo di risposta.