SDD Flashcards
In cosa consiste la SDD? Quali sono i punti di vista che il cloud provider deve tenere conto?
Cosa ci si aspetta che un data center cloud rispetti?
La SDD nasce dalla necessità di avere un sistema elastico e flessibile, questo è possibile tramite tecniche di virtualizzazione.
____
Il cloud provider tiene conto dell’utente: che deve percepire di avere una macchina per sè, la scalabilità deve essere istantanea (per l’utente devono essere disponibili macchine in pochi istanti), garantire la sicurezza(manteniamo la piattaforma sicura), il servizio deve essere affidabile (available tramite rindondanza) e il downtime all’ordine minuti/anno.
Dal punta di vista ingegneristico: L’infrastruttura deve essere gestita a livello hw in particolare termini di consumo energetico, raffreddamento e sicurezza. Con il sw monitoriamo l’utilizzo e consumo, mentre a lato hw raggruppiamo i nodi in rack e a loro volta in pods che presentano tre cavi 1 energia, 1 rete e 1 raffreddamento, possono essere considerati come dei mini data center.
____
Un data center cloud deve rispertare:
- sicurezza
- availability
- scalabilità
- elasticità
- realizzabile
- conveniente
- internet based
Come vengono organizzati i data center?
Quali sono i tipi di switch all’interno di un rack?
Quali sono le caratteristiche tecniche tipiche di un data center?
Usano dei blade systems composti da tipicamente 4 blades (unità computazionale vera e propria) inserite all’interno di un chassis che ha sistema di alimentazione, raffreddamento e monitoraggio. Essi sono organizzati in armati chiamati Rack con degli switch per permettere l’interconnessione dei blade systems e con il resto dei data center.
____
top of rack: per connettere gli elementi dello stesso rack
end of row per connessione dei rack nella stessa file
____
Tipicamente i blades hanno storage di piccole dimensioni, NVRAM o SSD di 500gb/1Tb per il caching e far girare l’hypervisor. E poi c’è uno storage vero e proprio sotto forma di SAN che tiene le immagini delle VM.
Qual’è la struttura di una rete di un datacenter?
Quali sono i limiti della topografia? come si potrebbe risolvere?
Quale configurazione di rete viene usata per ottenere questi risultati?
Abbiamo una struttura ad albero che parte dal basso con:
Servers: blade systems interconnessi con cavi 1-10Gbps
Edge layer(Access layer): composto da switch on top of rack e end of row, i blade systems sono connessi e s’implementano funzioni di isolamento del traffico e gestione dei guasti
Aggregation layer: interconnette zone separate del data center, implementa QoS per i flussi di dati, e fa traffic shaping per carichi alti
Core layer: lavora a livello di rete, gestisce le connesiioni con l’esterno e l’instradamento delle failures, interagisce con la SAN.
____
I livelli superiori possono diventare colli di bottiglia o soggetti a failures, un modo per rimediare sarebbe fare una Fat Tree, cioè mettere più link nella parte superiore ottenendo una banda maggiore e quindi più scalabilità e tolleranza
___
Una volta si usava n^2 dove numero di punti d’incrocio=n ingressi * n uscite. Usiamo CLOS network, se consideriamo i datacenter come grafi con nodi gli switch/server, l’obbiettivo di una rete è quello di minimizzare il numero di connessioni. Nel CLOS ci sono switch a 3 stadi, ingresso, intermedio e output. Questo permette di avere una topologia non bloccante che richiede meno punti d’incrocio, che permette di riorganizare la rete per trovare un percorso che sembrava inaccessibile.
Fa la differenza perchè con la legge di Moore, aumentano anche il numero di dispositivi.
Quali sono i metodi di replicazione?
In cosa consiste il Web Cluster?
Quali sono i limiti?
- orinzontale: replichiamo oggetti identici (più economica)
- verticale: suddivisione di un servizio complesso in sottoservizi che stanno in macchine diverse.
____
E’ un architettura che fa uso di entrambi i tipi di replicazione e si divide in 2 livelli: - Front: Web swtich con ip pubblico detto Virtual IP, hanno il ruolo di orchestrare. Operano su più livelli (hw, kernel, applicativo). Fa utilizzo di bilanciamento del traffico ed ha 2 opzioni:
- Switch livello 4 (Transporto): usa binding tables per tracciare conn TCP, il 3 way handshake viene mediato dallo witch e poi portato avanti dal backend
- Switch livello 7 (applicativo): lavorano in termini di richiesta, possono tenere traccia di sessioni utente. Gestito totalmente dallo switch che deve conosccere la richiesta per sapere dove inoltrarla
- Backend: server configurati con ip privati che usano il front end per comunicare con l’esterno
Il limite è la consistenza dato che le repliche devono essere aggiornate, gli switch possono essere colli di bottiglia
Come viene gestito il traffico?
In un datacenter per traffico parliamo in termini di gruppi di cluster connessi, si possono identificare pattern nella comunicazione tra i nodi di un cluster. I nodi di un rack parlano tipicamente fra di loro, non neccessariamente nella stessa macchina per evitare copetizioni per le risorse d non troppo lontani per evitare grandi quantità di trafffico. Un altro pattern sono i nodi che ricevono da tutti e devono essere messi nel baricentro.
Una buona pratica è fare i backup di notte.
Come viene gestito un data center? A cosa serve fare la migrazione delle VM? Come avviene l’instradamento del traffico tra più datacenter? Quali sono i punti di congestione? Quali sono le possibili soluzioni?
Com’è è costruita l’infrastruttura Google cloud?
Migrare le VM aiuta a bilanciare il carico, consolidare server idle per risparmiare energia, evitare la formazione di hotspot cioè macchine che lavorano più di altre generando calore (quindi usura), cambiare i pattern di carico di lavoro (non ho capito bene).
I punti di congestione sono_
- last mile: dall’uscita della rete al client
- first mile: dal datacenter all’ingresso della rete
- peering point: punti di scambio fra AS
Il last mile è un problema che il provider non può risolvere perchè lato client, può agire sul first e il peering point (anche se tipicamente gli AS non hanno problemi di congestione).
Le possibili soluzioni sono:
- aumento connettività datacenter
- replicazione service point
- gestione del data center e delle che li interconnettono
____
Abbiamo 3 layer concentrici
- al centro i data center distribuiti nella località dove google stessa offre i servizi
- nell’anello successivo ci sono i point of presence che si occupano d’instradare i pacchetti preferibilimente all’interno della propria reta (policy cold potato), ottimizzando il traffico e si ricorre agli ISP sono nel last mile
- migliaia di edge nodes che formano la CDN google, sono più numerosi e replicati che si occupano di contenuti statici, preferibilmente posizionati negli AS dove si trova l’utente, in questo modo minimizziamo gli hops
In cosa consistono i software defined data center?
Quali sono i gli aspetti da considerare per sfruttare i vantaggi offerti?
Nei data center tradizionali fanno distinzione fra il livello computazionale (gestione delle VM) e quello della comunicazione di rete, i SDD li unisce. La visione è ora di reti virtuali formati da VM e VR (virtual router).
___
Gestione della rete statica: rimuovere le VLAN, perchè ogni piccolo cambiamento porta alla riconfigurazione (questa cosa è da considerare se migriamo VM). Dato che le VLAN sono complesse, bisogna mapparle in modo smart sul layout fisico.
VLAN: rete locale divisa in reti locali logicamente non comunicanti tra loro ma che condividono l’infrastruttura.
Frammentazione delle risorse:
P2P poor connectivity: bisogna evitare il problema della oversubscription, ogni volta che si dispone di uno switch di accesso in cui la larghezza di banda upstream dallo switch al core
Quali sono le possibili soluzioni offerte da SDDC?
Iperconvergenza: è un sistema hw verticalizzato, che integra elementi di computazione, storage e networking. E’ praticamente un tentativo di condensare in un livello d’intelligenza tutte le funzioni di gestione del dc. Praticamente dei piccoli DC già testati per non essere colli di bottiglia, si autoconfigurano riducendo CAPEX e OPEX. Ci sono vari tipi:
- sis stack integrati: Server+storage+network+app sw all’interno
- integrated infrastructure: server + storage + net + virtualization, per una risorsa di computazione generica
- in combinazione con il fabric computing
Riduzione della topologia di rete(Fabric computing): virtualizzazione delle risorse di rete in modo di avere una visione semplificata. Gli elementi di switching multipli vengono condensati in uno solo, l’idea è di avere un mesh network che interconnette dispositivi di rete e storage, realizzato con SDN. Possiamo scalare, ricongigurare e non preoccupparci della topologia.
Mice and elefants: sfrutta la non uniformità nei dc, abbiamo 2 tipi di flussi brevi detti topi e lunghi detti elefanti, abbiamo tati topi e pochi elefanti. Ci possono essere link in over e altri under. Usiamo set di link riconfigurabili dinamicamente in base alla richiesta, in questo modo dirottiamo gli elefanti in certi link e i topi in altri. Usiamo tipicamente cavi ottici con switch ottico meccanici.
Come va progettato un data center?
- Energia: Raffredamento e alimentazione, servono generatori di potenza sui MW, con gruppi di continuità a gasolio. e devono essere rindondanti.
- raffeddamento: costo maggiore, usiamo la tecnologia Computer Room Air Conditioner (CRAC), ccioè stanze con condizionatori grossi, con tanto di sistema di filtraggio della polvere, fatto in modo che l’aria circoli al di sotto del pavimento e passa per piastrelle perforate. Iserver sono rivolti nella stessa direzione e si cerca di fare corridoi alterneti di aria fredda e calda, ci devono essere sistemi di emergenza quando un condizionatore va in guasto.
- sicurezza: fattore umano, analisi del comportamento elle persone, prima dell’assunzione e durante il lavoro. Sistemi di sorverglianza e guardie, accesso con badge o biometrico.
- Posizione: evitare centri storici, zone strategiche, zone soggette a fenomeni naturali, lontani da impianti chimici, nucleari, logistica, e impatto sul tempo di risposta.