architecture for big data Flashcards
design pattern, tipi di dati/sistemi, etl, cdc intrusive sul database
architetture sw, correlazione architettura reale- architettura sw
definizione, concetti di stile ( con anche problemi di erosione e drift) viste e materiali (guardo)
piloni delle sw architecture
7 magici punti (o qualcosa del genere)
perchè usare un fs per salvare i log, tecniche di CDC legate ai log/applicative, confrontare 2 versioni diverse di db
adoope, adoope fs, elementi, struttura, procedure
oltre a cose classiche proprietà che si vuole il sistema garantisca, name node come single point of failure, scrittura distribuita su + file, l’utilizzo di journaling manager
apache spark (elementi architetturali), resilient distributed ds,hash system, politica lazy, operazioni
funzionamento ripartizoine dei task, esecuzoine di azioni sul cluster, funzionamento reduce
procedimento totale di esecuzione task, docker
utilizzo tipico apache spark
dataframe in spark, passaggio spark -> sqldb, composizione sql db