Pendahuluan Sains Data dan Big Data Flashcards
sistem kerja utama dari perusahaan 4.0
mengolah data menjadi informasi/insight/solusi untuk pengguna
UGC adalah
User Generated Content adalah data teks/gambar/dll yang di upload pengguna ke platform online dan dapat diakses pengguna lain
database/data warehouse masuk ke jenis data apa
large data
NoSQL cocok untuk data yang
- dinamis
- tidak terstruktur
- beragam
tidak scalable
performa sistem akan semakin menurun kelak dan sulit dicari solusinya (selain membuat sistem baru)
map reduce adalah
model pemrograman yang paralel dan terdistribusi untuk data yang terdistribusi pula
benchmark adalah
membandingkan algoritma yang kita punya dengan milik orang lain (punya kita harus lebih baik)
speedup adalah
jika resource yang digunakan lebih banyak. efisiensi waktu juga meningkat
data science adalah
ilmu yang mempelajari pengolahan data dengan metode ilmiah, algoritma, dan sistem untuk mendapatkan insight baik di data terstruktur maupun tidak terstruktur