Midterm Test ADS Flashcards

You may prefer our related Brainscape-certified flashcards:
1
Q

Apa itu data science?

Soal Quiz

A

Ilmu yang mempelajari data terutama yang sifatnya kuantitatif. Dapat juga berarti Proses penggalian data atau Proses untuk memproduksi pengetahuan data (data insight)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Apa itu Data Insight?

Soal Quiz

A

Sebuah simpulan yang dapat memberikan rekomendasi atau prediksi untuk kebutuhan tertentu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Apa peran seorang Data Scientist?

Soal Quiz

A
  • Melakukan Pengolahan data sehingga menghasilkan pengetahuan
  • Melakukan Mining Data dengan mekestraknya hingga menemukan data akurat
  • Mengidentifikasi permasalahan, Mengumpulkan data dari berbagai sumber, mengatur informasi, dan menerjemahkan hasi menjadi solusi
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Berapa tahap yang ada dalam proses data science untuk menghasilkan produk data yang benar?

Soal Quiz

A

3 yakni desain data, pengumpulan data, dan analisis data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Apa yang dimaksud dengan transformasi digital dalam konteks data science?

Soal Quiz

A

Pergerakan yang mengisyaratkan betapa bernilainya data bagi sebuah langkah strategis bisnis (Data is a new currency

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Cabang ilmu kecerdasan buatan (Artificial Intelligence) yang mempelajari bagaimana dapat memberikan kemampuan belajar pada sebuah mesin dengan menggunakan algoritma tertentu merupakan pengertian dari

A

Machine Learning

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Traditional Software merupakan cabang ilmu yang dihasilkan dari irisan cabang ilmu …

A

Komputer dengan Subject Matter Expertise (SME)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Apa yang dimaksud dengan Subject Matter Expertise (SME)?

A

Pengetahuan yang digunakan untuk mengembangkan sistem yg dapat membantu proses bisnis pada sebuah instansi.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Cabang ilmu yg diperoleh dari irisan ilmu matematika dan statistika dengan SME adalah

A

Traditional Research

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Sebutkan Pengaplikasian data science dalam industri

A
  • Analisis foto medis
  • Deteksi penipuan di sektor keuangan
  • Penetapan harga yg dinamis
  • Merekrut bintang muda potensial
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Apa itu data mining?

A

proses memilah-milah kumpulan data besar untuk mengidentifikasi pola dan hubungan yg dapat membantu memecahkan masalah bisnis melalui analisis data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Apa tujuan utama machine learning?

A

Untuk membuat model yang dapat membuat prediksi atau klasifikasi yang akurat

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Memahami lebih jauh data yg diamati dan mengetahui karakteristik dari data yg dimaksud merupakan fungsi data mining yakni…

A

Descriptive

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Menemukan pola tertentu dari suatu data yg digunakan untuk memprediksi variabel lain yg blm diketahui nilai atau jenisnya merupakan fungsi data mining yakni?

A

Predictive

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

CRISP-DM merupakan singkatan dari

A

Cross-Industry Standard Process for Data Mining

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Sebutkan tahapan CRISP-DM!

A
  1. Business Understanding
  2. Data Understanding
  3. Data Preparation
  4. Modeling
  5. Evaluation
  6. Deployment
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Apa yang dimaksud dengan mean?

Soal Quiz

A

Nilai yang didapatkan dari penjumlahan seluruh data yang dibagi dengan jumlah data tersebut atau
rata-rata

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Apa yang dimaksud dengan median?

Soal Quiz

A

Nilai tengah dalam suatu rangkaian data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Apa yang dimaksud dengan range?

Soal Quiz

A

Selisih antara nilai maksimum dan minimum dalam kumpulan data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Apa yang dimaksud dengan mode?

Soal Quiz

A

Nilai yang paling sering muncul dalam kumpulan data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Apa yang dimaksud dengan variance?

Soal Quiz

A

Rata-rata dari kuadrat selisih setiap nilai data dan mean

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Apa yg dimaksud Standard Deviation?

A

Simpangan Baku atau akar kuadrat dari varians

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Statistika adalah…

A

Ilmu yg mempelajari data dan peluang

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Statistik Inferensial digunakan untuk…

A

membuat kesimpulan atau prediksi dari data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Apa kegunaan dari Distribusi Probabilitas?

A

Untuk menghitung probabilitas peluang atau teknik pengurangan dimensi, over and under sampling, hingga teknik bayesian statistik

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Konsep yg menjelaskan penggunaan probabilitas untuk memodelkan proses pengambilan sample dan mengontrol situasi tidak pasti sebelum proses pengumpulan data dilakukan merupakan pengertian dari?

A

Konsep Bayesian

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Distribusi yang digunakan untuk menggambarkan variabel acak yg berkelanjutan adalah

A

Distribusi Probabilitas kumulatif atau normal

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Distribusi probabilitas binomial atau diskrit adalah

A

distribusi yang digunakan untuk menggambarkan variabel acak yg diskrit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Metode matematika yg memungkinkan ilmuwan data untuk memprediksi hasil kontinu (y) berdasarkan nilai satu atau lebih variabel prediktor (x) adalah

A

Regresi

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Apa perbedaan regresi linier dan non-linier?

A

Regresi linier mengacu pada satu variabel independet untuk membuat prediksi sedangkan Regresi non-linier mengacu pada dua atau lebih variabel independent

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Fungsi Matriks dalam data science adalah

A
  • Penyimpanan data
  • Operasi Matriks
  • Transformasi data
  • Analisis data
  • Evaluasi model
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

Apa itu dataframe?

A

struktur data 2 dimensi yg berbentuk tubular, terdiri dari baris dan kolom

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

Apa perbedaan Matriks dan Dataframe?

A

Setiap elemen pada matriks memiliki tipe data yg sama biasanya numerik, sedangkan setiap kolom pada dataframe dapat memiliki tipe data yg berbeda seperti angka, string, dll.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

Bagaimana cara mengubah tipe data pada dataframe di Python?

Soal Quiz

A

Menggunakan fungsi astype()

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

Bagaimana cara merubah nama kolom pada dataframe di Python?

Soal Quiz

A

Menggunakan metode rename()

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

Bagaimana cara menghapus baris pada dataframe di Python?

Soal Quiz

A

Menggunakan fungsi drop()

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

Bagaimana cara melakukan manipulasi data seperti mengurutkan, memilih, dan menghapus nilai-nilai
duplikat pada dataframe di Python?

Soal Quiz

A

Menggunakan atribut columns

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
38
Q

Bagaimana cara mentransfer nilai data ke dataframe di Python?

Soal Quiz

A

Menggunakan fungsi atau mapping

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
39
Q

Bagaimana cara mengganti nilai yg hilang pada dataframe di python?

A

Menggunakan fungsi fillna()

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
40
Q

Bagaimana cara mengelompokkan data kedalam interval tertentu pada dataframe di python?

A

Menggunakan metode cut()

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
41
Q

Apa pengertian hipotesis menurut KBBI

A

sesuatu yg dianggap benar untuk alasan atau pengutaraan pendapat meskipun kebenarannya masih harus dibuktikan

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
42
Q

Pengujian hipotesis dalam penelitian digunakan dalam situasi apa saja?

A
  • Menguji kebenaran teori
  • Memberikan gagasan baru untuk mengembangkan suatu teori
  • Memperluas pengetahuan penelitian mengenai suatu gejala yg sedang dipelajari
  • menguji dugaan penelitian
  • menyusun problem statement
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
43
Q

Representasi data, pemilihan dan pelatihan model, evaluasi model, pemahaman data, mengurangi kesalahan, dan menciptakan konsistensi merupakan fungsi dari

A

Model

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
44
Q

Optimasi dalam data science adalah

A

Proses mencari nilai terbaik dari fungsi tujuan dalam suatu himpunan yg diizinkan

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
45
Q

Sebutkan penerapan optimasi dalam data science!

A

Pembelajaran mesin, pemilihan model, penyusunan parameter, pengurangan dimensi, dan jaringan saraf tiruan

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
46
Q

Bagaimana deep learning digunakan dalam pembelajaran mesin?

Soal Quiz

A

Digunakan untuk menyesuaikan model dengan data pelatihan.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
47
Q

Apa yang dimaksud dengan Volume dalam konteks Big Data?

Soal Quiz

A

Merujuk pada jumlah data yang sangat besar

48
Q

Apa yang diatur dalam Pasal 27 Ayat (3) UU ITE?

Soal Quiz

A

Penyebaran informasi yang melanggar kesusilaan

49
Q

Berapakah hukuman maksimal yang dapat diberikan kepada seseorang yang menyebarkan informasi elektronik bermuatan asusila menurut Pasal 45 Ayat (1)?

Soal Quiz

A

Denda Rp 1 miliar dan penjara enam tahun

50
Q

Apa yang diatur dalam Pasal 45 Ayat (2) UU ITE?

Soal Quiz

A

Penyebaran berita bohong atau hoax kepada masyarakat

51
Q

Deep learning disebut juga dengan

A

Deep neural learning atau deep network learning

52
Q

Algoritma yg digunakan untuk meniru cara kerja otak manusia adalah

A

Algoritma jaringan syaraf atau artificial neural network dan turuannya

53
Q

Apa pengertian dari big data?

A

Kumpulan data yg sangat besar, kompleks dan terus bertambah setiap waktu

54
Q

Ada berapa karakteristik utama big data?

A

5V, yakni Volume, Velocity (kecepatan), Variety (variasi), Value (nilai), dan Veracity (keakuratan)

55
Q

Jenis big data dimana data terstruktur dengan bak dan terdefinisikan adalah

A

Data terstruktur (Structured data)

56
Q

Apa yg dimaksud dengan semi structured data?

A

data yg terstruktur namun tidak lengkap dan tidak memenuhi syarat data yg terstruktur

57
Q

Apa jenis big data yg sulit ditangani, dipahami, dan dianalisis?

A

Unstructured data

58
Q

Apa contoh unstructured data?

A

Data komentar, twit di twitter, postingan dan like

59
Q

Sebutkan teknologi penyimpanan yg umum digunakan untuk big data!

A

Hadoop, cloud, dan NoSQL

60
Q

Apa yg dimaksud etika akuntabilitas dalam data science

A

perusahaan bertanggung jawab penuh atas semua kerugian yg terjadi atas data yg dikumpulkan

61
Q

Apas aja etika dalam data science?

A

Privasi, bias, transparansi, akuntabilitas, kenetralan, keadilan, kejujuran

62
Q

Salah satu etika dalam data science adalah kejujuran yg berarti bebas dari DF2P dalam publikasi. Apa itu DF2P?

A

Duplikasi, Fabrikasi, Falsifikasi, Plagiarisme

63
Q

Apa uu yg mengatur tentang pemberian hak kepada subjek data pribadi untuk mengakhiri pemrosesan, menghapus dan/atau memusnahkan data pribadi tentang dirinya sesuai dengan ketentuan peraturan perundang-undangan?

A

UU No.27 Tahun 2022 Pasal 8

64
Q

UU No.27 Tahun 2022 Pasal 20 mengatur tentang

A

Setiap orang wajib memiliki dasar pemrosesan data pribadi

65
Q

Apa UU yg mengatur tentang pencemaran nama baik melalui media elektronik?

A

Pasal 27 ayat (4) UU ITE

66
Q

Sebutkan protokol AI

A

Pengidetifikasian konten AI, Kerangka kerja tata kelola, pengaturan privasi, pengaturan keamanan, pengaturan kepatuhan, pengaturan transparansi dan akuntabilitas

67
Q

Apa saja cakupan kerangka kerja tata kelola pada protokol AI

A

Standar teknis, pedoman etus, dan prosedur penanganan data

68
Q
  • Perlindungan HAM dan martabar
  • Kerangka kerja aksi kebijakan
  • Proporsionalitas dan tidak menyakiti
  • keamanan dan keselamatan
  • keadilan dan non-diskriminasi
  • keberlanjutan
  • hak privasi dan perlindungan data
  • pengawasan manusia dan penentuan
  • Transparansi dan penjelasan
    Merupakan etika kecerdasan AI menurut
A

UNESCO

69
Q

Sebutkan 3 laws of robotics

A
  • tidak boleh melukai manusia atau membiarkan manusia dalam bahaya
  • mematuhi perintah manusia selama tidak bertentangan dengan hukum pertama
  • melindungi eksistensinya sendiri selama tidak bertentangan dengan hukup pertama atau kedua
70
Q

Apa bahasa pemrograman yg sangat popular dikalangan data scientist

A

Python

71
Q

Apa bahasa pemrograman yg khusus dirancang untuk statistik dan visualisasi data

A

R

72
Q

Bahasa pemrograman Julia adalah

A

bahasa baru yg dirancang khusus untuk komputasi numerik dan data science

73
Q

Apa kelebihan dari Python?

A
  • sintaks bersih dan mudah dibaca
  • library luas
  • komunitas besar
  • fleksibilitas
74
Q

Apa library python yg digunakan untuk manipulasi dataframe

A

pandas

75
Q

Apa library python yg digunakan untuk manipulasi array

A

NumPy

76
Q

Data primer adalah

A

Data yg dikumpulkan langsung oleh analis utnutk tujuan spesifik proyek

77
Q

Kapan biasanya dilakukan pengumpulan data primer?

A

Ketika data yg ada tidak memadai, tidak relevan, atau tidak tersedia untuk kebutuhan penelitian khusus tersebut

78
Q

Apa saja metode pengumpulan data primer?

A

survei dan kuisioner, wawancara, dan observasi

79
Q

Data yg sudah dikumpulkan dan diproses oleh pihak lain dan tidak dikhususkan untuk analisis saat ini disebut

A

Data sekunder

80
Q

Apa saja keuntungan dari data sekunder?

A
  • Hemat waktu dan biaya
  • Akses ke data set yg luas
  • Studi longitudinal (jangka panjang)
81
Q

Apa saja keterbatasan data sekunder?

A
  • relevansi dan ketepatan
  • Kualitas dan konsistensi
  • keterbatasan akses
82
Q

Contoh web untuk mencari data set public adalah

A

Kaggle, UCI Machine learning repository, dan Satu Data Indonesia

83
Q

Langkah CRISP-DM untuk menentukan tujuan bisnis, menilai situasi saat ini, menetapkan tujuan penambangan data dan mengembangkan rencana proyek adalah

A

Business Understanding

84
Q

Apa saja tahapan yg digunakan pada tahap Data Preparation

A
  • Check duplikasi data
  • Perhitungan nilai
  • Pengurangan data
  • Menambahkan kolom data baru
  • Split data
  • Pembersihan data
85
Q

Untuk memahami tipe data dan informasi tentang data pada python gunakan

A

perintah .info()

86
Q

.nunique() pada python digunakan untuk

A

memeriksa duplikasi data

87
Q

isnull() pada python digunakan untuk

A

mengetahui baris yg tidak memiliki nilai

88
Q

Perintah apa yg digunakan untuk mendapatkan jumlah record yg hilang di setiap kolom pda python

A

data.isnull().sum()

89
Q

Suatu pendekatan yg digunakan dalam analisis data untuk mengoptimalkan pengetahuan ke dalam datasetm menemukan struktur dasar dataset, mengekstrak variabel penting, mendeteksi outlier dan anomaly, menguji asumsi yg menjadi dasar dataset, mengembangkan model pasimonius, dan menentukan pengaturan faktor yg normal disebut

A

Analisis Data Eksplorasi

90
Q

Analisis Data Eksplorasi dikembangkan oleh ahli statistik bernama

A

John Tukey

91
Q

Apa output ringkasan statistik untuk data object?

A

Count, unique, top, freq

92
Q

count, mean, standard devation, min, max, 25 percentile,50 percentile, dan 75 percentile merupakan output ringkasan statistik untuk data

A

Numerik

93
Q

Apa perintah yg digunakan untuk menghitung ringkasan statistik pada python?

A

.describe()

94
Q

Perintah .describe(include=’all’).T digunakan untuk…

A

Menampilkan semua data termasuk object pada ringkasan statistik

95
Q

Untuk mengetahui tipe dari masing masing variabel pada ringkasan statistik digunakan perintah

A

.dtypes

96
Q

Library Matplotlib dibuat oleh

A

John D.Hunter

97
Q

Library python untuk menggambar plot 2D dengan kualitas tinggi adalah

A

Matplotlib

98
Q

library python yg ditambahkan agar tampilan chart lebih modern adalah

A

Seaborn

99
Q

Library seaborn pertama kali diperkenalkan oleh

A

Michael Askom

100
Q

Variabel Kategorikal pada ADE divisualisasikan dengan

A

Count plot, barchart, dan pie plot

101
Q

Variabel numerik pada ADE divisualisasikan dengan

A

Histogram, box plot, dan Density plot

102
Q

Kapan sejarah data science dimulai?

A

1962

103
Q

Tahun 1962 John Tukey menulis “The Future of Data Analysis” yg menggambarkan tentang….

A

Pergeseran dalam dunia statistik

104
Q

Kapan dan oleh siapa Buku “The Concise survey of Computer Methods” diterbitkan?

A

1974, oleh Peter Naur

105
Q

Peter Naur mendefinisikan data science sebagai….

A

ilmu yg mengelola data

106
Q

Apa yg terjadi pada tahun 1977 dalam sejarah data science?

A

Dibentuknya IASC (International Association for Statistical Computing)

107
Q

Menghubungkan teknologi komputer modern, metodologi statistik tradisional, serta pengetahuan untuk menghasilkan informasi dan pengetahuan berbasis data merupakan misi dari

A

IASC

108
Q

Workshop Knowledge Discovery in Database (KDD) pertama kali diselenggarakan pada tahun 1989 dan dipimpin oleh

A

Gregory Piatetsky-Shapiro

109
Q

Apa yg diserukan oleh Prof.C.F.Jeff Wu dalam kuliah di Univ. Michigan pada tahun 1997?

A

Menyerukan agar statistik diganti nama menjadi data science dan ahli statistik diganti nama menjadi data scientist

110
Q

Siapa yg mengatakan perlunya alat baru untuk menangani jumlah data yg sangat besar pada tahun 1999

A

Jacob Zahavi

111
Q

Apa yg terjadi pada tahun 2001 dalam sejarah data science?

A

terciptanya software-as-a-service (SAAS) untuk pertama kalinya

112
Q

Kapan Hadoop 0.1.0 dirilis?

A

tahun 2006

113
Q

Pada tahun 2010 Drew Conway membuat The Data Science Venn Diagram yg mencakup keterampilan

A

meretas, pengetahuan matematika dan statistik, keahlian substantif

114
Q

Dafta pekerjaan untuk data scientist meningkat 15.000 persen pada tahun

A

2011

115
Q

Apa yg terjadi pada tahun 2015 dalam sejaeah data science

A
  • teknik deep learning digunakan untuk google voice
  • meningkatnya proyek perangkat lunak di google yg menggunakan AI sebanyak lebih dari 2700 proyek