Data Understanding : Descriptions Flashcards
Techniques reviewed in this chapter:
Categorical
Variables
- Frequency distribution
- Bar chart
- Pie chart
- Pareto diagram
Techniques reviewed in this chapter:
Numerical
Variables
- Line chart
- Frequency distribution
- Histogram and ogive
- Stem-and-leaf display
- Scatter plot
Summarize data by category
The Frequency
Distribution Table
often used
for qualitative (category) data
Bar charts and Pie charts
Tinggi Batang atau Ukuran ‘Potongan Pie’ menunjukkan
Frekuensi atau persentase
Menggambarkan data kategorik, digunakan untuk memisahkan “vital few” dari “trivial many”
* Diagram batang ditampilkan dari tertinggi ke terendah.
* Polygon Kulumatif ditampilan dalam grafik yang sama.
Diagram Pareto
untuk menunjukkan nilai-nilai peubah seiring berjalannya
waktu.
Line chart (Plot Deret Waktu)
- Setiap Kelas selalu memiliki lebar (Class Interval) yang sama.
- Class Interval dihitung dengan membagi selisih nilai maksimum dan nilai minimum dengan jumlah
kelas yang diinginkan. - Jumlah kelas sebaiknya lebih dari 5 namun tidak lebih dari 10-15 atau bisa juga menggunakan
Sturgis’s Rule dimana jumlah kelas = 3.3 log (n) + 1, dimana n adalah jumlah data. - Class Interval tidak pernah tumpang tindih.
- Class Interval dibulatkan sehingga memudahkan pembuatan Class interval.
Tabel Distribusi Frekuensi
1* Grafik dari Tabel Distribusi Frekuensi disebut
2* Axis Horizontal menampilkan
3* Axis Vertikal bisa berupa
4* Batang dengan tinggi yang sesuai digunakan untuk
- histogram.
- garis akhir interval (interval endpoints)
- frekuensi, frekuensi relative, persentase.
- mewakili jumlah amatan yang ada di setiap
kelas.
a.
* dapat menghasilkan distribusi yang sangat tidak rata dengan celah dari kelas
kosong
* Dapat memberikan indikasi yang buruk tentang variasi frekuensi antar kelas
b.
* Dapat menghilangkan keragaman
* Dapat mengaburkan pola variasi yang penting
a. Banyak Kelas (Interval Kelas yang Sempit)
b. Sedikit Kelas (Interval Kelas yang Lebar)
Bagaimana garis akhir dari interval (endpoints of the
intervals) ditentukan?
- Sering terjawab dengan trial and error, tergantung pada penilaian
pengguna. - Tujuannya adalah untuk menciptakan distribusi yang tidak terlalu
“bergerigi” atau terlalu “rata” - Tujuannya adalah untuk menunjukkan pola variasi dalam data dengan
tepat
Menggambarkan Frekuensi Kumulatif.
Ogive
Sebuah cara mudah untuk melihat sebaran data secara detil suatu set data.
Stem-and-Leaf Diagram / Diagram Dahan Daun
observasi berpasangan yang diambil dari dua peubah numerik.
Peubah yang satu ditaruh di axis vertikal dan yang lain di axis horizontal.
Scatter Plot / Diagram Pencar