Minggu, 10 Desember 2017

Distribusi Frekuensi dan Pengelompokan Data


Distribusi Frekuensi dan Pengelompokan Data
A. Distribusi Frekuensi

Dari file Latihan distribusi frekuensi, dapat dibuat distribusi frekuensi untuk jenis kelamin dan pendidikan, sedangkan untuk distribusi frekuensi umur dan pendapatan, sebaiknya data dikelompokkan dulu. Untuk menampilkan distribusi frekuensi pada SPSS adalah dengan cara klik menu Analyze Descriptive Statistics → Frequencies. Akan muncul tampilan berikut:
 
Gambar 2.1 Tampilan Frequencies
Masukkan (pindahkan) variabel jenis kelamin dari kotak sebelah kiri ke kotak sebelah kanan dengan cara klik variabel jenis kelamin di kotak kiri, kemudian klik panah yang menuju ke sebelah kanan. Lakukan hal yang sama untuk variabel pendidikan. Kemudian klik OK. Output dari distribusi frekuensi diberikan sebagai berikut:
 
Tabel pertama memberikan keterangan mengenai variabel yang diolah, yaitu jumlah observasinya dan jumlah observasi missing. Dari tabel tersebut terlihat bahwa jumlah observasi sebanyak 18 dan tidak ada observasi missing.
Tabel kedua dan ketiga masing-masingnya memberikan distribusi frekuensi untuk jenis kelamin responden dan pendidikan responden. Tabel distribusi frekuensi menampilkan lima kolom sebagai berikut:
·         Kolom pertama: kategori yang difrekuensikan (sebagai contoh pada jenis kelamin adalah pria dan wanita)
·         Kolom kedua: frekuensi masing-masing kategori
·         Kolom ketiga: persentase frekuensi masing-masing kategori (persentase dihitung dari total observasi termasuk observasi missing)
·         Kolom keempat : persentase frekuensi masing-masing kategori tetapi persentase dihitung dengan mengeluarkan observasi missing. (Catatan: berhubung tidak ada observasi missing, baik untuk jenis kelamin maupun pendidikan, maka kolom 3 dan 4 menjadi sama).
·         Kolom kelima: Cumulative Percent yaitu persentase kumulatif yang dihitung dari valid percent. Sebagai contoh pada tabel frekuensi pendidikan. Baris pertama adalah 22,2 persen. Pada baris kedua adalah 55,6 persen yang dihitung dari 22,2 + 33,3 (catatan: perbedaan perhitungan karena pembulatan).
B. Pengelompokkan Data
Selain menampilkan ukuran statistik deskriptif dari kumpulan data, kita juga dapat menampilkan distribusi frekuensi dari data tersebut. Jika data sudah dalam bentuk kategori (misalnya pendidikan SD, SLTP,SLTA dst) atau data sudah dikategorikan dalam kelompok-kelompok interval tertentu misalnya pendapatan rendah (< 1.000.000), menengah (1.000.000 – 2.000.000), tinggi (>2.000.000), maka kita dapat secara langsung membuat distribusi frekuensinya. Tetapi jika data belum terkelompok dalam kategori-kategori tertentu, tabel distribusi frekuensinya akan sangat panjang mengikuti keragaman dari nilai-nilai data tersebut. Misalnya jika dibentuk tabel distribusi frekuensi dari data umur, maka akan terbentuk tabel distribusi yang tidak ringkas, sehingga kita akan sulit menarik kesimpulan dari data tersebut, seperti terlihat dibawah ini:
 
Gambar 2.3 Tampilan output distribusi frekuensi variable umur
Agar tabel distribusi frekuensi menjadi lebih ringkas sehingga mudah diinterpretasikan, data umur sebaiknya dikelompokkan terlebih dahulu dengan cara klik menu Transform. Ada dua pilihan dalam mengelompokkan data yaitu Recode into Same Variables (kode pengelompokkan akan menindih data asli) dan Recode into Different Variables (kode pengelompokan akan dibuat pada variabel yang baru). Pilih Recode into Different Variables, maka akan muncul tampilan berikut:
 
Gambar 2.4 Tampilan kotak dialog Recode into Different Variables
Pindahkan variable umur ke kotak Input Variables → Output Variables. Kemudian pada kotak Output Variable, untuk Name tuliskan Kel.Umur dan untuk Label tuliskan Kelompok Umur, kemudian klik Change → Old and New Values, akan muncul tampilan berikut:
 
Gambar 2.5 Tampilan Recode into Different Old and New Values
Misalnya variable umur akan dikelompokkan menjadi ≤ 29, 30 – 39, 40 – 49, dan ≥ 50. Untuk mengelompokkan umur ≤ 29, pada bagian Old Value, klik Range, LOWEST through value, kemudian isikan pada kotak dibawahnya angka 29. Pada bagian New Value, pada kotak Value isikan angka 1, lalu klik Add (lihat tampilan diatas). Untuk mengelompokkan umur 30 – 39, pada bagian Old Value, klik Range, kemudian isikan pada kotak dibawahnya angka 30 dan kotak dibawah through angka 39. Selanjutnya pada bagian New Value, pada kotak Value isikan angka 2, kemudian klik Add (lihat tampilan berikut ini)
Gambar 2.6 Tampilan Recode into Different Old and New Values
Dengan cara yang sama lakukan untuk kelompok umur 40 – 49 dan pada New Value beri kode 3. Selanjutnya untuk kelompok umur ≥ 50, pada bagian Old Value, klik Range, value through HIGHEST, isikan pada kotak dibawahnya angka 50. Selanjutnya pada bagian New Value, pada kotak Value isikan angka 4, lalu klik Add. Setelah selesai memberikan kode untuk pengelompokan umur ini, kemudian klik Continue dan OK. Hasilnya pada sheet Data View akan ada tambahan variabel baru yaitu kelompok umur sebagai berikut:
 
Berikan keterangan untuk masing-masing kode pengelompokan umur tersebut pada Value Label dengan kode 1 (≤ 29), kode 2 (30-39), kode 3 (40 – 49), kode 4 (≥ 50). Lalu bentuklah distribusi frekuensi untuk kelompok umur tersebut sehingga output adalah sebagai berikut:

Tidak ada komentar:

Posting Komentar