STATISTIKA DESKTRIPTIF I – MENGHIMPUN DATA, PEMILIHAN SAMPEL, PENYUSNAN KUESIONER DAN PENYAJIAN DATA
DEFINISI STATISTIKA
Statistika memiliki pengertian tentang segala sesuatu yang berkaitan dengan informasi numerikal. Akan tetapi, dalam perkembangannya statistika memiliki pengertian yang lebih luas yang tidak sekedar berbicara tentang informasi numerikal. Banyak definisi statistika yang dikemukakan di berbagai buku teks yang pada dasarnya sama. Dalam buku ini statistika didefinisikan sebagai: ilmu dan seni, ada juga yang mengatakan sebagai teknik tentang pengumpulan data, penyajian data, analisis data dan pengambilan kesimpulan data yang berhasil dihimpun tersebut. Seringkali kata statistika dikacaukan dengan kata statistik untuk pengertian yang sama. Sebenarnya, kedua kata tersebut merupakan terjemahan dari dua kata yang memiliki pengertian yang berbeda sekali, yaitu statistics dan statistic. Statistics diterjemahkan menjadi statistika dan statistic diterjemahkan menjadi statistik. Akan semakin jelas perbedaan kedua istilah tersebut. Sebagai metodologi, dalam buku ini akan digunakan istilah statistika.
PERKEMBANGAN PEMAKAIAN STATISTIKA
Sebagai sesuatu yang berkenaan dengan data numerikal, sebenarnya statistika sudah banyak digunakan oleh banyak negara, misalnya untuk mendaftar jumlah penduduk, perpajakan, pencatatan personel militer, dan lain sebagainya. Dengan semakin berkembangnya jaman, dewasa ini penggunaan statistika sudah semakin meluas di berbagai bidang kegiatan. Statistika tidak lagi hanya digunakan untuk kepentingan pemerintahan saja melainkan meluas sampai pada bidang bisnis, ekonomi, kedokteran, pendidikan, dan lain sebagainya. Di dunia bisnis dan ekonomi, masalah ketidakpastian merupakan masalah yang senantiasa dihadapi oleh para pelaku bisnis dan ekonomi, seperti; memilih satu atau sejumlah saham yang ditawarkan di bursa saham; memprediksi volume dan nilai penjualan untuk periode yang akan datang; menilai kelayakan suatu usulan investasi dan lain sebagainya. Berikut ini disajikan dua contoh tentang penggunaan statistika di bidang bisnis dan ekonomi.
STATISTIKA DESKRIPTIF DAN STATISTIKA INFERENSIAL
Statistika dibedakan menjadi dua bagian, yaitu statistika deskriptip dan statistika inferensial. Statistika deskriptip adalah serangkaian teknik yang meliputi teknik pengumpulan, penyajian, dan peringkasan data.
Statistika inferensial adalah serangkaian teknik yang digunakan untuk mengkaji, menaksir dan mengambil kesimpulan sebagian data (data sampel) yang dipilih secara acak dari seluruh data yang menjadi subyek kajian (populasi).
POPULASI DAN SAMPEL
Populasi adalah seluruh obyek yang ingin diketahui besaran karakteristiknya. Sampel adalah sebagian obyek populasi yang memiliki karakteristik sama dengan karakteristik populasinya, yang ingin diketahui besaran karakteristiknya.
Dua istilah lainnya sehubungan dengan populasi dan sampel adalah parameter dan statistik. Keduanya dapat didefinisikan sebagai berikut: Parameter atau lengkapnya parameter populasi adalah ukuran-ukuran tertentu yang digunakan sebagai penggambaran suatu populasi. Statistik atau statistik sampel adalah ukuran-ukur.an tertentu yang digunakan untuk menggambarkan suatu sampel.
MENGHIMPUN DATA
Data merupakan kumpulan fakta atau angka atau segala sesuatu yang dapat dipercaya kebenarannya sehingga dapat digunakan sebagai dasar menarik suatu kesimpulan.
Data dapat dijumpai di berbagai tempat. Dari surat kabar yang terbit setiap hari, akan dijumpai berbagai informasi mengenai harga sekuritas, komoditas dagangan, kurs mata uang asing, tingkat inflasi yang melanda suatu negara, dan lain sebagainya.
KARAKTERISTIK-KARAKTERISTIK SERANGAKAIAN DATA
Sebagai kumpulan fakta, serangkaian data memiliki karakteristik-karakteristik seperti berikut ini:
- Elemen atau Unsur
Serangkaian data meliputi sekumpulan elemen yang untuk masing-masing elemen tersebut memiliki informasi tentang karakteristik-karakteristik elemen-elemen yang bersangkutan. elemen adalah semua tenaga pengajar perguruan tinggi swasta tersebut.
- Variabel
Variabel adalah karakteristik elemen yang menjadi perhatian dan memiliki nilai-nilai yang berbeda-beda. Misalnya, karakteristik yang menjadi perhatian adalah pendapatan rata-rata per bulan. Sebagai karakteristik, variabel ini memberikan penjelasan terhadap elemen-elemen tertentu.
- Kasus
Kasus adalah informasi yang menyangkut seluruh variabel suatu elemen tertentu. Kasus disebut juga sebagai vektor observasi. Dengan demikian, jumlah kasus akan sama dengan jumlah elemen _ dalam contoh di atas sebanyak enam kasus.
- Observasi
Observasi sering pula disebut sebagai hasil (baca tentang teori probabilitas), yaitu suatu unsur dari serangkaian variabel tertentu.
MENGHIMPUN DATA MELALUI PENELITIAN SURVEI
- Tipe-tipe Data
Data kuantitatip adalah suatu karakteristik dari suatu variabel yang nilai-nilainya dinyatakan dalam bentuk numerikal. Data kualitatip adalah suatu karakteristik dari suatu variabel yang nilai-nilainya dinyatakan dalam bentuk n.on-numerikal atau atribut-atribut.
Data kuantitatip diskrit adalah karakteristik suatu variabel yang berasal dari proses penghitungan dan berupa bilangan bulat. Data kuantitatip kontinyu adalah karakteristik suatu variabel yang berasal dari proses pengukuran dan nilai-nilainya berada dalam suatu interval atau jangkauan tertentu. Nilai-nilai data kuantitatip kontinyu dapat berupa bilangan pecahan yang tidak terhingga banyaknya.
- Skala Pengukuran
Dari berbagai tipe data yang dikumpulkan, tingkat pengukuran dan tipe pengukurannya pun berbeda pula. Demikian pula untuk data diskrit, kendati data tipe ini timbul dari proses penghitungan, dapat juga dikatakan bahwa data diskrit timbul dari pengukuran melalui proses penghitungan.
Ada empat tingkat pengukuran data-mulai dari yang paling lemah hingga yang paling kuat- yaitu: nominal, ordinal, interval, dan rasio.
- Skala nominal dan ordinal
Data kualitatip yang dihimpun dapat diukur dengan menggunakan skala pengukuran nominal dan ordinal. Jika data yang dihimpun dapat dibedakan menjadi beberapa kategori tanpa memperhatikan urutan tertentu, maka tingkat pengukuran yang dapat digunakan adalah tingkat pengukuran nominal.
- Skala interval dan rasio
Skala interval merniliki kelebihan dibanding dengan kedua skala pengukuran yang terdahulu, dengan menambahkan berlakunya konsep interval. Jika sekelompok kategori data diberi nilai 1, 2, 3, 4, 5, maka jarak antara 1 dan 2 sama dengan jarak 4 dan 5. Jarak-jarak ini juga menggambarkan jarak-jarak pada kategorinya. Sebagai contoh adalah angka-angka tanggal dalam kalender, jam dan lainnya. Jarak antara tanggal 25 dan 29 sama dengan jarak antara tanggal 16 dan 20 (29-25 = 20-16). Demikian juga bahwa jarak antara jam 16.00 dan jam 19.00 sama dengan jarak antara jam 09.00 dan 13.00. Akan tetapi, bukan berarti bahwa tanggal 20 lebih lambat dua kali dibanding dengan tanggal 10, atau jam 09.00 lebih cepat dua kali daripada jam 18.00. Hal ini disebabkan adanya penetapan titik pusat. Penetapan titik pusat di sini dapat terjadi berubah-ubah. Misalnya, tanggal 27 dikatakan lebih lambat dua kali dibanding tanggal 18 jika titik pusatnya ditetapkan tanggal 9. Namun dapat juga dikatakan lebih lambat tiga kali jika titik pusatnya ditetapkan tanggal 30 (atau tanggal 31) bulan sebelumnya.
Sedangkan skala pengukuran rasio, lebih unggul dibanding dengan tiga skala di atas. Dalam skala rasio dikenal adanya titik pusat. Skala rasio menyajikan nilai sesungguhnya dari variabel-variabel yang dapat diukur dengan menggunakan skala rasio. Misalnya, berat badan sebesar 40 kg adalah dua kali berat badan 20 kg. Seluruh teknik analisis statistika dapat digunakan untuk menganalisis variabel-variabel yang berskala rasio.
MENYUSUN KUESIONER
- ldentifikasi data
Secara khusus, identifikasi data menempati pada bagian pertama dari sebuah kuesioner yang terdiri dari identas responden (nama, alamat, dan sebagainya). Dapat juga ditambahkan waktu wawancara, nama pewawancara dan kode pewawancara.
- Permohonan kerjasama
Jelas kiranya bahwa dengan adanya suatu pertanyaan permohonan kerja sama ini, pewawancara mengharapkan adanya kerjasama untuk pengumpulan data. Dalam bagian ini disebutkan identitas pewawancara (jika tidak disebutkan pada bagian pertama), organisasi asal pewawancara atau lembaga yang menyelenggarakan wawancara, maksud dan tujuan wawancara, dan waktu yang dibutuhkan dalam wawancara.
- Petunjuk pengisian
Bagian ini memuat petunjuk penggunaan atau pengisian kuesioner baik untuk responden maupun pewawancara. Bagian ini muncul jika kuesioner disampaikan dengan menggunakan jasa pos.
- Inti kuesioner
Bagian ini meliputi berbagai pertanyaan yang diajukan kepada responden yang berkenaan dengan segala informasi atau data yang dibutuhkan.
- Klasifikasi data
Dari bagian ini, data yang berhasil dihimpun dapat diklasifikasikan menjadi beberapa bagian. Bagian ini lebih menunjukkan karakteristik responden. Untuk kuesioner yang disampaikan melalui pos, bagian ini secara langsung diisi oleh responden sendiri. Sedangkan untuk wawancara langsung maupun melalui telepon, dilakukan oleh pewawancara dengan mengajukan pertanyaan. Kadang-kadang, klasifikasi data dimuat pada bagian pertama dari sebuah kuesioner.
PEMILIHAN SAMPEL
- Unit sampling
Unit sampling adalah suatu elemen atau elemen-elemen atau unsur yang tersedia untuk dipilih menjadi anggota sampel melalui beberapa tahap proses sampling. Dalam hal sampling sederhana sampling dalam satu tahap elemen-elemen sama dengan sampling unit.
- Kerangka sampling
Kerangka sampling adalah sebuah daftar yang memuat seluruh unit sampling pada suatu tahap proses sampling. Kerangka sampling dapat berupa, misalnya, daftar mahasiswa yang terdaftar dalam semester tertentu; daftar nama yang ada dalam buku telepon; daftar tenaga kerja yang ada di sebuah kantor tenaga kerja, dan lain sebagainya.
- Populasi kajian
Populasi kajian adalah keseluruhan obyek yang ingin diketahui gambarannya yang dari populasi tersebut sampel secara nyata akan diambil.
KESALAHAN DALAM SURVEI
Ada dua tipe kesalahan yang dapat terjadi dalam kegiatan penelitian survei yaitu kesalahan sampling dan kesalahan non-sampling.
Sebagian besar kegiatan penghimpunan data menggunakan sampel. Karakteristik-karakteristik yang dimiliki sampel ini selanjutnya digunakan untuk menaksir atau mengambil kesimpulan karakteristik-karakteristik yang dimiliki populasi. Tidak jarang, bahwa antara karakteristik-karakteristik sampel tersebut terdapat perbedaan dengan karakteristik-karakteristik populasi yang sebenarnya. Perbedaan-perbedaan ini disebut sebagai kesalahan sampling.
PENYAJIAN DATA
Bentuk penyajian data yang paling sederhana adalah data yang disajikan dalam keadaan terurut dari angka terkecil hingga angka terbesar atau sebaliknya dari angka terbesar hingga angka terkecil.
DISTRIBUSI FREKUENSI
Data yang disajikan sebagai data mentah (raw data). Dikatakan demikian, karena data tersebut belum diolah dan disajikan dalam bentuk yang lebih informatip, sehingga setiap orang yang membutuhkan informasi tentang saldo piutang tersebut akan dihadapkan pada kesulitan dalam membacanya. Misalnya, berapa saldo piutang terbesar dan berapa saldo piutang terkecil? Sulit tentunya dalam mencari kedua angka tersebut, apalagi jika jumlah pelanggannya banyak. Bentuk penyajian data yang paling sederhana adalah data yang disajikan dalam keadaan terurut dari angka terkecil hingga angka terbesar atau sebaliknya dari angka terbesar hingga angka terkecil. Namun demikian, data tersebut seyogyanya disusun dari angka terkecil hingga angka terbesar
- Distribusi Frekuensi dengan Interval Kelas Sama
Distribusi frekuensi sering pula disebut sebagai tabel frekuensi. Bentuk penyajian ini, data yang semula masih mentah (termasuk data yang telah diurutkan), disusun dalam kelompok-kelompok data atau kelas-kelas data tertentu.
- Distribusi Frekuensi dengan Interval Kelas Tidak Sama
Di depan telah dipaparkan bahwa interval kelas tidak harus sama. Hal ini terjadi jika terdapat perubahan angka data yang ekstrim. Hal ini akan berakibat bahwa pada distribusi frekuensi yang disusun akan terdapat satu kelas atau Iebih yang tidak memiliki frekuensi data atau memiliki frekuensi yang demikian kecil dibanding dengan kelas sebelum dan sesudahnya.
- Distribusi Frekuensi dengan Kelas Terbuka
Distribusi frekuensi dengan kelas tertutup adalah distribusi frekuensi yang secara jelas memiliki batas kelas terkecil dan batas kelas terbesar. Mirip dengan kasus pada distribusi frekuensi yang memiliki interval kelas yang tidak sama, sebuah distribusi frekuensi tidak harus memiliki kelas-kelas yang tertutup. Ada kemungkinan bahwa serangkaian data memiliki sejumlah kecil angka data (awal atau terakhir jika sudah diurutkan) yang besarnya tergolong ekstrim, misalnya jauh lebih kecil atau jauh lebih besar dari sebagian besar angka-angka data yang ada.
- Distribusi Frekuensi Relatif
Frekuensi data dinyatakan dalam bilangan absolut. Sebenarnya, frekuensi data tersebut dapat saja dinyatakan dengan bilangan relatif yang dihitung dengan membagi frekuensi masing-masing kelas dengan banyaknya data. Atau dapat juga dinyatakan dalam persentase, dengan membagi frekuensi masing-masing kelas dengan banyaknya data yang selanjutnya dikali dengan 100%.
HISTROGRAM DAN POLIGON FREKUENSI
- Histogram Frekuensi
Berbeda dengan penyajian-penyajian sebelumnya, pada penyajian berikut ini, data tidak lagi disajikan dalam bentuk tabel-tabel, melainkan dalam bentuk diagram-diagram. Penyajian dalam bentuk diagram-diagram ini akan memudahkan setiap orang yang ingin membaca data dengan cepat. Hanya saja, informasi yang diperoleh oleh pembaca tidak lagi jelas dan rinci.
- Poligon Frekuensi
Diagram yang dapat menggambarkan sebuah distribusi frekuensi tidak saja dapat digambarkan melalui histogram frekuensi, melainkan dapat juga digambarkan melalui poligon frekuensi. Sarna seperti pada histogram frekuensi, poligon frekuensi digambar pula dalam suatu bagan salib-sumbu dengan angka-angka ordinat dan absis yang sama. Hanya saja, masing-masing kelas berikut frekuensinya tidak dilukiskan dalam bentuk empat persegi-panjang, melainkan dalam bentuk garis yang menghubungkan tiap titik tengah masing-masing kelas.
- Kurva Frekuensi
Mirip dengan poligon frekuensi, kurva frekuensi digambarkan dalam bentuk garis yang menghubungkan tiap titik tengah untuk masing-masing kelas. Hanya saja, jika pada poligon frekuensi disajikan dalam bentuk garis-garis patah, maka pada kurva frekuensi, garis digambarkan secara halus. Dengan demikian, frekuensi data masing-masing kelas tidak lagi nampak secara jelas. Tujuan penyajian distribusi frekuensi dalam bentuk kurva frekuensi sekedar untuk memperlihatkan bagaimana bentuk distribusi data tersebut.
DISTRIBUSI FREKUENSI KUMULATIF DAN OGIVE
- Distribusi Frekuensi Kumulatif
Dalam distribusi frekuensi kumulatif, frekuensi tidak lagi disajikan untuk tiap kelas, namun disajikan secara kumulatif ke belakang atau ke depan. Misalnya, frekuensi pada kelas ke tiga, tidak lagi disajikan hanya untuk frekuensi kelas tersebut, namum meliputi kelas-kelas sebelumnya atau meliputi kelas-kelas berikutnya. Dengan demikian, distribusi frekuensi kumulatif dibedakan menjadi dua, yaitu: distribusi frekuensi kumulatif "kurang dari" dan distribusi frekuensi kumulatif "atau lebih"
- Ogive
Distribusi frekuensi kumulatif, selain disajikan dalam bentuk tabel-tabel seperti di atas, dapatjuga disajikan dalam bentuk diagram yang dinamakan ogive. Penggambarannyajuga dilakukan di atas bag an salib-sumbu seperti pada poligon frekuensi.
BENTUK PENYAJIAN YANG LAIN
- Diagram Batang
Seringkali sebuah organisasi, organisasi bisnis misalnya, perlu menyajikan berbagai data yang menginformasikan perkembangan berbagai prestasi seperti perkembangan laba yang diperoleh, perkembangan nilai penjualan, dan lain sebagainya. Selain dapat disajikan dalam bentuk tabel-tabel, yang dapat memberikan informasi rinci, kadang-kadang, pihak-pihak tertentu ingin memperoleh informasi secara sepintas, yang tentu saja keakuratan informasi yang diperolehnya memang tidak diperhatikan. Dalam hal ini data yang telah disajikan dalam bentuk tabel-tabel perlu disajikan dalam bentuk lain yang lebih menarik. Diagram batang, atau bar chart adalah salah satu bentuk yang dimaksud.
- Garis
Fungsi diagram garis sebenarnya tidak berbeda dengan fungsi diagram batang yang memberikan informasi mengenai perkembangan sesuatu dari peri ode ke peri ode. Hanya saja, seperti namanya, diagram diwujudkan dengan garis-garis yang menghubungkan puncak-puncak frekuensi tiap periode.
- Diagram Lingkaran
Berbeda dengan kedua diagram di atas, diagram lingkaran (dalam satu diagram) menginformasikan perbandingan beberapa obyek yang menjadi perhatian. Misalnya volume produksi sepatu untuk berbagai tipe pada tahun 1989. Tentu saja, penggambarannya dilakukan di atas sebuah lingkaran. Selanjutnya lingkaran tersebut dibagi-bagi menjadi beberapa daerah sesuai dengan jumlah obyek yang menjadi perhatian. Proporsi daerah yang menginformasikan obyek kajian dibuat sedemikian rupa sehingga luas daerah yang dimaksud sebanding dengan nilai-nilai datanya. Misalnya, sepatu yang akan diinformasikan sebanyak 4 tipe. Maka lingkaran terse but dibagi menjadi 4 daerah yang luasnya sesuai dengan masingmasing volume produksi.
HASIL CETAK KOMPUTER
Dewasa ini, sudah banyak beredar berbagai program untuk komputer yang dapat digunakan untuk menyajikan data, baik dalam bentuk tabel maupun diagram. Sehingga lebih memudahkan dalam penyjian data dan memiliki variasi yang lebih banyak sehingga dapat menampilkan data dengan lebih menarik.