STATISTIKA DASAR
Statistik
dan Statistika
Statistika
ialah ilmu pengetahuan (cabang matematika terapan) yang mempelajari teknik
pengumpulan, penyajian, pengolahan, penganalisaan data, dan penarikan
kesimpulan yang benar. Hasil analisis dan pengolahan suatu data disebut statistik.
Statistik ini menunjukkan karakteristik data, misalnya rata-rata, median, modus
dan lain sebagainya.
Macam-macam Statistika
Statistika
dalam pengertian sebagai ilmu dibedakan menjadi dua:
1. Statistika
deskriptif, yaitu ilmu pengetahuan yang mempelajari teknik mengorganisasikan
(mengumpulkan, menyusun) dan meringkas (menyajikan
data dalam bentuk kurva atau diagram, serta mengolah dan menganalisis) data sebagaimana
adanya tanpa menarik kesimpulan atau generalisasi. Hasil dari mengolah dan menganalisis data disebut
statistik, misalnya rata-rata, median, modus, dan lain sebagainya.
2. Statistika
Inferensial (Induktif), yaitu ilmu pengetahuan yang mempelajari teknik
penarikan kesimpulan atau generalisasi dari statistika deskriptif. Statistika inferensial bertujuan menyajikan, menganalisa data dari suatu kelompok (sampel) untuk ditarik kesimpulan-kesimpulan,
prinsip-prinsip tertentu yang berlaku bagi kelompok yang lebih besar
(populasi).
Statistika inferensial merupakan langkah akhir dari
tugas statistika karena dalam setiap penelitian, kesimpulan
inilah yang diinginkan. Statistika inferensial harus berdasar pada statistika
deskriptif, sehingga kedua-duanya harus ditempuh secara benar agar kita
mendapatkan kegunaan maksimal dari statistika. Statistika
inferensial terdiri
dari statistik parametrik dan
non-parametrik.
Populasi
dan Sampel
Dalam statistika, biasanya kita ingin mempelajari populasi. Anda dapat menganggap suatu populasi sebagai seluruh koleksi orang, hal, atau objek yang diteliti. Untuk mempelajari populasi yang lebih besar, kita memilih sampel. Ide sampling adalah untuk memilih bagian (atau subset) dari populasi yang lebih besar dan meneliti bagian tersebut (sampel) untuk mendapatkan informasi tentang populasi. Data adalah hasil sampling dari suatu populasi . Datum adalah satuan data terkecil.
Tipe Data
Tipe data terdiri dari tipe kualitatif dan tipe kuantitatif.
Tipe data kualitatif adalah tipe data yang paling sederhana, biasanya
tidak berbentuk numerik. Tipe data kualitatif terdiri dari data nominal dan
data ordinal.
Data yang dibuat dengan
memberikan angka pada kategori yang berbeda dimana “angka” tersebut tidak
memiliki arti seperti angka pada umumnya disebut data nominal.
Contoh data nominal misalnya kategori laki-laki dan perempuan yang
disimbolkan dengan angka 0 dan 1. “Angka” tersebut hanya mewakili kategori dan
tidak memilik arti seperti angka pada umumnya.
Data yang dibuat dengan
memberikan angka pada kategori-kategori dimana urutannya memiliki arti disebut
data ordinal.
Contoh data ordinal misalnya ketika kita memberikan angka pada sampel
seperti pendapatan yang diklasifikasikan dengan 1=rendah, 2=sedang, 3=tinggi.
Angka-angka tersebut hanya memiliki arti 1 lebih rendah dari 2, dan 2 lebih
rendah dari 3 atau sebaliknya, 3 lebih tinggi dari 2, dan 2 lebih tinggi dari
1, bukan pendapatan sedang adalah 2 kali
pendapatan rendah atau pendapatan tinggi adalah 3 kali pendapatan rendah. Data ordinal yang sering digunakan dalam
penelitian adalah skala Likert. Contoh skala Likert: 1= sangat setuju, 2=setuju, 3=antara setuju
dan tidak, 4=tidak setuju, 5=sangat tidak setuju.
Tipe data kuantitatif adalah tipe data yang berisi data numerik. Tipe
data ini terdiri dari dua kategori yaitu diskret dan kontinu. Data diskret
diperoleh dengan cara mencacah (menghitung) biasanya adalah bilangan bulat
positif. Data kontinu diperoleh dengan cara mengukur, nilainya berupa bilangan
real.
Karena dibutuhkan banyak waktu dan uang untuk meneliti seluruh populasi, sampling (pengambilan
sampel/contoh) adalah teknik yang sangat praktis. Jika Anda ingin menghitung nilai rata-rata keseluruhan di sekolah Anda, akan
masuk akal untuk
memilih sampel dari siswa
yang menghadiri
sekolah. Data yang dikumpulkan dari sampel akan menjadi nilai rata-rata siswa . Dalam pemilihan presiden, sampel jajak
pendapat dari
1.000 sampai
2.000 orang diambil. Jajak pendapat seharusnya mewakili pandangan dari orang di seluruh negeri.
Dari data sampel, kita dapat menghitung statistik. Statistik adalah angka yang merupakan properti/karakteristik dari sampel. Sebagai contoh, jika kita mempertimbangkan satu kelas matematika untuk menjadi sampel dari populasi semua kelas matematika, maka rata-rata jumlah poin yang diterima oleh siswa di satu kelas matematika tersebut di akhir semester adalah contoh dari statistik. Statistik adalah
estimasi parameter populasi. Parameter adalah angka
yang merupakan
properti/karakteristik dari
populasi. Karena kami menganggap semua
kelas matematika untuk menjadi populasi, maka rata-rata jumlah poin yang diterima per siswa atas semua kelas matematika adalah contoh dari parameter.
Salah satu masalah utama dalam bidang statistik adalah seberapa akurat statistik mengestimasi parameter. Keakuratan sangat tergantung pada seberapa baik sampel mewakili populasi. Sampel harus berisi karakteristik populasi untuk menjadi sampel
yang representatif. Kita tertarik, baik
pada statistik sampel maupun pada parameter
populasi dalam statistika inferensial.
Sebuah variabel, dinotasikan dengan huruf besar seperti X dan
Y, merupakan karakteristik yang diamati untuk setiap orang atau benda di dalam populasi. Variabel dapat berupa numerik atau kategoris. Variabel numerik mengambil nilai-nilai seperti berat dalam pound dan waktu dalam jam. Variabel kategoris menempatkan orang atau benda dalam kategori. Jika kita misalkan X sama dengan jumlah poin yang diterima oleh satu mahasiswa matematika pada akhir semester, maka X
adalah variabel numerik. Jika kita misalkan Y adalah afiliasi partai seseorang seperti Demokrat, Golkar, dll, maka Y adalah variabel kategoris. Data adalah nilai sebenarnya dari variabel. Mereka mungkin berupa nomor atau berupa kata-kata. Datum adalah nilai tunggal dari data.
adalah variabel numerik. Jika kita misalkan Y adalah afiliasi partai seseorang seperti Demokrat, Golkar, dll, maka Y adalah variabel kategoris. Data adalah nilai sebenarnya dari variabel. Mereka mungkin berupa nomor atau berupa kata-kata. Datum adalah nilai tunggal dari data.
Sensus
dan sampling
Sensus,
kadangkala juga disebut cacah jiwa adalah sebuah proses mendapatkan
informasi tentang anggota sebuah populasi (tidak hanya populasi manusia). Sensus digunakan untuk demokrasi (pemilu), pengumpulan pajak, juga
digunakan dalam ekonomi.
Sensus adalah cara pengumpulan data yang dilakukan melalui pencacahan semua unit populasi untuk memperoleh karakteristik suatu populasi pada saat tertentu.
Di Indonesia, sensus dilaksanakan sekurang-kurangnya 10 (sepuluh) tahun
sekali yang meliputi:
- Sensus Penduduk, yang dilaksanakan pada tahun berakhiran angka 0 (nol);
- Sensus Pertanian, yang dilaksanakan pada tahun berakhiran angka 3 (tiga);
- Sensus Ekonomi, yang dilaksanakan pada tahun berakhiran angka 6 (enam).
Manfaat sensus
Pencacahan
dalam sensus penduduk dilaksanakan untuk mengumpulkan karakteristik pokok dan
rinci terhadap seluruh penduduk baik yang bertempat tinggal tetap maupun yang
tidak mempunyai tempat tinggal tetap (tuna wisma, anak buah kapal Indonesia,
manusia/ orang perahu, dan suku terasing). Karakteristik pokok dan rinci
tersebut mencakup karakteristik tentang penduduk, perumahan dan lingkungannya,
dan karakteristik lain yang termasuk dalam lingkup standar bidang kependudukan.
Sensus penduduk terakhir dilaksanakan pada tahun 2010, dengan desain untuk pencacahan lengkap terhadap
perumahan (12 karakteristik) dan penduduk (15 karakteristik).
Pencacahan
dalam sensus pertanian dilaksanakan untuk mengumpulkan karakteristik pokok dan
rinci terhadap seluruh petani, perusahaan pertanian, dan pengukuran obyek
kegiatan statistik pertanian. Karakteristik pokok dan rinci tersebut mencakup
karakteristik petani, tanah, tanaman, kegiatan usaha di bidang pertanian, serta
karakteristik lain yang termasuk dalam lingkup statistik dasar bidang
pertanian.
Pencacahan
dalam sensus ekonomi dilaksanakan untuk mengumpulkan karakteristik pokok dan
rinci terhadap seluruh perusahaan dan kegiatan usaha di bidang ekonomi (kecuali
pertanian) di seluruh wilayah Indonesia baik yang diusahakan secara permanen
maupun tidak permanen termasuk pertambangan dan penggalian, industri
pengolahan, listrik, gas dan air bersih, bangunan dan keuangan, persewaan dan
jasa perusahaan, dan industri jasa. Karakteristik produksi,
pemakaian bahan baku, serta karakteristik lain yang termasuk dalam lingkup
statistik dasar bidang ekonomi.
Kelembagaan
Badan yang mengurusi sensus adalah badan pusat statistik
atau yang lebih dikenal dengan (BPS). BPS merupakan satu-satunya badan resmi
yang dibentuk pemerintah negara republik Indonesia untuk bertugas sebagai
surveier data-data mengenai
penduduk.
Aturan
Pembulatan Bilangan
Dalam
kehidupan sehari-hari kita juga sering ketemu dengan bilangan-bilangan pecahan
yang memiliki angka desimal, dan bilangan dibelakang koma bisa saja tidak sama
antara satu bilangan dengan bilangan lainnya, untuk itu diperlukan aturan dalam
statistik untuk membulatkan bilangan. Demikian aturan pembulatan bilangan dalam
statistik :
Aturan 1,
Jika angka
terkiri dari angka yang harus dihilangkan kurang dari 5,
maka angka
terkanan dari angka yang mendahuluinya tetap (tidak berubah)
Contoh :
50,15 ton
dibulatkan menjadi 50 ton (15
dihilangkan)
(Angka yang
akan dihilangkan 15, angka yang mendahuluinya 0, karena 1
(angka
terkiri dari 15) kurang dari 5 maka angka 15 dihilangkan dan angka 0 tetap).
Aturan 2, Jika angka terkiri
dari angka yang harus dihilangkan lebih dari 5
atau angka 5
diikuti oleh angka-angka bukan nol semua, maka angka terkanan
dari angka
yang mendahuluinya bertambah dengan satu.
Contoh :
50,15002
menit dibulatkan hingga persepuluhan menit terdekat menjadi 50,2
Aturan 3, Jika angka terkiri
dari angka yang harus dihilangkan sama dengan 5 atau
angka 5
diikuti oleh angka-angka nol semua, maka angka terkanan dari angka yang
mendahuluinya
tetap jika angka tsb genap, dan bertambah satu jika angka tsb ganjil.
Contoh :
14,35 gram dibulatkan persepuluhan gram terdekat menjadi 14,4 gram.
(Angka yang akan dihilangkan 5, angka yang
mendahuluinya 3 (ganjil) maka angka
5
dihilangkan, angka 3 ditambah 1, jadi hasil pembulatannya 14,4)
Contoh :
24.5000 cm dibulatkan hingga satuan cm menjadi 24 cm.
(Angka yang
akan dihilangkan 5, angka yang mendahuluinya
4 (genap)
maka angka 5
dihilangkan, angka 4 tetap, jadi hasil pembulatannya 24)
Macam-macam Tabel
Tabel baris-kolom, tabel kontingensi, dan tabel distribusi frekuensi.
Tabel baris
kolom adalah Semua tabel terdiri
dari beberapa baris dan kolom, maka selain tabel baris kolom, yaitu tabel
kontingensi dan tabel distribusi frekuensi juga termasuk pada tabel baris
kolom. Tabel yang lebih tepat disebut tabel baris kolom ini adalah tabel-tabel yang
dibuat selain dari tabel kontingensi dan distribusi frekuensi yaitu tabel yang terdiri
dari baris dan kolom yang mempunyai ciri tidak terdiri dari faktor-faktor yang
terdiri dari beberapa kategori dan bukan merupakan data kuantitatif yang dibuat
menjadi beberapa kelompok.
Contoh:
Misalkan ada data pembelian bahan baku pembuatan produk yang dilakukan oleh perusahaan Z dari tahun 2000-2002. Bahan baku produk tersebut terdiri dari bahan A, B, C dan D yang mempunyai harga berbeda dan setiap tahunnya berubah disesuaikan dengan harga pasar. Pada tahun 2000 perusahaan Z membeli bahan baku A, B, C dan D sebanyak 1083 unit, 1108 unit, 1093 unit dan 1118 unit dengan harga Rp 10.002.344, Rp. 10.000.814, Rp 10.000.914 dan Rp 10.001.914. Tahun 2001 baku A, B, C dan D sebanyak 1127 unit, 1094 unit, 1137 unit dan 1104 unit dengan harga Rp 10.003.078, Rp. 10.000.805, Rp 10.000.905dan Rp 10.001.905. Tahun 2002 baku A, B, C dan D sebanyak 1110 unit, 1130 unit, 1120 unit dan 1140 unit dengan harga Rp 10.002.904, Rp. 10.000.920, Rp 10.001.020dan Rp 10.002.020.
Dengan melihat data yang terurai secara naskah tersebut maka kita akan kebinggungan untuk menggali informasi dari data pembelian bahan baku yang dilakukan oleh perusahaan Z tersebut. Oleh karena itu, kita buat tabel baris kolomnnya.
Tabel kontingensi merupakan bagian dari tabel baris kolom, akan tetapi tabel
ini mempunyai ciri khusus, yaitu untuk menyajikan
data yang terdiri atas dua faktor atau dua variabel, faktor yang satu terdiri
atas b kategori dan lainnya terdiri atas k kategori, dapat dibuat daftar kontingensi berukuran b x k dengan b
menyatakan baris dan k menyatakan kolom.
Contoh:
Misalkan data karyawan perusahaan Z pada tahun 2007. yang disebut karyawan di sini adalah orang yang bekerja di perusahaan Z dari level terendah sampai level manajemen yang semuanya berjumlah 336.416 orang berasal dari lulusan SMA, Diploma 3 dan Strata -1 yang terdiri dari laki-laki dan perempuan. Karyawan laki-laki dengan tingkat pendidikan SMA sebanyak 104.758, D-3 sebanyak 51.459 dan S-1 sebayak 12.116. karyawan perempuan dengan tingkat pendidikan SMA sebanyak 102.795, D-3 sebayak 54.032 dan S-1 sebanyak 11.256.
Untuk menyajikan data yang terurai dalam naskah di atas, sangat cocok apabila kita menggunakan tabel kontingensi. Dimana yang menjadi faktor baris adalah jenis kelamin dengan 2 kategori yaitu pria dan perempuan dan faktor kolom adalah tingkat pendidikan dengan kategori SMA, D3, dan S-1. dengan melihat bayaknya kategori setiap factor maka untuk kasus ini, tabel yang akan kita buat adalah tabel kontingensi 2x3 yaitu dua baris tiga kolom. Dengan kasus yang berbeda tabel kontengensi yang kita buat dapat saja 4x3 atau 4x4 dan sebagainya.
Tabel distribusi frekuensi merupakan bagian
dari tabel baris kolom, akan tetapi tabel ini mempunyai ciri khusus, yaitu untuk menyajikan
data yang terdiri atas satu faktor atau satu variabel, faktor tersebut terdiri atas beberapa kategori yang salah satu kategorinya adalah frekuensi. Tabel
distribusi frekuensi akan dibahas pada bab berikutnya.
Penyajian
Data Dalam Bentuk Diagram
Jumlah
mahasiswa tingkat III pada tiap kelas untuk tahun
ajaran
baru ditunjukkan oleh daftar berikut:
kelas
|
A
|
B
|
C
|
D
|
E
|
jumlah
mahasiswa
|
40
|
30
|
59
|
52
|
45
|
Beberapa
bentuk diagram yang menggambarkan
daftar
tersebut di atas adalah:
1.
Diagram lambang (piktogram)
Data
pada daftar di atas dapat dibuat menjadi dagram lambang berikut:
Kelas
|
Lambang
|
Jumlah
|
A
|
··········
··········
··········
··········
|
40
|
B
|
··········
··········
··········
|
30
|
C
|
··········
··········
··········
··········
··········
·········
|
59
|
D
|
··········
··········
··········
··········
··········
··
|
52
|
E
|
··········
··········
··········
··········
·····
|
45
|
2.
Diagram batang
Ada
dua jenis diagram batang: tegak dan mendatar.
Untuk
daftar di atas diagram batang tegaknya adalah:
3.
Diagram garis
Perhatikan
daftar, maka diagram garisnya sebagai berikut:
4.
Diagram Lingkaran
Persentase
frekuensi tiap kelas dinyatakan dalam persentase luas lingkaran.
Ø data
kelas A:
Ø data
kelas B:
Ø data
kelas C:
Ø data
kelas D:
Ø data
kelas E:
DAFTAR DISTRIBUSI FREKUENSI
1. Membuat Daftar Distribusi Frekuensi
Nilai matematika dari 20 orang mahasiswa di suatu
kelas adalah sebagai berikut:
45
|
67
|
32
|
75
|
56
|
65
|
81
|
47
|
58
|
69
|
66
|
73
|
63
|
76
|
46
|
35
|
58
|
64
|
67
|
59
|
Langkah-langkah membuat daftar distribusi frekuensi:
·
susun data dari yang terkecil sampai yang
terbesar
32
|
35
|
45
|
46
|
47
|
56
|
58
|
58
|
59
|
63
|
64
|
65
|
66
|
67
|
67
|
69
|
73
|
75
|
76
|
81
|
·
Tentukan rentang data (jangkauan)
Rentang = Data terbesar – data
terkecil = 81- 32 = 49
·
Tentukan banyak kelas interval (dengan
aturan Sturges)
Banyak
kelas = 1 + 3,3 log n ; n = banyak data
|
Banyak
kelas harus bilangan bulat (dibulatkan ke atas)
|
Banyak kelas = 1 + 3,3 log 20 = 5,3
=6 (dibulatkan ke atas)
·
Tentukan panjang kelas (p) =
catatan: p harus bilangan bulat, dan biasanya dipilih
bilangan ganjil (dibulatkan ke atas).
·
Pilih batas bawah kelas interval pertama
(nilai data terkecil = 32)
·
Tentukan frekuensi masing-masing kelas
dengan sistem turus.
Nilai
|
Turus
|
Jumlah
mahasiswa
|
32-40
|
||
|
2
|
41-49
|
|||
|
3
|
50-58
|
|||
|
3
|
59-67
|
|||| ||
|
7
|
68-76
|
||||
|
4
|
77-85
|
|
|
1
|
Penyajian data yang dikelompokkan menurut distribusi
frekuensi dapat dinyatakan dengan grafik yang disebut histogram dan jika titik
tengah pada histogram kita hubungkan disebut polygon frekuensi.
polygon frekuensi
|
histogram
|
Hal-hal yang perlu
diketahui dari daftar distribusi frekuensi
§ kelas interval
§ batas bawah kelas interval
yaitu bilangan-bilangan di sebelah kiri kelas interval
§ batas atas kelas interval
yaitu bilangan-bilangan di sebelah kanan kelas interval
§ panjang kelas interval
yaitu selisih positif antara setiap dua tepi bawah berurutan
§ tanda kelas/titik tengah kelas =
½ (batas bawah+batas atas)
§ tepi bawah kelas interval =
batas bawah – 0,5 satuan terkecil
§ tepi atas kelas interval =
batas atas + 0,5 satuan terkecil
2.
Daftar distribusi frekuensi kumulatif
Daftar
ini dibuat berdasarkan daftar distribusi frekuensi yang terdiri dari:
o daftar
distribusi frekuensi kumulatif kurang
dari
o daftar
distribusi frekuensi kumulatif lebih
dari
Dari
data pada tabel berikut
Nilai
|
Frekuensi
|
51-60
|
2
|
61-70
|
8
|
71-80
|
12
|
81-90
|
6
|
91-100
|
2
|
dapat
dibuat distribusi frekuensi kumulatif (DF) kurang dari dan DF lebih dari,
seperti pada tabel di bawah.
DF kumulatif kurang dari
nilai
|
frek
kumulatif fk £
|
£ 50,5
|
0
|
£ 60,5
|
2
|
£ 70,5
|
10
|
£ 80,5
|
22
|
£ 90,5
|
28
|
£ 100,5
|
30
|
Grafik
Grafik
Distribusi frekuensi kumulatif (kurang dari) disebut juga ogif positif.
DF kumulatif lebih dari
nilai
|
frek
kumulatif fk ³
|
³ 50,5
|
30
|
³ 60,5
|
28
|
³ 70,5
|
20
|
³ 80,5
|
8
|
³ 90,5
|
2
|
³ 100,5
|
0
|
Grafik
Grafik
Distribusi frekuensi kumulatif (kurang dari) disebut juga ogif negatif.
1.
Rata-rata (rataan) hitung (
)
n= banyak data
xi= data ke-i
i= 1,2,3,…n
contoh:
Diketahui 10 buah data: 2,2,8,3,3,3,3,2,4,10.
fi= banyaknya data xi
xi= data pada kelompok ke-i
i= 1,2,3,…n
Contoh:
data pada tabel
xi
|
fi
|
2
|
3
|
3
|
4
|
4
|
1
|
8
|
1
|
10
|
1
|
banyaknya
data kelompok ke-i
rataan
data kelompok ke-i
contoh:
Tinggi rata-rata 10 pelajar adalah
162 cm, jika digabung dengan 5 pelajar lain maka tinggi rata-rata 15 pelajar
tersebut adalah 160 cm. Tinggi rata-rata 15 pelajar tersebut adalah …
Jawab:
2.
Modus
Data
dengan frekuensi terbesar.
Contoh:
data pada tabel
xi
|
fi
|
2
|
3
|
3
|
4
|
4
|
1
|
8
|
1
|
10
|
1
|
Datum
x = 3 memiliki frekuensi terbesar (f=4), maka Mo= 3
3. Median
(Me)
Nilai
tengah dari data yang telah disusun berurutan mulai datum terkecil
adalah datum terkecil
adalah datum terbesar
, jika n ganjil
, jika n genap
Contoh:
Data
disusun berurutan
2,2,2,3,3,3,3,4,8,10
n=10
(genap)
4. Kuartil
(Qi)
Nilai
yang membagi sekumpulan data yang telah disusun berurutan menjadi 4 bagian yang
sama banyak.
|
|
|
|
= Kuartil bawah
= Kuartil tengah
= Median
= Kuartil atas
Contoh:
Data telah
disusun terurut:
2 2 2 3 3 3 3 4 8 10
Catatan:
Setiap minggu diktat ini akan di update
Referensi:
1.
Illowsky
Barbara., Dean Susan. 2011. Collaborative
Statistics. Di
download dari http://http://cnx.org/content/col10522/1.39/
pada tanggal 26 Agustus 2011. Maxfield Fondation. Connexion, Rice
University, Houston, Texas.
3.
Pelosi
Marilyn K, Sandifer Theresa M. 2003. Elementary Statistics. John Wiley &
Sons
Tidak ada komentar:
Posting Komentar