Jumat, 07 Oktober 2011

Diktat statistik Dasar


STATISTIKA DASAR
Statistik dan Statistika
Statistika ialah ilmu pengetahuan (cabang matematika terapan) yang mempelajari teknik pengumpulan, penyajian, pengolahan, penganalisaan data, dan penarikan kesimpulan yang benar. Hasil analisis dan pengolahan suatu data disebut statistik. Statistik ini menunjukkan karakteristik data, misalnya rata-rata, median, modus dan lain sebagainya.

Macam-macam Statistika
Statistika dalam pengertian sebagai ilmu dibedakan menjadi dua:
1.       Statistika deskriptif, yaitu ilmu pengetahuan yang mempelajari teknik mengorganisasikan (mengumpulkan,  menyusun) dan meringkas (menyajikan data dalam bentuk kurva atau diagram, serta mengolah dan menganalisis) data sebagaimana adanya tanpa menarik kesimpulan atau generalisasi.  Hasil dari mengolah dan menganalisis data disebut statistik, misalnya rata-rata, median, modus, dan lain sebagainya.
2.       Statistika Inferensial (Induktif), yaitu ilmu pengetahuan yang mempelajari teknik penarikan kesimpulan atau generalisasi dari statistika deskriptif. Statistika inferensial bertujuan menyajikan, menganalisa data dari suatu kelompok (sampel) untuk ditarik kesimpulan-kesimpulan, prinsip-prinsip tertentu yang berlaku bagi kelompok yang lebih besar (populasi).
Statistika inferensial merupakan langkah akhir dari tugas statistika karena dalam setiap penelitian, kesimpulan inilah yang diinginkan. Statistika inferensial harus berdasar pada statistika deskriptif, sehingga kedua-duanya harus ditempuh secara benar agar kita mendapatkan kegunaan maksimal dari statistika. Statistika inferensial terdiri dari statistik parametrik dan non-parametrik.

Populasi dan Sampel
Dalam statistika, biasanya kita ingin mempelajari populasi. Anda dapat menganggap suatu populasi sebagai seluruh koleksi orang, hal, atau objek yang diteliti. Untuk mempelajari populasi yang lebih besar, kita memilih sampel. Ide sampling adalah untuk memilih bagian (atau subset) dari populasi yang lebih besar dan meneliti bagian tersebut (sampel) untuk mendapatkan informasi tentang populasi. Data adalah hasil sampling dari suatu populasi . Datum adalah satuan data terkecil.

Tipe Data
Tipe data terdiri dari tipe kualitatif dan tipe kuantitatif.
Tipe data kualitatif adalah tipe data yang paling sederhana, biasanya tidak berbentuk numerik. Tipe data kualitatif terdiri dari data nominal dan data ordinal.
Data yang dibuat dengan memberikan angka pada kategori yang berbeda dimana “angka” tersebut tidak memiliki arti seperti angka pada umumnya disebut data nominal.
Contoh data nominal misalnya kategori laki-laki dan perempuan yang disimbolkan dengan angka 0 dan 1. “Angka” tersebut hanya mewakili kategori dan tidak memilik arti seperti angka pada umumnya.
Data yang dibuat dengan memberikan angka pada kategori-kategori dimana urutannya memiliki arti disebut data ordinal.
Contoh data ordinal misalnya ketika kita memberikan angka pada sampel seperti pendapatan yang diklasifikasikan dengan 1=rendah, 2=sedang, 3=tinggi. Angka-angka tersebut hanya memiliki arti 1 lebih rendah dari 2, dan 2 lebih rendah dari 3 atau sebaliknya, 3 lebih tinggi dari 2, dan 2 lebih tinggi dari 1, bukan  pendapatan sedang adalah 2 kali pendapatan rendah atau pendapatan tinggi adalah 3 kali pendapatan rendah.  Data ordinal yang sering digunakan dalam penelitian adalah skala Likert. Contoh skala Likert:  1= sangat setuju, 2=setuju, 3=antara setuju dan tidak, 4=tidak setuju, 5=sangat tidak setuju.

Tipe data kuantitatif adalah tipe data yang berisi data numerik. Tipe data ini terdiri dari dua kategori yaitu diskret dan kontinu. Data diskret diperoleh dengan cara mencacah (menghitung) biasanya adalah bilangan bulat positif. Data kontinu diperoleh dengan cara mengukur, nilainya berupa bilangan real.


Karena dibutuhkan banyak waktu dan uang untuk meneliti seluruh populasi, sampling (pengambilan sampel/contoh) adalah teknik yang sangat praktis. Jika Anda ingin menghitung nilai rata-rata keseluruhan di sekolah Anda,  akan masuk akal untuk memilih  sampel  dari  siswa yang  menghadiri sekolah. Data yang dikumpulkan dari sampel akan menjadi nilai rata-rata siswa . Dalam pemilihan presiden, sampel  jajak pendapat  dari 1.000  sampai 2.000  orang diambil. Jajak pendapat seharusnya mewakili pandangan dari orang di seluruh negeri.
Dari data sampel, kita dapat menghitung statistik. Statistik adalah angka yang merupakan properti/karakteristik dari sampel. Sebagai contoh, jika kita mempertimbangkan satu kelas matematika untuk menjadi sampel dari populasi semua kelas matematika, maka rata-rata jumlah poin yang diterima oleh siswa di satu kelas matematika tersebut di akhir semester adalah contoh dari statistik. Statistik   adalah  estimasi   parameter   populasi. Parameter  adalah  angka yang  merupakan properti/karakteristik dari populasi. Karena  kami menganggap  semua kelas  matematika untuk menjadi  populasi, maka rata-rata jumlah poin yang diterima per siswa atas semua kelas matematika adalah contoh dari parameter.
Salah satu masalah utama dalam bidang statistik adalah seberapa akurat statistik mengestimasi  parameter. Keakuratan sangat  tergantung pada seberapa baik  sampel mewakili populasi. Sampel harus berisi karakteristik  populasi  untuk  menjadi  sampel yang representatif. Kita tertarik,  baik  pada  statistik sampel  maupun pada parameter populasi dalam statistika inferensial.
Sebuah variabel, dinotasikan dengan huruf besar seperti X  dan Y, merupakan karakteristik yang diamati untuk setiap orang atau benda di dalam populasi. Variabel dapat berupa numerik atau kategoris. Variabel numerik mengambil nilai-nilai  seperti berat dalam pound dan waktu dalam jam. Variabel kategoris menempatkan orang atau benda dalam kategori. Jika kita misalkan X sama dengan jumlah poin yang diterima oleh satu mahasiswa matematika pada akhir semester, maka X
adalah variabel 
numerik.  Jika kita misalkan  Y  adalah afiliasi partai seseorang seperti  Demokrat,  Golkar,  dll,  maka  Y  adalah  variabel  kategoris. Data adalah nilai sebenarnya dari  variabel. Mereka mungkin berupa nomor atau berupa kata-kata. Datum adalah nilai tunggal dari data.

Sensus dan sampling
Sensus, kadangkala juga disebut cacah jiwa adalah sebuah proses mendapatkan informasi tentang anggota sebuah populasi (tidak hanya populasi manusia). Sensus digunakan untuk demokrasi (pemilu), pengumpulan pajak, juga digunakan dalam ekonomi.
Sensus  adalah  cara  pengumpulan  data yang  dilakukan  melalui pencacahan  semua  unit  populasi  untuk  memperoleh  karakteristik  suatu  populasi  pada saat  tertentu.  Di Indonesia, sensus  dilaksanakan  sekurang-kurangnya  10 (sepuluh)  tahun sekali  yang  meliputi:
  1. Sensus Penduduk, yang dilaksanakan pada tahun berakhiran angka 0 (nol);
  2. Sensus Pertanian, yang dilaksanakan pada tahun berakhiran angka 3 (tiga);
  3. Sensus Ekonomi, yang dilaksanakan pada tahun berakhiran angka 6 (enam).
Manfaat sensus
Pencacahan dalam sensus penduduk dilaksanakan untuk mengumpulkan karakteristik pokok dan rinci terhadap seluruh penduduk baik yang bertempat tinggal tetap maupun yang tidak mempunyai tempat tinggal tetap (tuna wisma, anak buah kapal Indonesia, manusia/ orang perahu, dan suku terasing). Karakteristik pokok dan rinci tersebut mencakup karakteristik tentang penduduk, perumahan dan lingkungannya, dan karakteristik lain yang termasuk dalam lingkup standar bidang kependudukan. Sensus penduduk terakhir dilaksanakan pada tahun 2010, dengan desain untuk pencacahan lengkap terhadap perumahan (12 karakteristik) dan penduduk (15 karakteristik).
Pencacahan dalam sensus pertanian dilaksanakan untuk mengumpulkan karakteristik pokok dan rinci terhadap seluruh petani, perusahaan pertanian, dan pengukuran obyek kegiatan statistik pertanian. Karakteristik pokok dan rinci tersebut mencakup karakteristik petani, tanah, tanaman, kegiatan usaha di bidang pertanian, serta karakteristik lain yang termasuk dalam lingkup statistik dasar bidang pertanian.
Pencacahan dalam sensus ekonomi dilaksanakan untuk mengumpulkan karakteristik pokok dan rinci terhadap seluruh perusahaan dan kegiatan usaha di bidang ekonomi (kecuali pertanian) di seluruh wilayah Indonesia baik yang diusahakan secara permanen maupun tidak permanen termasuk pertambangan dan penggalian, industri pengolahan, listrik, gas dan air bersih, bangunan dan keuangan, persewaan dan jasa perusahaan, dan industri jasa. Karakteristik produksi, pemakaian bahan baku, serta karakteristik lain yang termasuk dalam lingkup statistik dasar bidang ekonomi.
Kelembagaan
Badan yang mengurusi sensus adalah badan pusat statistik atau yang lebih dikenal dengan (BPS). BPS merupakan satu-satunya badan resmi yang dibentuk pemerintah negara republik Indonesia untuk bertugas sebagai surveier data-data mengenai penduduk.

Aturan Pembulatan Bilangan
Dalam kehidupan sehari-hari kita juga sering ketemu dengan bilangan-bilangan pecahan yang memiliki angka desimal, dan bilangan dibelakang koma bisa saja tidak sama antara satu bilangan dengan bilangan lainnya, untuk itu diperlukan aturan dalam statistik untuk membulatkan bilangan. Demikian aturan pembulatan bilangan dalam statistik :
Aturan 1,
Jika angka terkiri dari angka yang harus dihilangkan kurang dari 5,
maka angka terkanan dari angka yang mendahuluinya tetap (tidak berubah)
Contoh :
50,15 ton dibulatkan menjadi  50 ton (15 dihilangkan)
(Angka yang akan dihilangkan 15, angka yang mendahuluinya 0, karena 1
(angka terkiri dari 15) kurang dari 5 maka angka 15 dihilangkan dan angka 0 tetap).
Aturan 2, Jika angka terkiri dari angka yang harus dihilangkan lebih dari 5
atau angka 5 diikuti oleh angka-angka bukan nol semua, maka angka terkanan
dari angka yang mendahuluinya bertambah dengan satu.
Contoh :
50,15002 menit dibulatkan hingga persepuluhan menit terdekat menjadi 50,2
Aturan 3, Jika angka terkiri dari angka yang harus dihilangkan sama dengan 5 atau
angka 5 diikuti oleh angka-angka nol semua, maka angka terkanan dari angka yang
mendahuluinya tetap jika angka tsb genap, dan bertambah satu jika angka tsb ganjil.
Contoh : 14,35 gram dibulatkan persepuluhan gram terdekat menjadi 14,4 gram.
 (Angka yang akan dihilangkan 5, angka yang mendahuluinya 3 (ganjil) maka angka
5 dihilangkan, angka 3 ditambah 1, jadi hasil pembulatannya  14,4)
Contoh : 24.5000 cm dibulatkan hingga satuan cm menjadi 24 cm.
(Angka yang akan dihilangkan 5, angka yang mendahuluinya  4 (genap)
maka angka 5 dihilangkan, angka 4 tetap, jadi hasil pembulatannya 24)

Macam-macam Tabel
Tabel baris-kolom, tabel kontingensi, dan tabel distribusi frekuensi.

Tabel baris kolom adalah Semua tabel terdiri dari beberapa baris dan kolom, maka selain tabel baris kolom, yaitu tabel kontingensi dan tabel distribusi frekuensi juga termasuk pada tabel baris kolom. Tabel yang lebih tepat disebut tabel baris kolom ini adalah tabel-tabel yang dibuat selain dari tabel kontingensi dan distribusi frekuensi yaitu tabel yang terdiri dari baris dan kolom yang mempunyai ciri tidak terdiri dari faktor-faktor yang terdiri dari beberapa kategori dan bukan merupakan data kuantitatif yang dibuat menjadi beberapa kelompok.

Contoh:
Misalkan ada data pembelian bahan baku pembuatan produk yang dilakukan oleh perusahaan Z dari tahun 2000-2002. Bahan baku produk tersebut terdiri dari bahan A, B, C dan D yang mempunyai harga berbeda dan setiap tahunnya berubah disesuaikan dengan harga pasar. Pada tahun 2000 perusahaan Z membeli bahan baku A, B, C dan D sebanyak 1083 unit, 1108 unit, 1093 unit dan 1118 unit dengan harga Rp 10.002.344, Rp. 10.000.814, Rp 10.000.914 dan Rp 10.001.914. Tahun 2001 baku A, B, C dan D sebanyak 1127 unit, 1094 unit, 1137 unit dan 1104 unit dengan harga Rp 10.003.078, Rp. 10.000.805, Rp 10.000.905dan Rp 10.001.905. Tahun 2002 baku A, B, C dan D sebanyak 1110 unit, 1130 unit, 1120 unit dan 1140 unit dengan harga Rp 10.002.904, Rp. 10.000.920, Rp 10.001.020dan Rp 10.002.020.

Dengan melihat data yang terurai secara naskah tersebut maka kita akan kebinggungan untuk menggali informasi dari data pembelian bahan baku yang dilakukan oleh perusahaan Z tersebut. Oleh karena itu, kita buat tabel baris kolomnnya.


Tabel kontingensi merupakan bagian dari tabel baris kolom, akan tetapi tabel ini mempunyai ciri khusus, yaitu untuk menyajikan data yang terdiri atas dua faktor atau dua variabel, faktor yang satu terdiri atas b kategori dan lainnya terdiri atas k kategori, dapat dibuat daftar kontingensi berukuran b x k dengan b menyatakan baris dan k menyatakan kolom.

Contoh:
Misalkan data karyawan perusahaan Z pada tahun 2007. yang disebut karyawan di sini adalah orang yang bekerja di perusahaan Z dari level terendah sampai level manajemen yang semuanya berjumlah 336.416 orang berasal dari lulusan SMA, Diploma 3 dan Strata -1 yang terdiri dari laki-laki dan perempuan. Karyawan laki-laki dengan tingkat pendidikan SMA sebanyak 104.758, D-3 sebanyak 51.459 dan S-1 sebayak 12.116. karyawan perempuan dengan tingkat pendidikan SMA sebanyak 102.795, D-3 sebayak 54.032 dan S-1 sebanyak 11.256.

Untuk menyajikan data yang terurai dalam naskah di atas, sangat cocok apabila kita menggunakan tabel kontingensi. Dimana yang menjadi faktor baris adalah jenis kelamin dengan 2 kategori yaitu pria dan perempuan dan faktor kolom adalah tingkat pendidikan dengan kategori SMA, D3, dan S-1. dengan melihat bayaknya kategori setiap factor maka untuk kasus ini, tabel yang akan kita buat adalah tabel kontingensi 2x3 yaitu dua baris tiga kolom. Dengan kasus yang berbeda tabel kontengensi yang kita buat dapat saja 4x3 atau 4x4 dan sebagainya.

Tabel distribusi frekuensi merupakan bagian dari tabel baris kolom, akan tetapi tabel ini mempunyai ciri khusus, yaitu untuk menyajikan data yang terdiri atas satu faktor atau satu variabel, faktor tersebut terdiri atas beberapa kategori yang salah satu kategorinya adalah frekuensi. Tabel distribusi frekuensi akan dibahas pada bab berikutnya.













Penyajian Data Dalam Bentuk Diagram
Jumlah mahasiswa tingkat III pada tiap kelas untuk tahun
ajaran baru ditunjukkan oleh daftar berikut:
kelas
A
B
C
D
E
jumlah mahasiswa
40
30
59
52
45

Beberapa bentuk diagram yang menggambarkan
daftar tersebut di atas adalah:
1. Diagram lambang (piktogram)
Data pada daftar di atas dapat dibuat menjadi dagram lambang berikut:
Kelas
Lambang
Jumlah
A
··········
··········
··········
··········
40
B
··········
··········
··········
30
C
··········
··········
··········
··········
··········
·········
59
D
··········
··········
··········
··········
··········
··
52
E
··········
··········
··········
··········
·····
45








2. Diagram batang
Ada dua jenis diagram batang: tegak dan mendatar.
Untuk daftar di atas diagram batang tegaknya adalah:

3. Diagram garis
Perhatikan daftar, maka diagram garisnya sebagai berikut:






4. Diagram Lingkaran
Persentase frekuensi tiap kelas dinyatakan dalam persentase luas lingkaran.

Ø  data kelas A:
Ø  data kelas B:
Ø  data kelas C:
Ø  data kelas D:
Ø  data kelas E:






DAFTAR DISTRIBUSI FREKUENSI
1. Membuat Daftar Distribusi Frekuensi
Nilai matematika dari 20 orang mahasiswa di suatu kelas adalah sebagai berikut:
45
67
32
75
56
65
81
47
58
69
66
73
63
76
46
35
58
64
67
59
Langkah-langkah membuat daftar distribusi frekuensi:
·         susun data dari yang terkecil sampai yang terbesar
32
35
45
46
47
56
58
58
59
63
64
65
66
67
67
69
73
75
76
81
·         Tentukan rentang data (jangkauan)
Rentang = Data terbesar – data terkecil = 81- 32 = 49
·         Tentukan banyak kelas interval (dengan aturan Sturges)
Banyak kelas = 1 + 3,3 log n ; n = banyak data
Banyak kelas harus bilangan bulat (dibulatkan ke atas)
Banyak kelas = 1 + 3,3 log 20 = 5,3 =6 (dibulatkan ke atas)
·         Tentukan panjang kelas (p) =
catatan: p harus bilangan bulat, dan biasanya dipilih bilangan ganjil (dibulatkan ke atas).
·         Pilih batas bawah kelas interval pertama (nilai data terkecil = 32)
·         Tentukan frekuensi masing-masing kelas dengan sistem turus.



Nilai
Turus
Jumlah mahasiswa
32-40
||
2
41-49
|||
3
50-58
|||
3
59-67
|||| ||
7
68-76
||||
4
77-85
|
1
Penyajian data yang dikelompokkan menurut distribusi frekuensi dapat dinyatakan dengan grafik yang disebut histogram dan jika titik tengah pada histogram kita hubungkan disebut polygon frekuensi.
polygon frekuensi
histogram



Hal-hal yang perlu diketahui dari daftar distribusi frekuensi
§  kelas interval
§  batas bawah kelas interval yaitu bilangan-bilangan di sebelah kiri kelas interval
§  batas atas kelas interval yaitu bilangan-bilangan di sebelah kanan kelas interval
§  panjang kelas interval yaitu selisih positif antara setiap dua tepi bawah berurutan
§  tanda kelas/titik tengah kelas = ½ (batas bawah+batas atas)
§  tepi bawah kelas interval = batas bawah – 0,5 satuan terkecil
§  tepi atas kelas interval = batas atas + 0,5 satuan terkecil
2. Daftar distribusi frekuensi kumulatif
      Daftar ini dibuat berdasarkan daftar distribusi frekuensi yang terdiri dari:
o   daftar distribusi frekuensi kumulatif kurang dari
o   daftar distribusi frekuensi kumulatif lebih dari
Dari data pada tabel berikut
Nilai
Frekuensi
51-60
2
61-70
8
71-80
12
81-90
6
91-100
2
dapat dibuat distribusi frekuensi kumulatif (DF) kurang dari dan DF lebih dari, seperti pada tabel di bawah.
DF kumulatif kurang dari
nilai
frek kumulatif fk £
£ 50,5
0
£ 60,5
2
£ 70,5
10
£ 80,5
22
£ 90,5
28
£ 100,5
30
Grafik
Grafik Distribusi frekuensi kumulatif (kurang dari) disebut juga ogif positif.
DF kumulatif lebih dari
nilai
frek kumulatif fk ³
³ 50,5
30
³ 60,5
28
³ 70,5
20
³ 80,5
8
³ 90,5
2
³ 100,5
0
Grafik
Grafik Distribusi frekuensi kumulatif (kurang dari) disebut juga ogif negatif.


1.       Rata-rata (rataan) hitung ( )
n= banyak data
xi= data ke-i
i= 1,2,3,…n
contoh:
Diketahui 10 buah data: 2,2,8,3,3,3,3,2,4,10.
 
fi= banyaknya data xi
xi= data pada kelompok ke-i
i= 1,2,3,…n
Contoh:
data pada tabel
xi
fi
2
3
3
4
4
1
8
1
10
1

banyaknya data kelompok ke-i
rataan data kelompok ke-i
contoh:
Tinggi rata-rata 10 pelajar adalah 162 cm, jika digabung dengan 5 pelajar lain maka tinggi rata-rata 15 pelajar tersebut adalah 160 cm. Tinggi rata-rata 15 pelajar tersebut adalah …
Jawab:

2.       Modus
Data dengan frekuensi terbesar.
Contoh:
data pada tabel
xi
fi
2
3
3
4
4
1
8
1
10
1

Datum x = 3 memiliki frekuensi terbesar (f=4), maka Mo= 3
3.       Median (Me)
Nilai tengah dari data yang telah disusun berurutan mulai datum terkecil
adalah datum terkecil
adalah datum terbesar
, jika n ganjil
, jika n genap
Contoh:
Data disusun berurutan
2,2,2,3,3,3,3,4,8,10
n=10 (genap)
4.       Kuartil (Qi)
Nilai yang membagi sekumpulan data yang telah disusun berurutan menjadi 4 bagian yang sama banyak.




                                                                                                                   




= Kuartil bawah
= Kuartil tengah = Median
= Kuartil atas
Contoh:
Data telah disusun terurut:
2              2              2              3              3              3              3              4              8              10

                                                                                                                            





Catatan: Setiap minggu diktat ini akan di update
 Referensi:
1.       Illowsky Barbara., Dean Susan. 2011. Collaborative Statistics. Di download dari http://http://cnx.org/content/col10522/1.39/  pada tanggal 26 Agustus 2011. Maxfield Fondation. Connexion, Rice University, Houston, Texas.
2.       http://sensuspenduduk.blogspot.com/. Diakses pada tanggal 13 September 2011.
3.       Pelosi Marilyn K, Sandifer Theresa M. 2003. Elementary Statistics. John Wiley & Sons
4.       http://computerstatistics.blogspot.com/. Diakses pada tanggal 27 September 2011.

Tidak ada komentar:

Posting Komentar