Sapto Condro loves Science and Technology

Catatan seorang pelajar yang tertidur…

Pemilu Indonesia: Survei, Quick Count dan Exit Polls

Hari ini hari pemilihan anggota legislatif dalam rangkaian Pemilu Indonesia tahun 2014. Pada tahun 2004, banyak pimpinan partai politik yang membuat klaim angkat memperoleh sekian persen suara atau sekian persen kursi. Sebetulnyaklaim tersebut dapat dibuktikan dengan uji hipotesis berdasarkan statistik. Akan tetapi, saat itu, lembaga survei politik belum banyak. Tahun 2009, kemampuan statistika dipakai oleh beberapa lembaga survei untuk membuat “quick count” atau hitung cepat dan “exit polls” untuk memperkirakan hasil Pemilu.

 

Pada saat itu, sejumlah pimpinan partai politik begitu gagap dengan penggunaan sains dalam politik, dalam hal ini matematika atau statistika. Sebagian mengeluarkan pernyataan bahwa survei ini survei bayaran partai lawan atau data direkayasa. Sebagian lain membuat survei yang tidak ilmiah, yang bertujuan menyenangkan pimpinan parpol tapi sama sekali tidak bisa menggambarkan opini publik. Sebagian pemakai internet membuat internet polling di website dan blog.

 

Posting saya kali ini adalah tentang penjelasan bagaimana suatu survei ilmiah dibuat. Juga ada penjelasan apa itu “quick count” dan “exit polls”. Pada survei ilmiah, harus ada penjelasan mengenai tingkat kepercayaan, batas kesalahan dan jumlah sampel, serta bagaimana caranya survei atau polling dilakukan.

***

Istilah-istilah yang dipakai dalam Pemilu Indonesia dari 2004 hingga 2014:

  • Survei (politik) adalah suatu jajak pendapat pada sejumlah orang sebagai untuk memperkirakan opini publik dari suatu populasi. Pada survei ilmiah, pengambilan sampel dari 2000 orang secara acak terkendali bisa menggambarkan opini publik dari populasi 100 juta orang. (wiki tentang survey: en,de,id)
  • Survei menjelang pemilihan adalah survei yang dilakukan sebelum pemilihan umum atau pemilihan lain seperti pilkada, pilgub, dll. Survei menjelang pemilihan biasa dilakukan untuk menghitung elektabilitas suatu partai atau orang peserta pemilihan. Dari wiki Pemilu 2014, sejumlah survei ini bisa dilihat hasilnya.
  • Hasil penghitungan suara sementara adalah hasil penghitungan suara yang dilakukan KPU dan panitia pemilihan, dari tingkat TPS, kecamatan, kota/kabupaten/provinsi, hingga pusat. Pada tahun 2004 dan 2009, ada IT KPU yang menyajikan hasil penghitungan suara sementara di website. Ini bukan survei dan bukan polling, walau secara matematis bisa saja diperlakukan sebagai suatu survei.
  • Quick Count atau Hitung Cepat adalah metode pengambilan sampel dari beberapa tempat pemungutan suara (TPS) untuk memperkirakan hasil Pemilu. Yang menjadi sampel pada quick count adalah hasil TPS, bukan orang. Jadi dari sebagian TPS, misalnya 2000 TPS,  kita bisa memprediksi hasil dari seluruh populasi, yaitu 550 ribu TPS atau lebih.
  • Exit Polls adalah jajak pendapat dari orang-orang yang telah selesai mencoblos di TPS. Yang menjadi sampel pada exit polls adalah orang. Pada exit polls, selain pertanyaan apa partai yang dipilih, peserta polling juga bisa ditanya mengenai identitasnya (agama, umur, tingkat pendidikan, dll) dan opini mengenai pemilu, seperti apa harapan ke depan, siapa presiden yang akan dipilih, pemilu sebelumnya memilih apa, dll. Dari exit polls, sampel 2000 orang bisa dipakai menggambarkan opini publik dari populasi 100 juta orang.
  • Internet Polling adalah pengambilan sampel yang dibuat oleh website atau blog. Ini bukan survei ilmiah karena pengambilan sampel tidak bisa terkendali: apakah satu orang memilih lebih dari satu kali, bagaimana penyebaran geografis peserta polling, dll. Internet polling cukup marak pada Pemilu 2004 dan 2009. Saat itu berdasarkan internet polling, PKS mendapat lebih dari 40% suara.
  • SMS Polling adalah pengambilan sampel menggunakan SMS. Ini juga bukan survei ilmiah, dengan alasan yang sama dengan internet polling.

***

Apa itu survei ilmiah? Suatu survei politik itu ilmiah jika pengambilan sampel dilakukan secara acak dan batas-batas yang jelas (terkendali). Acak (random) itu maksudnya tidak ada pola.  tiada hubungan kausalitas dan tiada hubungan koherensi (wiki: en,de). Contoh hal-hal yang tidak acak, adalah pengambilan sampel dilakukan hanya pada golongan tertentu atau hanya pada daerah tertentu. Polling di laman internet dan via SMS bisa menyebabkan hal-hal yang tidak acak karena pesertanya bisa saja hanya dari golongan tertentu. Batas yang jelas (terkendali) pada suatu survei yang dimaksud adalah seperti ini

  • Berapa jumlah sampelnya? Mengapa?
  • Bagaimana cara pengambilan sampel? Mengapa?
  • Rentang waktu kapan pengambilan sampel diambil.
  • Berapa jumlah sampel di daerah ini dan di daerah itu? Mengapa?
  • Berapa jumlah sampel pria dan yang wanita? Mengapa?

Pada pengambilan sampel secara acak sederhana (simple random sampling, wiki: en), kita bisa mengambil sampel sejumlah tertentu misalnya 2000. Lalu kita bisa menghitung rata-rata atau proporsi suara pilihan politik. Pelaku survei tinggal bertanya kepada 2000 orang yang ditemui secara acak. Akan tetapi cara ini menyimpan kelemahan. Indonesia memiliki kondisi geografis tertentu dan penyebaran penduduk khas. Jika metode acak sederhana yang dipakai, penyurvei bisa bertanya secara acak di daerah ini namun lupa bertanya di daerah lain. Akibatnya hasil survei belum tentu menggambarkan opini publik. Cara lain adalah dengan menggunakan pengambilan sampel  secara acak berjenjang (stratified random sampling, wiki: en,de). Contoh:

  • Pada pengambilan sampel, di provinsi ini sampel diambil sekian dan di tempat lain berbeda, sesuai proporsi jumlah penduduk. Begitu pula proporsi di kota ini dan di kabupaten itu.
  • Proporsi kota dan desa juga diperhatikan, misalnya sampel diambil di 60% desa dan 40% kelurahan (di kota) berdasarkan proporsi penduduk.
  • Proporsi pria dan wanita juga diperhatikan, misalnya sample pria dan sampel wanita harus sama (50:50).

Dengan metode pengambilan sampel secara acak berjenjang ini, opini publik bisa digambarkan menurut distribusi wilayah, gender, dan geografis.

***

Berapa jumlah sampel yang harus diambil? Jumlah sampel yang diambil itu tergantung seberapa akurat kita ingin memperkirakan seluruh populasi. Prinsipnya ada dua:

  • Semakin banyak sampel, semakin akurat
  • Semakin banyak sampel, semakin mahal biaya survei

Menurut statistika, jumlah sampel itu tergantung seberapa besar batas kesalahan (margin of error) dan tingkat kepercayaan (confidence level) yang kita tetapkan. Rumusnya ada di bawah.

***

Apa itu batas kesalahan? Batas kesalahan atau margin of error adalah rentang kesalahan pada hasil suatu pengambilan sampel (wiki: en,id). Misalnya pada survei politik, ada tulisan margin of error 2%, sedangkan PDI-P mendapat 19%, Golkar 14%, PKS 5% , dll. Itu artinya PDI-P suaranya bisa meleset plus-minus 2%, sehingga suara PDI-P berkisar 17 hingga 21%. Sedangkan Golkar antara 12 hingga 16%. Lalu PKS antara 3 hingga  7%. Hubungan antara batas kesalahan dengan jumlah sampel akan dijelaskan pada rumus di bawah.

***

Apa itu tingkat kepercayaan dan selang kepercayaan? Tingkat kepercayaan (confidence level) dan selang kepercayaan (confidence interval) saling berhubungan. Hal ini bisa dijelaskan dengan gambar Distribusi Gaussian (dari website National Curve Bank) berikut ini.

Distribusi Gaussian

Distribusi Gaussian

Pada distribusi normal atau Gaussian, terdapat kurva berbentuk bel seperti pada gambar. Di situ terdapat angka rata-rata yaitu \mu dan simpangan baku yaitu  \sigma . Pada gambar, tingkat kepercayaan menunjukkan luas di bawah kurva Gaussian antara suatu rentang, yaitu selang kepercayaan. Menurut gambar, pada tingkat kepercayaan 95,44%, terdapat selang kepercayaan antara \mu - 2\sigma dan \mu + 2\sigma, yang berarti hasil sampling bisa meleset sekitar 2 kali simpangan baku dari angka rata-rata.

 

Di sini selang kepercayaan (confidence interval) menunjukkan seberapa jauh hasil sampling boleh menyimpang untuk tetap dipercaya. Tingkat kepercayaan (confidence level) menunjukkan probabilitas atau kemungkinan suatu hasil sampling berada pada selang kepercayaan. Silahkan baca buku probabilistika dan statistika dasar untuk penjelasan yang lebih baik dan kalau malas silahkan baca wiki: en,de,id.

 

Untuk meningkatkan tingkat kepercayaan, selang kepercayaan harus diperlebar. Berarti hasilnya harus semakin menyimpang dari angka rata-rata, dong? Berarti makin besar saja batas kesalahannya, dong? Ya, betul, akan tetapi jika simpangan \sigma kecil, memperbesar selang kepercayaan belum tentu menambah galat atau error. Perhitungannya pada rumus di bawah ini.

***

Rumus ini, adalah rumus mencari batas kesalahan (margin of error), pada survei.
e = \frac{k}{2}\cdot \sigma_{\bar x} =\frac{k\cdot\sigma}{2\cdot\sqrt{n}}

e = batas kesalahan
k = kelipatan simpangan terhadap rata-rata, yang tergantung tingkat/selang kepercayaan.
\sigma_{\bar x} = kesalahan baku (standard error), dari rata-rata (of the mean)
\sigma = simpangan baku (standard deviation) menurut distribusi normal atau Gaussian.
n = jumlah sampel

 

Dari rumus di atas, dapat dicari hubungan antara berapa batas kesalahan yang dimaklumi dan berapa jumlah sampel yang diinginkan. Semakin besar jumlah sampel, maka semakin kecil kesalahannya. Selain itu, tingkat kepercayaan (confidence level) dan selang kepercayaan (confidence interval) berhubungan dengan besarnya k.

  • k = 1 setara dengan selang kepercayaan \pm 1 dan tingkat kepercayaan 68,26%
  • k =1,96 setara dengan tingkat kepercayaan 95% dan selang kepercayaan \pm 1,96
  • k = 2 setara dengan selang kepercayaan \pm 2 dan tingkat kepercayaan 95,44%
  • k = 2,58 setara dengan tingkat kepercayaan 99% dan selang kepercayaan \pm 2,58
  • k = 3 setara dengan selang kepercayaan \pm 3 dan tingkat kepercayaan 99,74%

***

Contoh pertama:
Hasil exit polls dari Center for Strategic and International Studies (CSIS) dan Cyrus Network, 9 April 2014 (dari berita Antara).
Jumlah sampel 8000 orang. Berapa batas kesalahannya (margin of error)?

Jika tingkat kepercayaan 95%, maka selang kepercayaan \pm 1,96.
e = \frac{1,96}{2}\cdot\sigma_{\bar x} =\frac{1,96\cdot{1}}{2\cdot\sqrt{8000}} = 0,011
Batas kesalahannya adalah 0,011 = 1,1%.

Jika tingkat kepercayaan 99%, maka selang kepercayaan \pm 2,58.
e = \frac{2,58}{2}\cdot\sigma_{\bar x} =\frac{2,58\cdot{1}}{2\cdot\sqrt{8000}} = 0,0144
Batas kesalahannya adalah 0,0144 = 1,44%.

Margin of error yang kecil, tidak lebih dari 1,5%. Lumayan akurat.

***

Contoh kedua:
Hasil quick count dari Jaringan Suara Indonesia (JSI), 9 April 2014 (dari berita KOMPAS).
Jumlah sampel 2000 TPS. Berapa batas kesalahannya (margin of error)?

Jika tingkat kepercayaan 95%, maka selang kepercayaan \pm 1,96.
e = \frac{1,96}{2}\cdot\sigma_{\bar x} =\frac{1,96\cdot{1}}{2\cdot\sqrt{2000}} = 0,022
Batas kesalahannya adalah 0,022 = 2,2%.

Jika tingkat kepercayaan 99%, maka selang kepercayaan \pm 2,58.
e = \frac{2,58}{2}\cdot\sigma_{\bar x} =\frac{2,58\cdot{1}}{2\cdot\sqrt{2000}} = 0,029
Batas kesalahannya adalah 0,029 = 2,9%.

Margin of error di bawah 3%.

***

Contoh ketiga:
Joko ingin membuka usaha survei politik. Dia ingin melakukan survei secara akurat terpercaya. Dia berpikir tingkat kepercayaan 95% dan kalau bisa batas kesalahannya 1% saja. Berapa sampel minimumnya?

Jika tingkat kepercayaan 95%, maka selang kepercayaan \pm 1,96.
0,01 =\frac{1,96 \cdot {1}}{2 \cdot \sqrt{n}}
maka
n = (\frac{1,96}{2 \cdot {0,01}})^2 = 9604

Jadi jumlah sampel yang harus diambil adalah 9604.
Wah, banyak sekali. Joko pun bingung bagaimana menggaji orang buat survei untuk seluruh Indonesia. Biaya perjalanan mereka juga besar. Joko pun berpikir bagaimana kalau batas kesalahannya jadi 3% saja, jadi jumlah sampel cukup 2000 saja.

***

Begitulah hubungan antara jumlah sampel dan batas kesalahan (margin of error) pada suatu survei ilmiah. Jadi pada survei menjelang Pemilu, “exit polls” maupun “quick count”, kita sebagai pembaca atau penonton berita harus kritis dengan bertanya berapa jumlah sampel, batas kesalahan, dan tingkat kepercayaan. Tentu saja kita harus kritis untuk mengetahui bagaimana juga survei dilakukan, misalnya stratified random sampling (acak berjenjang) atau tidak. Kapan survei dilakukan juga perlu diketahui.

 

Nah, kalau ada pimpinan partai yang membuat klaim partainya akan memperoleh sekian suara atau sekian kursi, akan tetapi hasil beberapa survei ilmiah tidak menunjukkan hasil sesuai kata-kata pimpinan parpol, itu artinya orang ini tidak memiliki argumentasi ilmiah.

 

Begitu pula, jika ada organisasi jadi-jadian yang biasanya dibentuk oleh suatu partai politik, membuat suatu survei. Akan tetapi dia tidak mencantumkan jumlah sampel, batas kesalahan (margin of error), tingkat kepercayaan, serta bagaimana dan kapan survei diadakan. Itu artinya survei ini ngawur atau tidak ilmiah.

 

Kalau ada orang yang bilang survei ini rekayasa parpol atau survei itu survei bayaran, kita juga harus kritis. Sekarang ada 56 lembaga survei yang tercatat oleh KPU. Jadi lihat-lihat saja hasil survei dari 56 lembaga tersebut kemudian bandingkan. Serta di wikipedia juga sudah ada yang merangkum survei-survei yang telah dilakukan selama ini. Jangan hanya karena kita tidak suka dengan hasil suatu survei, kita menganggap survei ini ngawur.

 

 ***

Posting ini adalah posting tentang penggunaan statistika dalam dunia politik. Posting serupa dalam dunia perjodohan, bisa dibaca pada “Semua pria sama saja“.

 

Oldenburg, 9 April 2014

iscab.saptocondro

April 9, 2014 Posted by | probabiliscab | , , , | 3 Comments

CMS and DRL

CMS and DRL for EEG electrodes

Last week, I am trying to find out what CMS and DRL in my Emotiv EPOC are. For my experiment(s), those electrodes are used reference (REF) and ground (GND) on EEG cap. From the documents, which are found or given, CMS is used as REF and DRL is used as GND. It is unknown whether that configuration is compulsory or optional.

From Biosemi website, I got good explanation about CMS and DRL.

  • CMS is Common Mode Sense, active electrode
  • DRL is Driven Right Leg, passive electrode

They form a feedback loop for references for Analog-to-Digital Converter (ADC) of other electrodes. The schematic of CMS and DRL from Biosemi is shown below.

Explanation of CMS and DRL from Biosemi website

In my electrical engineering view, as passive electrode, DRL is suitable for ground. CMS, as active electrode, can be treated as reference on the head. Both will perform looping to get references in ADC for other electrodes. The idea is understandable for me.

My curiosity about CMS and DRL can be read on  my other blogs:

Well, I am still hoping that my research is going in the right direction.

Bremen, 11 Februari 2014

iscab.saptocondro
Darah Juang!

Brain Robot Research, a neuroscience blog http://iscabrainrobot.blogspot.com/2014/02/cms-and-drl.html

February 11, 2014 Posted by | Neuroscience | , , | 4 Comments

How seriously is Indonesia doing research on Brain-Computer Interface?

My previous blog post is about Brain-Computer Interface (BCI) research in Bandung, Indonesia (1,2,3). The research is conducted in School of Electrical Engineering and Informatics (STEI) at Institut Teknologi Bandung (ITB). I know some people who has taken part in this Bandung BCI research. However, I wonder what and how are the research outcomes.

Below is the figure of literature study of EEG-based BCI between 2007 and 2011 from Hwang, et al in 2013. The paper is “EEG-Based Brain-Computer Interfaces: A Thorough Literature Survey” in International Journal of Human-Computer Interaction, 29: 814-826 (doi), from Taylor & Francis. The authors are Han-Jeong Hwang, Soobeom Choi and Chang-Hwam Im from Hanyang University in Seoul, Korea, and Soyoung Kim from University of Rochester, New York, USA.

The figure above shows the nationalities of the authors of EEG-based BCI articles between 2007 and 2011. The articles have to be indexed by Web of Science, a database provided by Institute for Scientific Information (ISI, Thompson Scientific, Philadelphia, USA). Conference abstracts and editorials are not included. So the articles are research paper, review paper, feature, brief communication, case report, technical note and chronology.

As we can see from the figure, there are no Indonesian. So Bandung BCI group have never published their research in journals, indexed by ISI. As far as I know, the Bandung BCI group also had a collaboration with the Faculty of Medicine of Universitas Indonesia in Salemba, Jakarta, Indonesia. From some conference papers I have read, Institut Teknologi Telkom (IT Telkom) in Bandung are also doing research on EEG signals processing. But universities and also research institutes in Indonesia have not published scientific articles about EEG-based BCI in reputable journals between 2007 and 2011.

Well, I am Indonesian, currently doing research on EEG-based BCI. I just began my PhD program this September 2013 at Carl von Ossietzky Universität Oldenburg in Germany. So I have not yet published any journal papers. I hope, as an Indonesian, I play important role in international research on Brain-Computer Interface (BCI). In the next literature review, I hope there will be at least one Indonesian and that shall be me.

OK, now I should stop blogging and doing real research. 🙂

Bremen, 6 Desember 2013

iscab.saptocondro
Darah Juang!

via Brain Robot Research, a neuroscience blog http://iscabrainrobot.blogspot.com/2013/12/how-seriously-is-indonesia-doing.html

December 6, 2013 Posted by | Neuroscience | , , , | 4 Comments

SSVEP electrode position, on my head

Since Posterous is killed by Twitter, pictures from my blog posts about standard 10-20 system are gone. The figures are not kept  by Posterous nor sent to Blogger. So I post the pictures again, which were saved by WordPress:

I am wearing EEG cap

The pictures are about EEG electrode placement for SSVEP-BCI, according to 10-20 system (wiki: en,de). EEG is electroencephalography, which is recording of electrical signals from scalp (wiki: en,de,id). SSVEP is steady-state visually evoked potential, which is EEG signal as a response of flickering stimuli with certain frequency (wiki: en). BCI is Brain-Computer Interface (wiki: en,de).

10-20 system for EEG electrode position

The electrode position for SSVEP BCI  is Pz, PO3, PO4, O1, Oz, O2, O9 and O10. The ground is AFz and the reference is one ear lobe, either left or right. This position is used on my master thesis (book,slide).

Bremen, 6 Desember 2013

iscab.saptocondro

P.S. Now, I am thinking about EEG electrode position, for BCI, based on motor imagery.

via Brain Robot Research, a neuroscience blog http://iscabrainrobot.blogspot.com/2013/12/ssvep-electrode-position-on-my-head.html

December 6, 2013 Posted by | Neuroscience | , , , , | 13 Comments

Kesaktian Mahasiswa

Seorang mahasiswa harus memiliki jurus-jurus sakti dalam studinya. Di bawah ini adalah beberapa jurus yang perlu dipelajari mahasiswa.

Ctrl+C
Jurus ini dipakai untuk menyerap jurus lawan, tanpa menghilangkan ilmu-ilmu yang dimiliki lawan.

Ctrl+X
Jurus ini dipakai untuk menyerap jurus lawan, sekaligus menghilangkan ilmu-ilmu yang dimiliki lawan.

Ctrl+V
Jurus ini dipakai untuk mengeluarkan jurus-jurus lawan yang telah diserap tadi.

Ctrl+Shift+V
Jurus ini dipakai untuk mengeluarkan hanya inti dari jurus-jurus lawan yang telah diserap tadi.

Pada kenyataannya, ada beberapa urutan yang harmonis dalam mengeluarkan jurus-jurus tadi. Kalau tidak urut, nah, berarti perlu ada harmonisisasi dulu, dari konspirasi kemakmuran.

Sebelum mengeluarkan jurus Ctrl+V dan Ctrl+Shift+V, harus ada jurus Ctrl+C atau Ctrl+X terlebih dahulu. Jurus paling dasar adalah Ctrl+C kemudian Ctrl+V. Jurus ini sangat sakti dan ampuh ketika digunakan oleh para mahasiswa.

Terdapat pula jurus-jurus tambahan untuk menangkis jurus sebelumnya. Di bawah ini adalah contohnya.

Ctrl+Z
Jurus ini dipakai untuk membatalkan jurus sebelumnya.
Jurus ini cocok digunakan jika terjadi kesalahan dalam Ctrl+X atau Ctrl+V atau Ctrl+Shift+V.

Ctrl+Y
Jurus ini dipakai untuk mengulang jurus yang telah dibatalkan.
Jurus ini cocok digunakan jika jurus Ctrl+Z dipakai secara berlebihan.

Ctrl+A
Jurus ini dipakai untuk menandai semua jurus lawan, secara sapu jagad.
Jika jurus ini digunakan sebelum jurus Ctrl+C atau Ctrl+X, seluruh ilmu lawan akan diserap.

***

Contoh mahasiswa doktoral yang sukses menerapkan jurus-jurus sakti di atas adalah Susilo Bambang Yudhoyono. Kitab Saktinya adalah bentuk gabungan semua jurus-jurus tadi.

***

Ctrl+C = Copy, salin
Ctrl+X = Cut, potong/gunting
Ctrl+V = Paste, pasang
Ctrl+Shift+V = Paste text only, pasang teks doang
Ctrl+Z = Undo, batal
Ctrl+Y = Redo, ulang
Ctrl+A = All, semua

Sebetulnya masih banyak jurus-jurus lain yang perlu dipelajari. Namun hanya dengan menguasai sedikit jurus di atas, mahasiswa dapat memiliki kesaktian yang cukup hingga lulus kuliah.

Bremen, 18 September 2013

iscab.saptocondro

via iscab.saptocondro tak ingin gaptek lagi http://saptocondrogaptex.blogspot.com/2013/09/kesaktian-mahasiswa.html

September 18, 2013 Posted by | gaptek | , , , , , | 2 Comments

Our Higgs Boson

Our Higgs-Boson

Our Higgs-Boson,
who art in the Higgs Field,
hallowed be thy vibration.
Thy space-time come.
Thy matter be done,
on Earth and the entire known Universe.
Give us this trillionth of a second our instant Planck mass,
and forgive us our ignorances,
as we forgive those who don’t fucking love science.
And lead us not into The Great Rip,
but deliver us from Dark Energy.
ATOM.

The prayer of Everett Aponte.

diambil dari I fucking love science.
Ketika mereka membenci sains.

When they hate science.
http://www.youtube.com/watch?v=h1kg08E6VD0

Related post:

Bremen, 18 September 2013

iscab.saptocondro

via iscab.saptocondro tak ingin gaptek lagi http://saptocondrogaptex.blogspot.com/2013/09/our-higgs-boson.html

September 18, 2013 Posted by | gaptek | , , | Leave a comment

Semua pria sama saja, menurut probabilitas dan statistika

Ada pernyataan yang sering dikeluarkan oleh orang-orang yang kecewa.

  • “Ah, semua laki-laki sama saja. Brengsek!”
  • “Ah, semua wanita sama saja. Matré!”
  • dan lain-lain

Pernyataan di atas adalah suatu premis logis yang bisa dinegasikan dan dihubungkan dengan premis lain untuk membangun silogisme.

Negasi dari “semua pria sama saja” adalah “Ada pria yang tidak sama”.

Aku bertanya-tanya mengenai kebenaran dari pernyataan “semua pria sama saja”, bukan hanya secara logis, melainkan juga matematis. Ada cara untuk mengetahui kebenaran pernyataan ini secara matematis, yaitu dari ilmu probabilitas dan statistika.

Untuk menguji kebenaran pernyataan “semua pria sama saja, Brengsek!” maka perlu suatu survei atau pengambilan sampel, dari populasi pria. Berapa sampel yang diperlukan? Bagaimana tingkat kepercayaannya? Bagaimana galatnya?

***

Rumus ini, adalah rumus mencari batas kesalahan (margin of error), pada survei.

e = \frac{k}{2}\cdot \sigma_{\bar x} =\frac{k\cdot\sigma}{2\cdot\sqrt{n}}

e = batas kesalahan
k = kelipatan simpangan terhadap rata-rata, yang tergantung tingkat/selang kepercayaan.
\sigma_{\bar x} = kesalahan baku (standard error), dari rata-rata (of the mean)
\sigma = simpangan baku (standard deviation) menurut distribusi normal atau Gaussian.
n = jumlah sampel

Dari rumus di atas, dapat dicari hubungan antara berapa batas kesalahan yang dimaklumi dan berapa jumlah sampel yang diinginkan. Semakin besar jumlah sampel, maka semakin kecil kesalahannya.

Selain itu, tingkat kepercayaan (confidence level) dan selang kepercayaan (confidence interval) berhubungan dengan besarnya k.

  • k = 1 setara dengan selang kepercayaan \pm 1 dan tingkat kepercayaan 68,26%
  • k =1,96 setara dengan tingkat kepercayaan 95% dan selang kepercayaan \pm 1,96
  • k = 2 setara dengan selang kepercayaan \pm 2 dan tingkat kepercayaan 95,44%
  • k = 2,58 setara dengan tingkat kepercayaan 99% dan selang kepercayaan \pm 2,58
  • k = 3 setara dengan selang kepercayaan \pm 3 dan tingkat kepercayaan 99,74%

Gambar dari National Curve Bank berikut menjelaskan hubungan tingkat/selang kepercayaan dalam distribusi Gaussian.

Distribusi Gaussian

Distribusi Gaussian

Tingkat kepercayaan 95% berarti jika survei dilakukan 100 kali, maka 95 survei menunjukkan hasil yang sama dan 5 yang berbeda.
Batas kesalahan 1% berarti pada suatu survei, ada 1% sampel yang menyimpang.
Makna tingkat kepercayaan dan batas kesalahan di atas tidak terlalu tepat karena hanya dipakai untuk mempermudah penjelasan.

***

Kembali ke pernyataan “Semua laki-laki itu sama aja, brengsek.”

Untuk memperoleh tingkat kepercayaan 95% dengan batas kesalahan 1%, hitung-hitungannya begini.
Tingkat kepercayaan 95% berarti k = 1,96.
Simpangan baku setelah distandardisasi/dinormalisasi selalu satu.

0,01 =\frac{1,96 \cdot 1}{2 \cdot \sqrt{n}}
maka
n = (\frac{1,96}{2 \cdot 0,01})^2 = 9604

Jadi untuk tingkat kepercayaan 95% dan batas kesalahan 1%, perlu melakukan pengambilan sampel acak sejumlah 9604 pria, untuk membuktikan kebenaran pernyataan “Semua pria itu brengsek.”

Oh, ya, kalau tingkat kepercayaannya dinaikkan menjadi 99% dan batas kesalahan tetap 1%, maka k = 2,58 dan hitungannya sebagai berikut.

n = (\frac{2,58}{2 \cdot 0,01})^2 = 16641

Maka sampel yang perlu diambil secara acak adalah 16641 pria.

***

Jika kamu kecewa dengan pasanganmu, jangan bilang “Ah, semua pria sama aja, suka berbohong!” atau “Ah, semua wanita sama aja, matre semua!” sebelum merasakan pacaran sebanyak 16000 kali dan membuktikan pernyataan tersebut.

Bremen, 18 Juli 2013

iscab.saptocondro

July 18, 2013 Posted by | probabiliscab | , , , , , | 5 Comments