KOMPAS.com - Berdasarkan rekapitulasi KPU lalu, hasil pilpres 2019 menunjukan hasil 55,5 persen pasangan 01 Jokowi-Ma'ruf dan 44,5 persen untuk pasangan 02 Prabowo-Sandi.
Sementara, hitung cepat Litbang Kompas sebelumnya memprediksi hasil 54,45 persen untuk pasangan 01 Jokowi-Ma'ruf dan 45,55 persen untuk pasangan 02 Prabowo-Sandi dengan margin of error di bawah 1 persen.
Angka ini didapat Litbang Kompas dengan cara memilih sampel yang mewakili karakteristik penduduk yang bisa memilih presiden di Indonesia.
Karena hasil quick count pilpres 2019 bergantung pada kualitas sampel, mungkinkah memilih sampel menghasilkan data quick count (QC) yang sama dengan real count (RC) atau rekapitulasi KPU?
DQLab berbincang dengan pengajar statistika Universitas Multimedia Nusantara (UMN), Tan Thing Heng untuk mendapatkan jawaban tersebut.
Kunci: representatif sampel
Tan Thing Heng menjelaskan dari sudut pandang ilmu statistika kecil peluang QC akan menghasilkan hasil sama persis RC karena ada sampling error. Namun bila sampel dipilih representatif dan memenuhi syarat kecukupan, maka kemungkinan besar hasil QC tidak jauh berbeda hasil RC.
"Lembaga-lembaga survei yang melakukan quick count menggunakan metode berbeda pengambilan sampel, sehingga hasil didapatkan juga tidak sama. Kalaupun lembaga-lembaga tersebut menggunakan teknik sampling sama, ada kemungkinan hasil didapatkan berbeda karena perbedaan sampel TPS dipilih," jelasnya.
Lebih jauh Tan menjelaskan salah satu syarat dari pengambilan sampel adalah pengambilan sampel yang representatif terhadap populasi.
"Dari data TPS dapat dibuat pengelompokan TPS berdasarkan karakteristik-karakteristiknya sehingga dari masing-masing kelompok TPS tersebut dapat diambil sampel acak yang representatif secara proporsional dari masing-masing kandidat," urainya.
Peluang pemilih dan variable relevan
Untuk menentukan peluang pemilih menentukan kandidat, dosen UMN ini menjabarkan langkah pertama yakni membuat profil pemilih masing-masing kandidat berdasarkan variabel seperti usia, jenis kelamin, domisili, pekerjaan, pilihan partai politik dan variabel relevan lain.
"Dari profil ini dapat dilakukan analisis menggunakan model statistika atau algoritma data science untuk menghitung peluang pemilih untuk memilih kandidat tertentu," ujarnya.
Menurutnya, peluang seseorang menggunakan hak pilih cenderung dipengaruhi lokasi TPS terhadap lokasi tempat tinggal pemilih dan kesadaran berpartisipasi dalam pemilu. Data yang bisa dipertimbangkan untuk menilai hal ini adalah data partisipasi pemilih pada periode sebelumnya.
Untuk memilih variabel yang relevan dapat dilakukan proses eliminasi variabel-variabel yang tidak relevan dengan pilihan kandidat dengan mempertimbangkan masukan dari ahli dalam sosiodemografi dan perilaku pemilih dan menggunakan model statistika dan data science sehingga variabel-variabel dipilih.
Ia juga mengingatkan, pada data mentah yang didapatkan dari berbagai sumber, biasanya masih terdapat data tidak lengkap dan adanya overlap antar data.
"Misalnya salah input nama, data seseorang tercatat dua kali, atau ada data yang belum update seperti pemilih yang sudah meninggal masih tercatat sebagai pemilih aktif," ujar Tan.
Dalam hal ini, tambahnya, Data Wrangling menjadi proses pengolahan data mentah menjadi data siap pakai dengan cara mendeteksi duplikat data, mengecek adanya outlier, mengatasi data tidak lengkap atau data kosong dan pembersihan data lainnya.
"Dalam konteks quick count Data Wrangling dilakukan saat menyiapkan data untuk pemilihan TPS," ujarnya.
Ia menjelaskan, "Real count tidak mungkin digantikan dengan penghitungan dengan Data Science dan statistika. Quick count pasti mengandung sampling error karena TPS dipilih hanyalah sampel dari seluruh TPS yang ada," tegasnya.
Jika quick count telah memenuhi syarat representasi, keacakan dan ukuran sampel minimum, maka quick count dapat digunakan sebagai alat pembanding atau kontrol terhadap hasil real count.
Pentingnya keahlian data science
Apabila terdapat perbedaan signifikan antara keduanya, maka dapat disimpulkan kemungkinan terjadi kesalahan pada sampel dipilih lembaga yang mengadakan quick count atau potensi terjadinya kesalahan dari penghitungan real count.
Walau data science dan statistika tidak mungkin menggantikan real count, keahlian mengolah data sangat bermanfaat untuk melakukan quick count seakurat mungkin, dan menjadikan hasil quick count pembanding real count, untuk membantu pengecekan jika hasil real count diduga tidak akurat.
ke depan data science dan statistika akan memegang fungsi penting, tidak hanya dalam Pemilu namun juga dalam setiap aspek kehidupan. Tertarik mempelajari data kunjungi DQLab sekarang!
https://edukasi.kompas.com/read/2019/06/12/17584281/bisakah-quick-count-menggantikan-real-count-ini-jawaban-pakar-umn