"Misalnya salah input nama, data seseorang tercatat dua kali, atau ada data yang belum update seperti pemilih yang sudah meninggal masih tercatat sebagai pemilih aktif," ujar Tan.
Dalam hal ini, tambahnya, Data Wrangling menjadi proses pengolahan data mentah menjadi data siap pakai dengan cara mendeteksi duplikat data, mengecek adanya outlier, mengatasi data tidak lengkap atau data kosong dan pembersihan data lainnya.
"Dalam konteks quick count Data Wrangling dilakukan saat menyiapkan data untuk pemilihan TPS," ujarnya.
Ia menjelaskan, "Real count tidak mungkin digantikan dengan penghitungan dengan Data Science dan statistika. Quick count pasti mengandung sampling error karena TPS dipilih hanyalah sampel dari seluruh TPS yang ada," tegasnya.
Jika quick count telah memenuhi syarat representasi, keacakan dan ukuran sampel minimum, maka quick count dapat digunakan sebagai alat pembanding atau kontrol terhadap hasil real count.
Apabila terdapat perbedaan signifikan antara keduanya, maka dapat disimpulkan kemungkinan terjadi kesalahan pada sampel dipilih lembaga yang mengadakan quick count atau potensi terjadinya kesalahan dari penghitungan real count.
Walau data science dan statistika tidak mungkin menggantikan real count, keahlian mengolah data sangat bermanfaat untuk melakukan quick count seakurat mungkin, dan menjadikan hasil quick count pembanding real count, untuk membantu pengecekan jika hasil real count diduga tidak akurat.
ke depan data science dan statistika akan memegang fungsi penting, tidak hanya dalam Pemilu namun juga dalam setiap aspek kehidupan. Tertarik mempelajari data kunjungi DQLab sekarang!
Simak breaking news dan berita pilihan kami langsung di ponselmu. Pilih saluran andalanmu akses berita Kompas.com WhatsApp Channel : https://www.whatsapp.com/channel/0029VaFPbedBPzjZrk13HO3D. Pastikan kamu sudah install aplikasi WhatsApp ya.