KOMPAS.com - Kebutuhan akan profesi data scientist selalu mengalami peningkatan setiap tahunnya. Survei IBM mencatat setidaknya ada kenaikan kebutuhan sebanyak 364.000 data scientist menjadi 2.720.000 di seluruh dunia di pembukaan tahun 2020.
Tentunya memiliki softskill dan hardskill mumpuni diperlukan untuk menjadi seorang data scientist yang kompeten. Selain itu pemahaman mengenai siklus pekerjaan praktisi data nyatanya juga diperlukan.
Hal ini bertujuan agar solusi yang dihasilkan sesuai dengan kebutuhan perusahaan.
DQLab.id, program belajar data science online berbahasa Indonesia yang diinisiasi Universitas Multimedia Nusantara dan PHI-Integration, mendapatkan penjelasan langsung dari Reny Melyani, praktisi data industri retail, mengenai pola pekerjaan yang dilakukan data scientist di perusahaan.
Menurut Reny Melyani ada 5 alur kerja yang harus dipahami seorang data scientist:
1. Pahami bisnis perusahaan
Sebagai praktisi data, kamu harus memahami bisnis apa yang perusahaan jalani. Dengan memahami bisnis perusahaan, kamu akan mengetahui dampak apa yang akan dihasilkan.
Memahami bisnis merupakan langkah awal memetakan masalah dan menghasilkan solusi tepat untuk perusahaan.
2. Data collection
Setelah mengerti bisnis perusahaan, tentu kamu akan mendapatkan banyak data. Data yang diperoleh berasal dari sumber berbeda-beda, pengumpulan data ini memungkinkan praktisi data melakukan uji hipotesis.
“Jika sudah mengerti bisnisnya apa, kemudian kita lakukan yang namanya collection data, dimana data yang diperoleh itu dari sumber yang berbeda-beda,” ujar Reny, Data Scientist CT Corp.
3. Data cleansing
Ternyata seorang praktisi data lebih banyak menghabiskan waktu melakukan data cleansing atau pembersihan data. Hal ini sangat penting dilakukan karena bertujuan mengurangi data tidak lengkap dan menghindari duplikasi data agar data dihasilkan menjadi valid.
“Kita harus melakukan data cleansing, karena saat kita mengumpulkan data pastinya ada data-data yang tidak bersih dan ada data-data yang hilang.” Tambah Reny.
4. Exploratory data analysis
Exploratory Data Analysis memungkinkan praktisi memahami isi data digunakan, mulai dari distribusi, frekuensi, korelasi dan lainnya.
Dalam prakteknya, softskill keingintahuan yang tinggi sangat diperlukan dalam proses ini. Pemahaman data juga diperhatikan, karena bertujuan menjawab masalah perusahaan.
5. Data visualization
Dengan visualisasi data, praktisi bisa membaca dan menganalisis data dalam bentuk visual dan mendapatkan ide dari data dengan mudah. Ini adalah kesempatan praktisi untuk mengkomunikasikan data yang nantinya akan mempengaruhi model yang dibuat praktisi.
“Hal ini bertujuan untuk mengkomunikasikan data dan ini perlu dilakukan untuk mengetahui apakah memengaruhi model kita atau tidak,” tutup Reny.
Bila kamu belum dapat menerapkan pola kerja seperti ini, kamu mulai belajar dan mengikuti beragam pertemuan komunitas seputar data science seperti yang ditawarkan DQLab.id.
https://edukasi.kompas.com/read/2019/12/11/19363991/kebutuhan-data-scientist-meningkat-2020-ini-5-alur-kerja-yang-kamu-wajib-tahu