Data Scientist saat ini sedang naik daun, biasanya tugas dari data scientist ini adalah mengolah data-data yang dimiliki oleh perusahaan kemudian data-data tersebut di analysis dan dijadikan panduan dalam membuat keputusan.
Beberapa pengetahuan basic yang mesti diketahui untuk menjadi seorang data scientist adalah:
Basic Tools:
Mesti paham bahasa-bahasa statistic seperti bahasa R dan python, dan juga mengetahui tentang database query language (SQL)
Basic Statistics:
Karena ini tentang angka dan angka, maka untuk dapat menjadi seorang data scientist kita juga mesti bisa dan paham basic statistik. Yang paling standart gimana cara menghitung rata-rata, rataaan, total, simpangan ataupun juga distribusi.
Machine Learning:
Paham tentang machine learning itu merupakan salah satu point plus. Dari mulai algoritm sampai gimana cara menggunakan-nya.
Multivariable Calculus and Linear Algebra:
Ini sebenarnya jarang menjadi acuan, tapi yang pasti kalo ngomogin statistik dan angka kita tidak akan pernah lepas dengan dunia charting and etc. Karena kita mesti mengetahui bagaimana data tersebut tersebar dan bentuknya.
Data Cleansing dan Data Validation:
Banyak data-data yang tersebar tidak memngikuti aturan baku yang ditetapkan, dari mulai data tanggal yang kadang penulisannya berbeda. Data angka yang tiba-tiba terkotori dengan data character. Kita mesti bisa melakukan cleansinng data dan sejenisnya.
Data Visualization & Communication:
Bagian ini penting. Data-data yang ada hanya akan menjadi sampah bila kita tidak dapat mevisualisasikan dan menkomunikasikannya. Data yang sudah di proses ini lah yang kemudian dapat kita sebut sebagai informasi
Check infographics yang mengambarkan jenis-jenis Data Scientist, serta key roles-nya dan perusahaan apa saja yang menggunakannya.