Semua orang sedang membicarakan Data Science saat ini. Hal itu wajar sejak rilisnya suatu artikel Harvard Business Review (HBR) yang menobatkan Data Scientist sebagai "The Sexiest Job of the 21st Century" pada tahun 2012 silam. Tidak lama setelah itu pula menjamur berbagai Massive Open Online Course (MOOC), konten artikel, video, podcast, serta pelatihan tentang Data Science. Show
Lalu, apa itu sebenarnya Data Science? Dan siapakah Data Scientist? Data Science bisa dikatakan sebagai perpaduan antara ilmu komputer, statistika/matematika, dan domain expert tertentu. Ada suatu lelucon yang bahkan mengilustrasikan seorang Data Scientist sebagai seseorang yang lebih paham statistika lebih baik dari computer scientist dan yang lebih paham computer science daripada seorang statistician. Dalam bukunya, Data Science from Scratch, Joel Grus menitikberatkan Data Scientist sebagai seorang yang mengekstrasi insights dari messy data yang sangat besar saat ini di dunia digital. Tidak jauh berbeda pula dengan yang didefinisikan juga dalam buku Data Science Handbook karangan John D. Kelleher dan Brendan Tierney yang mengatakan bahwa Data Science merupakan ilmu mencakup seperangkat prinsip, definisi masalah, algoritma, dan proses untuk mengekstraksi non-obvius dan useful patterns dari suatu kumpulan data yang besar. Meskipun saat ini pada beberapa kasus di industri, boundary seorang dikatakan seorang Data Scientist juga tidak seberapa jelas. Beberapa ada yang mirip dengan jobdesk seorang Machine Learning Engineer seperti membuat suatu model prediksi dan ada pula yang lebih cenderung melakukan analisis dan ekstraksi insights dan membuat laporan. Masih belum paham definisi di atas? Langsung cek artikel-artikel di bawah ini.
Apa yang dilakukan oleh seorang Data Scientist?
Apa saja yang harus dikuasai seorang Data Scientist?
Learning Path Menjadi Data ScientistPath untuk menjadi Data Science Expert Data Scientist Toolbox
Daftar Course1. Pemrograman Menggunakan PythonMengapa ini penting?Bayangkan bagaimana kita bisa memvisualisasikan data 3-dimensi atau lebih menggunakan software yang telah tersedia di pasaran? Tidak semua software menyediakan fitur ini. Dari situlah programming menjadi penting. Programming berperan sebagai jembatan seorang data scientist untuk berkomunikasi dengan komputer sehingga memungkinkan mereka untuk dapat mengekseskusi berbagai perintah yg diinginkan secara custom. Sebagai contoh seperti di bawah ini
Apa saja yang akan dipelajari?Course ini mempelajari mengenai dasar-dasar pemrograman menggunakan Python untuk pemrosesan data. Skill dasar untuk menulis program menggunakan Python untuk Data Science seperti syntax dasar, operasi matematika dasar, logika, looping, struktur data, dan mengolah database menggunakan Python. Bagaimana mempelajari ini?📚Rekomendasi Textbook
Rekomendasi Referensi Lain💡Blog
📉Practice Lab
▶️Video
Topics1.1 Python DasarMateri
1.2 Struktur Data PythonMateri
1.3 Menggunakan Python Untuk Akses DatabaseMateri
1.4 Visualisasi menggunakan PythonMateri
2. Analisis dan Visualisasi Data Menggunakan TableauCourse ini mempelajari tentang bagaimana cara melakukan visualisasi data menggunakan aplikasi Tableau. Mengapa ini penting?Teknik visualisasi akan sangat berguna dalam mendapatkan wawasan/insight dari data seperti pengaplikasian pada:
Apa saja yang akan dipelajari?Tableau operations, preparasi data, membuat grafik, dashboards, dan stories, melakukan kalkulasi. Bagaimana mempelajari ini?📚Rekomendasi Textbook
Rekomendasi Referensi Lain💡Blog
▶️Video Topics2.1 Pengenalan TableauMemahami interface dan operasi-operasi dalam Tableu serta langkah-langkah bekerja menggunakan Tableau. 2.2 Preparasi DataMemahami bagaimana cara import dan join data. 2.3 Visual AnalyticsMemahami fitur-fitur visual analytics seperti filter, sort, group, trend lines dan cara membuat dashboards. 2.4 Kalkulasi dalam TableuMemahami bagaimana cara melakukan kalkulasi dalam Tableau. 3. Teknik Visualisasi Data Menggunakan Google Data StudioCourse ini mempelajari tentang bagaimana cara melakukan visualisasi data menggunakan aplikasi Google Data Studio. Mengapa ini penting?Teknik visualisasi akan sangat berguna dalam mendapatkan wawasan/insight dari data seperti pengaplikasian pada:
Apa saja yang akan dipelajari?Data Studio navigation, membuat reports, and calculated fields. Bagaimana mempelajari ini?📚Rekomendasi Textbook
Rekomendasi Referensi Lain💡Blog
📉Practice Lab
▶️Video
Topics3.1 Data Studio DasarMemahami cara untuk mengoperasikan Google Data Studio dan membuat report sederhana. 3.2 Data Studio AdvancedMemahami fitur-fitur advanced dari Google Data Studio seperti filters dan calculated filed. 4. Pengolahan Database Menggunakan SQLMengapa ini penting?Course ini mempelajari tentang database yang umum digunakan dan bagaimana cara melakukan operasi di dalamnya.
Apa saja yang akan dipelajari?Course ini mempelajari mengenai dasar-dasar SQL untuk pemrosesan data yang berkaitan dengan Data Science. Skill dasar untuk menulis program menggunakan SQL untuk Data Science seperti syntax dasar, operasi dasar, logika, looping, struktur data, dan mengolah database. Bagaimana mempelajari ini?📚Rekomendasi Textbook
Rekomendasi Referensi Lain💡Blog
📉Practice Lab
▶️Video
Topics4.1 SQL DataMemahami bagaimana cara untuk select columns, filter row, melakukan aggregation, sorting dan groupping. 4.2 Story Telling DataMemahami cara untuk import dan join suatu visualisasi data untuk Business Professionals. 5. Probabilitas dan StatistikaMengapa ini penting?Course ini mempelajari tentang teori dari probabilitas dan statistika yang umum digunakan pada bidang data science. Pada pengaplikasiannya di industri course ini digunakan untuk mempelajari karakteristik data, kualitas data, dan hubungan antara variabel data dengan masalah bisnis. Apa saja yang akan dipelajari?Secara fundamental materi yang dipelajari adalah: Probability & statistics essentials for data science. dengan rincian subcourse beserta kompetensi dasarnya sebagai berikut.
Bagaimana mempelajari ini?📚Rekomendasi Textbook
Rekomendasi Referensi Lain💡Blog
📉Practice Lab
▶️Video
6. Matematika Untuk Machine LearningCourse ini mempelajari tentang teori matematika yang digunakan pada metode machine learning. Mengapa ini penting?
Apa saja yang akan dipelajari?Konsep matematika dasar (Linear algebra, Calculus and Vector calculus) Bagaimana mempelajari ini?Topics6.1 Vector and Matrix OperationsMemahami konsep dasar mengoperasikan table of data (suatu Matrix or Vector). 📚Buku
▶️Video
💡Artikel
📉Lab
6.2 Linear AlgebraMemahami aplikasi linear algebra dalam Data Science, sebagai contoh Principle Component Analysis (PCA). 📚Buku
▶️Video
6.3 Calculus and DerivativesMemahami fungsi optimasi (menemukan local minima & maxima). ▶️Video
7. Data WranglingCourse ini mempelajari tentang proses cleaning data guna untuk memudahkan akses, pemetaan dan analisa. Mengapa ini penting?
Apa saja yang akan dipelajari?Data Cleaning, Data Transformation dan Data Enrichment. Bagaimana mempelajari ini?📚Rekomendasi Textbook
Rekomendasi Referensi Lain💡Blog
Topics7.1 Data Wrangling dengan PythonMelibatkan pemrosesan data dalam berbagai macam format seperti - merging, grouping dan councatenating. 7.2 Python Data StructureOpen source python library providing high-performance. 8. Teori SamplingCourse ini mempelajari cara untuk mengambil sebagian data dari populasi, sehingga dalam melakukan pengujian tidak memakan waktu yang lama untuk mengetahui bagaimana cara melakukannya. Mengapa ini penting?
Apa saja yang akan dipelajari?Fundamental, Probability, dan Non-Probability Sampling. Bagaimana mempelajari ini?📚Rekomendasi Textbook
Rekomendasi Referensi Lain💡Blog
📉Practice Lab
▶️Video
Topics8.1 Probability SamplingSetiap elemen populasi memiliki probabilitas yang diketahui dan bukan nol untuk berada dalam sampel. 8.2 Non-Probability SamplingBeberapa elemen populasi mungkin tidak dipilih dan ada risiko besar sampel tidak mewakili populasi secara keseluruhan. 9. Machine LearningCourse ini mempelajari jenis-jenis algoritma machine learning dan aplikasinya, serta bagaimana membuat dan mengembangkan model. Mengapa ini penting?
Apa saja yang akan dipelajari?Jenis-jenis model machine learning beserta keunggulannya dan teknik-teknik untuk meningkatkan performa model. Bagaimana mempelajari ini?📚Rekomendasi Textbook
Rekomendasi Referensi Lain💡Blog
📉Practice Lab
Topics9.1 Supervised LearningMemahami model regression dan model classification dan cara melakukan training dan testing pada model. 9.2 Unsupervised LearningMemahami model clustering dan cara melakukan evaluasi pada model. 9.3 Model EvaluationMemahami berbagai macam evaluasi model dan teknik untuk meningkatkan performa model. 10. Deep LearningCourse ini mempelajari tentang dasar-dasar modul yang menyusun deep learning serta mengapa deep learning sangat powerful dibandingkan machine learning biasa serta pada kasus-kasus apa deep learning tepat untuk diaplikasikan Mengapa ini penting?
Apa saja yang akan dipelajari?Konsep Deep Learning sebagai susunan modul-modul, operasi pada Neural Networks, cara training Deep Learning, modul-modul state-of-the-art dari Deep Learning seperti Convolutional Neural Networks (CNNs), Recurrent Neural Networks (RNNs), dll. Bagaimana mempelajari ini?📚Rekomendasi Textbook
Rekomendasi Referensi Lain💡Blog
📉Practice Lab
▶️Video
Topics10.1 Neural NetworksMemahami modul dan konsep formalisasi pada Neural Networks. 10.2 Optimization dan BackpropagationMemahami cara kerja backpropagation dan memahami berbagai macam metode optimasi untuk melatih arsitektur Deep Learning. 10.3 Convolutional Neural NetworksMemahami hyperparameters CNNs seperti stride, padding, kernel size, serta jenis-jenis konvolusi dan aplikasinya. 10.4 Sequence ModelsMemahami berbagai macam sequence models seperti RNNs, Gated Recurrent Units (GRUs), Transformer dan aplikasinya. |