Di mana saya bisa berlatih python untuk ilmu data?

Python adalah bahasa pemrograman yang digunakan oleh banyak ilmuwan data untuk membersihkan data, membuat visualisasi, dan membangun model. Mempelajari Python untuk ilmu data tidak pernah semudah ini — ada banyak panduan dan tutorial gratis di luar sana yang dapat Anda gunakan untuk keuntungan Anda

Yang mengatakan, Python memiliki aplikasi di luar ilmu data, jadi tanpa panduan yang tepat, Anda mungkin akan mempelajari hal-hal yang jarang digunakan dalam ilmu data. Inilah mengapa saya membuat kurikulum 26 minggu yang berisi sumber daya gratis yang dapat Anda gunakan untuk mempelajari Python untuk ilmu data pada tahun 2022

Saya membagi kurikulum ini menjadi 4 bagian utama. Saya yakin cara terbaik untuk mempelajari sesuatu adalah dengan melakukannya, jadi selain meninggalkan tautan ke tutorial dan panduan video, saya menyertakan latihan dan proyek di setiap bagian untuk membantu Anda menguasai Python untuk ilmu data

Gambaran umum tentang semua hal Python yang Anda butuhkan untuk ilmu data juga dapat ditemukan di video di bawah ini

Pastikan untuk berlangganan di sini untuk mendapatkan Lembar Curang Python untuk Ilmu Data yang saya gunakan di semua tutorial saya (PDF Gratis)

Konsep Inti Python untuk Ilmu Data

Hal pertama yang harus dilakukan untuk menguasai Python untuk ilmu data adalah memahami konsep inti. Ini berarti mempelajari tipe data yang paling umum, cara menggunakan variabel, dan cara menggunakan daftar dan kamus dengan benar

Hal penting lainnya untuk dipelajari adalah pernyataan bersyarat (pernyataan if/else) dan loop (untuk, sementara, dll). Mereka adalah kunci untuk melakukan hal-hal yang lebih maju dengan Python

Perlu diingat bahwa editor teks yang harus Anda gunakan sebagai calon ilmuwan data adalah Jupyter Notebook. Editor ini memungkinkan kita tidak hanya untuk menulis kode tetapi juga untuk menulis persamaan, memplot visualisasi, menambahkan teks, dan lebih banyak hal yang membuat skrip Python kita terlihat seperti buku catatan

Minggu 1. Pengantar Jupyter Notebook & Tipe Data (integer, float, boolean, string, dll)

  • Video tutorial. (0. 03. 53 ke 0. 39. 10)

Minggu 2. Variabel, Daftar, Tupel, dan Kamus

  • Video tutorial. (0. 39. 10 banding 1. 21. 50)

Minggu 3. Pernyataan IF dan UNTUK loop

  • Video tutorial. (1. 21. 50 banding 1. 33. 49)

Minggu 4. Fungsi & Modul

  • Video tutorial. (1. 33. 49 ke 1. 44. 41)

Minggu 5. Proyek Pemula Python

Proyek pemula berikut membantu kami mempraktikkan semua hal yang telah kami pelajari di minggu-minggu sebelumnya, jadi pertimbangkan untuk mengambil setidaknya salah satunya. Mereka diurutkan berdasarkan tingkat kesulitan, jadi proyek pertama adalah yang paling sederhana, sedangkan yang terakhir adalah yang tersulit

  • Permainan Kuis. Dalam proyek ini, kami akan menggunakan pernyataan if/else dan bekerja dengan fungsi input untuk menanyakan dan menjawab beberapa pertanyaan acak dengan Python
  • Batu, Kertas, Gunting. Ini adalah game populer yang dapat Anda implementasikan dengan mudah di Python. Kami akan mempraktikkan pernyataan if/else, cara bekerja dengan variabel, daftar, dan loop
  • Alat Pengganti Nama File. Proyek ini terdiri dari melakukan 7 operasi sistem file umum dengan Python. Proyek ini adalah tentang modul OS. Ini adalah modul sederhana namun kuat yang disertakan dengan Python
Python untuk Analisis Data

Pustaka Analisis Data seperti Pandas dan NumPy adalah dasar untuk menyelesaikan tugas ilmu data umum seperti pembersihan data dan analisis data eksplorasi (EDA)

Minggu-minggu berikutnya difokuskan untuk mempelajari cara membuat dan memanipulasi kerangka data. Selain itu, saya akan menunjukkan kepada Anda beberapa sumber yang berisi latihan-latihan berguna yang akan membantu melatih semua ini

Minggu 6. Pengantar Panda & Numpy. Cara membuat bingkai data, pilih dan tambahkan kolom, operasi, dan metode umum

  • Video tutorial. (1. 44. 41 sampai 3. 09. 56)
  • Latihan. Pengantar Panda

Minggu 7 & 8. Memfilter dan Mengekstraksi Data

  • 8 Cara Menyaring Dataframe Pandas
  • Cara Menggunakan loc di Pandas
  • Cara Menghapus Kolom Di Pandas
  • Metode kueri
  • Fungsi Panda berlaku () ke Kolom Tunggal & Ganda
  • Latihan Penyaringan

Minggu 9. Tabel pivot

  • Ganti Tabel Pivot Excel dengan Python Panda

Minggu 10. GroupBy dan Fungsi Agregat

  • Pandas Groupby menjelaskan secara rinci
  • Latihan Pengelompokan

Minggu 11. Menggabungkan DataFrame

  • Python Panda Menggabungkan DataFrames
  • Latihan. Menggabungkan dan Menggabungkan DataFrames

Minggu 12. Proyek Analisis Data

Proyek berikut akan memungkinkan Anda mempraktikkan sebagian besar metode Panda yang telah Anda pelajari sejauh ini. Proyek pertama terdiri dari pengumpulan data, yang kedua tentang pembersihan data (ini adalah salah satu tugas yang paling memakan waktu dalam ilmu data) dan, di proyek ketiga, Anda harus membuat visualisasi data hanya dengan Panda.

  • Pengumpulan data. Dalam proyek ini, Anda harus mengumpulkan data menggunakan Panda dan Selenium. Selenium adalah alat otomatisasi web yang memungkinkan kita mengekstrak data. dari situs web dan buat kumpulan data kami sendiri
  • Membersihkan Data Dengan Panda. Membersihkan data adalah tugas umum yang harus dihadapi oleh setiap ilmuwan data. Dalam proyek ini, kami akan membersihkan kumpulan data dengan menerapkan berbagai teknik untuk memastikan kualitas data yang tinggi
  • Visualisasi Data hanya dengan Panda. Panda memungkinkan kita membuat visualisasi seperti piechart, barplot, lineplot, dan lainnya. Dalam proyek ini, kami akan membuat tabel pivot dan kemudian membuat plot yang membantu kami membuat analisis yang lebih baik
Python untuk Visualisasi Data

Meskipun Anda dapat membuat visualisasi data dengan Panda, tidak ada cukup opsi untuk menyesuaikan plot kami. Di sinilah perpustakaan yang lebih lengkap seperti Matplotlib dan Seaborn berguna

Kedua perpustakaan memungkinkan kita melampaui plot dasar yang ditawarkan Panda. Mungkin Anda bisa membuat visualisasi hanya dengan Panda, tetapi jika Anda suka membuat visualisasi yang cantik seperti saya, pertimbangkan untuk mempelajari Matplotlib dan/atau Seaborn

Selain itu, di bagian ini, kita akan belajar cara membuat wordcloud dan menyelesaikan proyek keren untuk melatih teknik visualisasi data sambil bersenang-senang

Minggu 13. Visualisasi Data dengan Matplotlib dan Wordclouds dengan Stylecloud

  • Tutorial Plot Python dengan Matplotlib dan Pandas
  • Cara Mudah Membuat Awan Kata Indah dengan Python

Minggu 14. Visualisasi Data dengan Seaborn

  • Cara Membuat Visualisasi Indah dengan Seaborn

Minggu 15. Proyek

Visualisasi data harus menyenangkan, jadi untuk proyek ini, Anda harus memilih film/acara TV yang Anda suka, lalu buka Kaggle dan cari kumpulan data yang berisi skrip film/acara ini. Setelah Anda memiliki dataset, bacalah dengan Pandas dan buat semua plot yang diperlukan untuk mengetahui lebih banyak tentang film/acara yang Anda sukai

Jika Anda membutuhkan inspirasi, periksa artikel di bawah ini

  • Visualisasi Data dengan Python dengan Avatar The Last Airbender
  • Simpsons memenuhi Visualisasi Data
Python untuk Pembelajaran Mesin

Setiap ilmuwan data harus dapat membangun model pembelajaran mesin. Inilah mengapa kita perlu mempelajari library seperti sklearn, Keras, dan Tensorflow. Mereka akan membantu kami membangun, mengevaluasi, dan memilih model terbaik untuk proyek kami

Pada akhirnya, Anda akan menyadari bahwa mengimplementasikan model tersebut dengan Python tidak terlalu sulit. Bagi kebanyakan orang, bagian tersulit dari ini adalah memahami konsep inti di balik setiap algoritme dan menerapkannya dengan benar dalam sebuah proyek

Inilah sebabnya, dalam minggu-minggu berikutnya, kita akan fokus mempelajari cara kerja algoritme pembelajaran mesin yang paling umum, dan baru setelah itu kita akan melihat cara mengimplementasikannya dalam Python (sebagian besar implementasi dilakukan dengan sklearn, setelah 26 minggu).

Minggu 16. Pengantar Pembelajaran Mesin

  • Dasar Pembelajaran Mesin
  • Apa itu Pembelajaran Mesin?

Minggu 17. Regresi linier

  • Regresi Linier dan Implementasi Python
  • Regresi Linear Berganda

Minggu 18. Regresi logistik

  • Regresi Logistik dalam Pembelajaran Mesin
  • Aplikasi Regresi Logistik dan Implementasi Python

Minggu 19. Pohon Keputusan

  • Pohon Keputusan dalam Pembelajaran Mesin
  • Kasus Penggunaan Pohon Keputusan dan Implementasi Python

Minggu 20. Naif Bayes

  • Pengklasifikasi Naif Bayes
  • Klasifikasi Teks menggunakan Naive Bayes (Implementasi Python)

Minggu 21. Mendukung Mesin Vektor

  • SVM dalam Pembelajaran Mesin
  • Kasus Penggunaan SVM dengan Python

Minggu 22. KNN

  • Algoritma KNN Dalam Machine Learning
  • Kasus Penggunaan KNN dengan Python

Minggu 23. Analisis Komponen Utama (PCA)

  • PCA Dalam Pembelajaran Mesin
  • Implementasi PCA dengan Python

Minggu 24. Hutan Acak

  • Hutan Acak dalam Pembelajaran Mesin
  • Kasus Penggunaan Hutan Acak — Analisis Bunga IRIS menggunakan Python

Minggu 25. Metrik Model

  • Akurasi, Presisi, Recall, dan F1
  • Memahami Matriks Kebingungan dari Scikit belajar

Minggu 26. Proyek

  • Prediksi Churn Nasabah Bank. Dalam proyek ini, Anda harus mengklasifikasikan apakah pelanggan akan melakukan churn atau tidak. Anda akan menggunakan kumpulan data yang memiliki data keuangan tentang pelanggan bank (skor kredit, masa kerja, jumlah produk, perkiraan gaji, dll) untuk membangun model prediktif

Catatan. Ada lebih banyak algoritme pembelajaran mesin di luar sana yang saya anjurkan untuk Anda pelajari setelah 26 minggu ini

Bergabunglah dengan daftar email saya dengan 3k+ orang untuk mendapatkan Lembar Curang Python untuk Ilmu Data yang saya gunakan di semua tutorial saya (PDF Gratis)

Jika Anda senang membaca cerita seperti ini dan ingin mendukung saya sebagai penulis, pertimbangkan untuk mendaftar menjadi anggota Medium. Ini $5 per bulan, memberi Anda akses tak terbatas ke ribuan panduan Python dan artikel ilmu Data. Jika Anda mendaftar menggunakan tautan saya, saya akan mendapat komisi kecil tanpa biaya tambahan untuk Anda

Bagaimana mempersiapkan Python untuk ilmu data?

Cara Mempelajari Python untuk Ilmu Data .
Langkah 1. Pelajari dasar-dasar Python. Semua orang mulai di suatu tempat. .
Langkah 2. Berlatih dengan pembelajaran langsung. .
Langkah 3. Pelajari perpustakaan ilmu data Python. .
Langkah 4. Bangun portofolio ilmu data saat Anda mempelajari Python. .
Langkah 5. Terapkan teknik ilmu data tingkat lanjut

Di mana saya bisa belajar Python untuk ilmu data secara gratis?

Kursus Online Gratis .
Python Untuk Ilmu Data– Udemy
Pengantar Ilmu Data– Udacity
Pengantar Ilmu Data dengan Python– DataCamp
Dasar-Dasar Python untuk Ilmu Data– edX
Pelajari Dasar-Dasar NumPy (Perpustakaan Python untuk Ilmu Data)– Udemy
Kursus Singkat Python untuk Ilmu Data dan Pembelajaran Mesin– Udemy

Di mana saya bisa Berlatih ilmu data?

Tutorial Online Ilmu Data .
Kodementor. Codementor menawarkan tutorial untuk pemula dan profesional. .
Topcoder. Situs web ini menawarkan tutorial yang membahas berbagai konsep yang terlibat dalam Ilmu Data dan memiliki platform bagi pakar industri untuk memberikan saran. .
Analitis Vidhya. .
KDnuggets. .
R-blogger. .
Data mengalir

Di mana saya bisa berlatih Python online?

Latih Python dengan 9 situs web ini .
Kode. org. Anda pasti pernah mendengar pernyataan itu lebih dari sekali—semua anak harus belajar membuat kode. .
CodingBat. .
Editor Python Online PYnative. .
Pelajaran Pribadi Online. .
Proyek Euler