Python adalah bahasa pemrograman yang digunakan oleh banyak ilmuwan data untuk membersihkan data, membuat visualisasi, dan membangun model. Mempelajari Python untuk ilmu data tidak pernah semudah ini — ada banyak panduan dan tutorial gratis di luar sana yang dapat Anda gunakan untuk keuntungan Anda Show
Yang mengatakan, Python memiliki aplikasi di luar ilmu data, jadi tanpa panduan yang tepat, Anda mungkin akan mempelajari hal-hal yang jarang digunakan dalam ilmu data. Inilah mengapa saya membuat kurikulum 26 minggu yang berisi sumber daya gratis yang dapat Anda gunakan untuk mempelajari Python untuk ilmu data pada tahun 2022 Saya membagi kurikulum ini menjadi 4 bagian utama. Saya yakin cara terbaik untuk mempelajari sesuatu adalah dengan melakukannya, jadi selain meninggalkan tautan ke tutorial dan panduan video, saya menyertakan latihan dan proyek di setiap bagian untuk membantu Anda menguasai Python untuk ilmu data Gambaran umum tentang semua hal Python yang Anda butuhkan untuk ilmu data juga dapat ditemukan di video di bawah ini Konsep Inti Python untuk Ilmu Data Hal pertama yang harus dilakukan untuk menguasai Python untuk ilmu data adalah memahami konsep inti. Ini berarti mempelajari tipe data yang paling umum, cara menggunakan variabel, dan cara menggunakan daftar dan kamus dengan benar Hal penting lainnya untuk dipelajari adalah pernyataan bersyarat (pernyataan if/else) dan loop (untuk, sementara, dll). Mereka adalah kunci untuk melakukan hal-hal yang lebih maju dengan Python Perlu diingat bahwa editor teks yang harus Anda gunakan sebagai calon ilmuwan data adalah Jupyter Notebook. Editor ini memungkinkan kita tidak hanya untuk menulis kode tetapi juga untuk menulis persamaan, memplot visualisasi, menambahkan teks, dan lebih banyak hal yang membuat skrip Python kita terlihat seperti buku catatan Minggu 1. Pengantar Jupyter Notebook & Tipe Data (integer, float, boolean, string, dll)
Minggu 2. Variabel, Daftar, Tupel, dan Kamus
Minggu 3. Pernyataan IF dan UNTUK loop
Minggu 4. Fungsi & Modul
Minggu 5. Proyek Pemula PythonProyek pemula berikut membantu kami mempraktikkan semua hal yang telah kami pelajari di minggu-minggu sebelumnya, jadi pertimbangkan untuk mengambil setidaknya salah satunya. Mereka diurutkan berdasarkan tingkat kesulitan, jadi proyek pertama adalah yang paling sederhana, sedangkan yang terakhir adalah yang tersulit
Pustaka Analisis Data seperti Pandas dan NumPy adalah dasar untuk menyelesaikan tugas ilmu data umum seperti pembersihan data dan analisis data eksplorasi (EDA) Minggu-minggu berikutnya difokuskan untuk mempelajari cara membuat dan memanipulasi kerangka data. Selain itu, saya akan menunjukkan kepada Anda beberapa sumber yang berisi latihan-latihan berguna yang akan membantu melatih semua ini Minggu 6. Pengantar Panda & Numpy. Cara membuat bingkai data, pilih dan tambahkan kolom, operasi, dan metode umum
Minggu 7 & 8. Memfilter dan Mengekstraksi Data
Minggu 9. Tabel pivot
Minggu 10. GroupBy dan Fungsi Agregat
Minggu 11. Menggabungkan DataFrame
Minggu 12. Proyek Analisis DataProyek berikut akan memungkinkan Anda mempraktikkan sebagian besar metode Panda yang telah Anda pelajari sejauh ini. Proyek pertama terdiri dari pengumpulan data, yang kedua tentang pembersihan data (ini adalah salah satu tugas yang paling memakan waktu dalam ilmu data) dan, di proyek ketiga, Anda harus membuat visualisasi data hanya dengan Panda.
Meskipun Anda dapat membuat visualisasi data dengan Panda, tidak ada cukup opsi untuk menyesuaikan plot kami. Di sinilah perpustakaan yang lebih lengkap seperti Matplotlib dan Seaborn berguna Kedua perpustakaan memungkinkan kita melampaui plot dasar yang ditawarkan Panda. Mungkin Anda bisa membuat visualisasi hanya dengan Panda, tetapi jika Anda suka membuat visualisasi yang cantik seperti saya, pertimbangkan untuk mempelajari Matplotlib dan/atau Seaborn Selain itu, di bagian ini, kita akan belajar cara membuat wordcloud dan menyelesaikan proyek keren untuk melatih teknik visualisasi data sambil bersenang-senang Minggu 13. Visualisasi Data dengan Matplotlib dan Wordclouds dengan Stylecloud
Minggu 14. Visualisasi Data dengan Seaborn
Minggu 15. ProyekVisualisasi data harus menyenangkan, jadi untuk proyek ini, Anda harus memilih film/acara TV yang Anda suka, lalu buka Kaggle dan cari kumpulan data yang berisi skrip film/acara ini. Setelah Anda memiliki dataset, bacalah dengan Pandas dan buat semua plot yang diperlukan untuk mengetahui lebih banyak tentang film/acara yang Anda sukai Jika Anda membutuhkan inspirasi, periksa artikel di bawah ini
Setiap ilmuwan data harus dapat membangun model pembelajaran mesin. Inilah mengapa kita perlu mempelajari library seperti sklearn, Keras, dan Tensorflow. Mereka akan membantu kami membangun, mengevaluasi, dan memilih model terbaik untuk proyek kami Pada akhirnya, Anda akan menyadari bahwa mengimplementasikan model tersebut dengan Python tidak terlalu sulit. Bagi kebanyakan orang, bagian tersulit dari ini adalah memahami konsep inti di balik setiap algoritme dan menerapkannya dengan benar dalam sebuah proyek Inilah sebabnya, dalam minggu-minggu berikutnya, kita akan fokus mempelajari cara kerja algoritme pembelajaran mesin yang paling umum, dan baru setelah itu kita akan melihat cara mengimplementasikannya dalam Python (sebagian besar implementasi dilakukan dengan sklearn, setelah 26 minggu). Minggu 16. Pengantar Pembelajaran Mesin
Minggu 17. Regresi linier
Minggu 18. Regresi logistik
Minggu 19. Pohon Keputusan
Minggu 20. Naif Bayes
Minggu 21. Mendukung Mesin Vektor
Minggu 22. KNN
Minggu 23. Analisis Komponen Utama (PCA)
Minggu 24. Hutan Acak
Minggu 25. Metrik Model
Minggu 26. Proyek
Catatan. Ada lebih banyak algoritme pembelajaran mesin di luar sana yang saya anjurkan untuk Anda pelajari setelah 26 minggu ini Bergabunglah dengan daftar email saya dengan 3k+ orang untuk mendapatkan Lembar Curang Python untuk Ilmu Data yang saya gunakan di semua tutorial saya (PDF Gratis) Jika Anda senang membaca cerita seperti ini dan ingin mendukung saya sebagai penulis, pertimbangkan untuk mendaftar menjadi anggota Medium. Ini $5 per bulan, memberi Anda akses tak terbatas ke ribuan panduan Python dan artikel ilmu Data. Jika Anda mendaftar menggunakan tautan saya, saya akan mendapat komisi kecil tanpa biaya tambahan untuk Anda Bagaimana mempersiapkan Python untuk ilmu data?Cara Mempelajari Python untuk Ilmu Data . Langkah 1. Pelajari dasar-dasar Python. Semua orang mulai di suatu tempat. . Langkah 2. Berlatih dengan pembelajaran langsung. . Langkah 3. Pelajari perpustakaan ilmu data Python. . Langkah 4. Bangun portofolio ilmu data saat Anda mempelajari Python. . Langkah 5. Terapkan teknik ilmu data tingkat lanjut Di mana saya bisa belajar Python untuk ilmu data secara gratis?Kursus Online Gratis . Python Untuk Ilmu Data– Udemy Pengantar Ilmu Data– Udacity Pengantar Ilmu Data dengan Python– DataCamp Dasar-Dasar Python untuk Ilmu Data– edX Pelajari Dasar-Dasar NumPy (Perpustakaan Python untuk Ilmu Data)– Udemy Kursus Singkat Python untuk Ilmu Data dan Pembelajaran Mesin– Udemy Di mana saya bisa Berlatih ilmu data?Tutorial Online Ilmu Data . Kodementor. Codementor menawarkan tutorial untuk pemula dan profesional. . Topcoder. Situs web ini menawarkan tutorial yang membahas berbagai konsep yang terlibat dalam Ilmu Data dan memiliki platform bagi pakar industri untuk memberikan saran. . Analitis Vidhya. . KDnuggets. . R-blogger. . Data mengalir Di mana saya bisa berlatih Python online?Latih Python dengan 9 situs web ini . Kode. org. Anda pasti pernah mendengar pernyataan itu lebih dari sekali—semua anak harus belajar membuat kode. . CodingBat. . Editor Python Online PYnative. . Pelajaran Pribadi Online. . Proyek Euler |