Dalam panduan ini, kami akan membahas cara mempelajari Python untuk ilmu data, termasuk kurikulum favorit kami untuk belajar sendiri
Soalnya, ilmu data adalah tentang pemecahan masalah, eksplorasi, dan penggalian informasi berharga dari data
Untuk melakukannya secara efektif, Anda perlu mengatur set data, melatih model machine learning, memvisualisasikan hasil, dan banyak lagi. Masukkan Python
Ini adalah waktu terbaik untuk belajar Python. Faktanya, Berkeley menamakannya sebagai bahasa pemrograman paling laris kedua dalam hal permintaan pekerjaan. Mari kita bahas alasannya…
Mengapa Belajar Python untuk Ilmu Data?
Python adalah salah satu bahasa yang paling tersebar luas di dunia, dan memiliki komunitas pengguna yang bersemangat
[images style=”1″ image=”https%3A%2F%2Felitedatascience. com%2Fwp-content%2Fuploads%2F2022%2F07%2FPython-TIOBE-Index-2022. png” width=”889″ caption=”Python%20Popularity%2C%20%3Ca%20href%3D%22https%3A%2F%2Fwww. tiobe. com%2Ftiobe-index%2F%22%20target%3D%22_blank%22%3ETIOBE%20Index%3C%2Fa%3E” align=”center” top_margin=”0″ full_width=”Y”]
Ini memiliki pengikut yang lebih setia dalam profesi ilmu data
Beberapa orang menilai kualitas bahasa pemrograman dengan kesederhanaannya “halo, dunia. ” program. Python bekerja cukup baik menurut standar ini
Piton
1
cetak( "halo, dunia. " )
Sebagai perbandingan, inilah keluaran yang sama di Jawa
Jawa
1
2
3
4
5
publik kelas Utama {
publik statis batal utama(String[] args) {
Sistem. keluar. println("halo, dunia. ");
}
}
Bagus, kasus ditutup. Sampai jumpa kembali di sini setelah Anda menguasai Python?
Yah, sejujurnya, kesederhanaan adalah salah satu kekuatan terbesar Python. Berkat sintaksnya yang tepat dan efisien, Python dapat menyelesaikan tugas yang sama dengan kode yang lebih sedikit daripada bahasa lain. Hal ini membuat implementasi solusi menjadi lebih cepat
Selain itu, komunitas ilmu data Python yang dinamis berarti Anda akan dapat menemukan banyak tutorial, cuplikan kode, dan orang-orang yang bersimpati dengan perbaikan bug umum. Stackoverflow akan menjadi salah satu teman terbaik Anda
Terakhir, Python memiliki sederetan pustaka bintang (a. k. a. paket) untuk analisis data dan pembelajaran mesin, yang secara drastis mengurangi waktu yang diperlukan untuk memberikan hasil. Lebih lanjut tentang ini nanti
Cara Belajar Python Secara Efisien
Sebelum kita membahas apa yang perlu Anda pelajari, mari kita bahas apa yang tidak Anda perlukan
Anda tidak membutuhkan C. S. derajat
Sebagian besar ilmuwan data tidak akan pernah berurusan dengan topik seperti kebocoran memori, kriptografi, atau notasi "Big O". Anda akan baik-baik saja selama Anda dapat menulis kode yang bersih dan logis dalam bahasa skrip seperti Python atau R
Anda tidak memerlukan kursus lengkap tentang Python
Python dan ilmu data tidak identik
[images style=”0″ image=”https%3A%2F%2Felitedatascience. com%2Fwp-content%2Fuploads%2F2017%2F08%2FAAll-uses-for-Python. png” custom_width=”Y” width=”640″ custom_width_val=”360″ align=”center” top_margin=”0″ alt_text=”All%20Uses%20for%20Python” full_width=”Y”]
Anda tidak perlu menghafal semua sintaks
Alih-alih, fokuslah untuk memahami intuisi, seperti kapan fungsi sesuai atau bagaimana pernyataan bersyarat bekerja. Anda akan secara bertahap mengingat sintaks setelah Googling, membaca dokumentasi, dan praktik kuno yang baik
Kami merekomendasikan pendekatan top-down
Kami menganjurkan pendekatan dari atas ke bawah dengan tujuan mendapatkan hasil terlebih dahulu, lalu memperkuat konsep dari waktu ke waktu. Nyatanya, kami lebih suka menghentikan studi "ruang kelas" demi praktik dunia nyata
- Anda akan mulai dengan mempelajari konsep pemrograman inti
- Selanjutnya, Anda akan mendapatkan pengetahuan kerja tentang perpustakaan ilmu data yang penting
- Terakhir, Anda akan berlatih dan menyempurnakan keterampilan Anda melalui proyek nyata
Pendekatan ini akan memungkinkan Anda membangun penguasaan dari waktu ke waktu sambil bersenang-senang
[feature_box style=”33″ title=”Aside%3A%20 Installing%20Python%20through%20 Anaconda” alignment=”center”]
Ada banyak cara untuk menginstal Python di komputer Anda, tetapi kami merekomendasikan bundel Anaconda, yang disertakan dengan pustaka yang Anda perlukan untuk ilmu data. Lihat Panduan Mulai Cepat Python kami untuk informasi lebih lanjut
[/feature_box]
Langkah 1. Konsep Pemrograman Inti
Pemrograman yang efektif bukan tentang menghafal sintaks, melainkan menguasai cara berpikir yang baru
Oleh karena itu, luangkan waktu Anda untuk membangun fondasi yang kuat dari konsep pemrograman inti. Ini akan membantu Anda menerjemahkan solusi di kepala Anda menjadi instruksi untuk komputer
Jika Anda baru dalam pemrograman…
Jika Anda benar-benar baru dalam pemrograman, kami merekomendasikan buku Automate the Boring Stuff with Python yang luar biasa, yang telah dirilis secara online gratis di bawah lisensi creative commons
Buku ini menjanjikan "pemrograman praktis untuk pemula total", dan membuat setiap pelajaran tetap sederhana. Baca hingga Bab 6 – Memanipulasi String dan selesaikan soal latihan di sepanjang jalan
[images style=”1″ image=”https%3A%2F%2Felitedatascience. com%2Fwp-content%2Fuploads%2F2016%2F10%2FAutomate-the-Boring-Stuff-Cover. png” width=”227″ link_url=”https%3A%2F%2Fautomatetheboringstuff. com%2F” new_window=”Y” align=”center” top_margin=”0″ alt_text=”Otomatiskan%20the%20Boring%20Stuff%20by%20Al%20Sweigart” full_width=”Y”]
Jika Anda memiliki pengalaman dalam bahasa lain…
Jika Anda hanya perlu memoles sintaks Python, maka kami merekomendasikan video berikut, yang diberi nama “Pelajari Python dalam Satu Video”. ”
[video_player type=”youtube” youtube_remove_logo=”Y” youtube_show_title_bar=”Y” style=”1″ dimensions=”640×360″ width=”640″ height=”360″ align=”center” margin_top=”0″ margin_bottom
Sekali lagi, tujuan dari langkah ini bukan untuk mempelajari segala sesuatu tentang Python dan pemrograman. Sebaliknya, fokuslah pada intuisi
Anda harus dapat menjawab pertanyaan seperti
- Apa perbedaan antara integer, float, dan string?
- Bagaimana saya bisa menggunakan Python sebagai kalkulator?
- Apa itu for loop?
- Apa struktur dasar dari suatu fungsi?
- Bagaimana saya bisa menggunakan pernyataan bersyarat (jika… selain…) untuk menambahkan logika?
- Bagaimana cara kerja pernyataan impor?
Sumber daya tambahan
Jika Anda ingin lebih banyak berlatih dengan konsep pemrograman inti, lihat referensi berikut
- Edabit adalah platform dengan banyak tantangan pengkodean singkat yang dapat diselesaikan dalam potongan 5 menit. Sifatnya yang seukuran gigitan sangat cocok untuk membiasakan diri membuat kode setiap hari. Anda juga dapat memfilter tantangan dari Sangat Mudah hingga Pakar, jadi ada kurva perkembangan yang mulus
- Tantangan Python adalah salah satu teka-teki paling keren di web, jadi jangan kecewa dengan grafiknya dari tahun 1990-an. Anda dapat menyelesaikan semua 33 level dengan bantuan skrip Python. Salah satu pengguna menyebutnya “cara adiktif untuk mempelajari seluk beluk Python…” Kami setuju
- Berlatih Python. org adalah kumpulan soal latihan singkat dengan Python. Ini sering diperbarui dengan masalah baru. Apa yang benar-benar menyenangkan adalah penulis menyertakan beberapa solusi yang dikirimkan pengguna untuk setiap masalah sehingga Anda dapat melihat cara alternatif untuk menyelesaikannya
- How to Think Like a Computer Scientist adalah buku online interaktif fantastis yang melakukan tur angin puyuh melalui konsep pemrograman utama (dengan Python). Jika Anda benar-benar baru dalam pemrograman, ini mungkin pilihan yang bagus. Ini seperti huruf “C. S. Kursus 101”.
Langkah 2. Perpustakaan Ilmu Data Esensial
Selanjutnya, kita akan fokus pada untuk ilmu data bagian dari “cara belajar Python untuk ilmu data. ”
Seperti yang kami sebutkan sebelumnya, Python memiliki jajaran perpustakaan all-star untuk ilmu data. Pustaka hanyalah sekumpulan fungsi dan objek yang sudah ada sebelumnya yang dapat Anda impor ke dalam skrip untuk menghemat waktu
Ini adalah langkah-langkah tindakan yang kami rekomendasikan untuk mengambil perpustakaan baru secara efisien
- Buka Jupyter Notebook baru (lihat di bawah)
- Baca dokumentasi perpustakaan selama 30 menit untuk pengenalan tingkat tinggi modulnya
- Impor perpustakaan ke Notebook Jupyter Anda
- Ikuti tutorial mulai cepat langkah demi langkah untuk melihat perpustakaan beraksi
- Tinjau dokumentasinya selama 30 menit lagi untuk mempelajari kemampuannya
Kami tidak menyarankan menyelam lebih dalam ke perpustakaan sekarang karena Anda mungkin akan melupakan sebagian besar dari apa yang telah Anda pelajari saat Anda terjun ke proyek. Alih-alih, bertujuan untuk menemukan kemampuan setiap perpustakaan
Jika Anda menginstal Python melalui bundel Anaconda seperti yang kami rekomendasikan di atas, itu juga akan disertakan dengan Jupyter Notebook. Jupyter Notebook adalah IDE ringan yang menjadi favorit para data scientist. Kami merekomendasikannya untuk proyek Anda. Anda dapat membuka buku catatan baru melalui Anaconda Navigator, yang disertakan dengan Anaconda. Lihat video singkat ini untuk instruksi
Ini adalah perpustakaan penting yang Anda perlukan
NumPy
NumPy memungkinkan perhitungan numerik yang mudah dan efisien, dan banyak pustaka ilmu data lainnya dibangun di atasnya
- Dokumentasi
- Tutorial memulai cepat
Panda
Pandas adalah perpustakaan berkinerja tinggi untuk struktur data dan analisis eksplorasi. Itu dibangun di atas NumPy
- Dokumentasi
- Tutorial memulai cepat
Matplotlib
Matplotlib adalah pustaka perencanaan dan visualisasi yang fleksibel. Ini kuat tapi agak rumit. Anda memiliki opsi untuk melewatkan Matplotlib untuk saat ini dan menggunakan Seaborn untuk memulai (lihat rekomendasi Seaborn kami di bawah)
- Dokumentasi
- Tutorial memulai cepat
Scikit-Pelajari
Scikit-Learn adalah perpustakaan pembelajaran mesin tujuan umum utama dengan Python. Ini memiliki banyak algoritma dan modul populer untuk pra-pemrosesan, validasi silang, dan banyak lagi
- Dokumentasi
- Tutorial memulai cepat
Bonus. Yg keturunan dr laut
Seaborn membuatnya lebih mudah untuk memplot visualisasi data umum. Itu dibangun di atas Matplotlib dan menawarkan pembungkus tingkat tinggi yang lebih menyenangkan
- Dokumentasi
- Tutorial memulai cepat
Langkah 3. Proyek Akhir ke Akhir
Sekarang, Anda akan memiliki pemahaman dasar tentang pemrograman dan pengetahuan tentang pustaka penting. Ini sebenarnya mencakup sebagian besar Python yang Anda perlukan untuk memulai ilmu data
Pada titik ini, beberapa siswa akan merasa sedikit kewalahan. Tidak apa-apa, dan itu sangat normal
Jika Anda mengambil pendekatan bottom-up yang lambat dan tradisional, Anda mungkin merasa tidak terlalu kewalahan, tetapi Anda akan membutuhkan waktu 10 kali lebih lama untuk sampai ke sini
Sekarang kuncinya adalah menyelami segera dan mulai merekatkan semuanya. Sekali lagi, tujuan kami sampai di sini adalah untuk belajar cukup untuk memulai
Selanjutnya, saatnya memperkuat pengetahuan Anda melalui banyak latihan dan proyek
Anda memiliki beberapa opsi
Kompetisi Kaggle
Opsi pertama adalah berpartisipasi di Kaggle, situs yang menyelenggarakan kompetisi ilmu data
Keuntungan utama Kaggle adalah bahwa setiap proyek berdiri sendiri. Anda diberi kumpulan data, tujuan, dan tutorial untuk memulai
Kerugian utama dari kompetisi adalah bahwa mereka biasanya tidak mewakili ilmu data dunia nyata. Kompetisi "Memulai" terlalu mendasar sedangkan kompetisi standar (mis. e. mereka yang memiliki kumpulan hadiah) biasanya terlalu sulit untuk pemula
Jika Anda tertarik dengan jalur ini, lihat Panduan Pemula kami untuk Kaggle
Proyek DIY
Pilihan lainnya adalah menyusun proyek Anda sendiri dan memilih kumpulan data yang menarik bagi Anda
Keuntungan utama dari pendekatan ini adalah bahwa proyek tersebut lebih mewakili ilmu data dunia nyata. Anda mungkin perlu menentukan tujuan Anda sendiri, mengumpulkan data, membersihkan kumpulan data, fitur insinyur, dan sebagainya
Kerugian dari proyek DIY adalah Anda harus sudah terbiasa dengan alur kerja ilmu data yang tepat. Tanpa satu, Anda bisa kehilangan langkah-langkah penting atau terjebak tanpa mengetahui bagaimana untuk melanjutkan. Jika Anda mengikuti jalur ini, lihat artikel kami dengan beberapa ide proyek DIY