Bagaimana saya mulai belajar python untuk ilmu data?

Dalam panduan ini, kami akan membahas cara mempelajari Python untuk ilmu data, termasuk kurikulum favorit kami untuk belajar sendiri

Soalnya, ilmu data adalah tentang pemecahan masalah, eksplorasi, dan penggalian informasi berharga dari data

Untuk melakukannya secara efektif, Anda perlu mengatur set data, melatih model machine learning, memvisualisasikan hasil, dan banyak lagi. Masukkan Python

Ini adalah waktu terbaik untuk belajar Python. Faktanya, Berkeley menamakannya sebagai bahasa pemrograman paling laris kedua dalam hal permintaan pekerjaan. Mari kita bahas alasannya…

Mengapa Belajar Python untuk Ilmu Data?

Python adalah salah satu bahasa yang paling tersebar luas di dunia, dan memiliki komunitas pengguna yang bersemangat

[images style=”1″ image=”https%3A%2F%2Felitedatascience. com%2Fwp-content%2Fuploads%2F2022%2F07%2FPython-TIOBE-Index-2022. png” width=”889″ caption=”Python%20Popularity%2C%20%3Ca%20href%3D%22https%3A%2F%2Fwww. tiobe. com%2Ftiobe-index%2F%22%20target%3D%22_blank%22%3ETIOBE%20Index%3C%2Fa%3E” align=”center” top_margin=”0″ full_width=”Y”]

Ini memiliki pengikut yang lebih setia dalam profesi ilmu data

Beberapa orang menilai kualitas bahasa pemrograman dengan kesederhanaannya “halo, dunia. ” program. Python bekerja cukup baik menurut standar ini

Piton

1

cetak( "halo, dunia. " )

Sebagai perbandingan, inilah keluaran yang sama di Jawa

Jawa

1

2

3

4

5

publik kelas Utama {

    publik statis batal utama(String[] args) {

        Sistem. keluar. println("halo, dunia. ");

    }

}

Bagus, kasus ditutup. Sampai jumpa kembali di sini setelah Anda menguasai Python?

Yah, sejujurnya, kesederhanaan adalah salah satu kekuatan terbesar Python. Berkat sintaksnya yang tepat dan efisien, Python dapat menyelesaikan tugas yang sama dengan kode yang lebih sedikit daripada bahasa lain. Hal ini membuat implementasi solusi menjadi lebih cepat

Selain itu, komunitas ilmu data Python yang dinamis berarti Anda akan dapat menemukan banyak tutorial, cuplikan kode, dan orang-orang yang bersimpati dengan perbaikan bug umum. Stackoverflow akan menjadi salah satu teman terbaik Anda

Terakhir, Python memiliki sederetan pustaka bintang (a. k. a. paket) untuk analisis data dan pembelajaran mesin, yang secara drastis mengurangi waktu yang diperlukan untuk memberikan hasil. Lebih lanjut tentang ini nanti

Cara Belajar Python Secara Efisien

Sebelum kita membahas apa yang perlu Anda pelajari, mari kita bahas apa yang tidak Anda perlukan

Anda tidak membutuhkan C. S. derajat

Sebagian besar ilmuwan data tidak akan pernah berurusan dengan topik seperti kebocoran memori, kriptografi, atau notasi "Big O". Anda akan baik-baik saja selama Anda dapat menulis kode yang bersih dan logis dalam bahasa skrip seperti Python atau R

Anda tidak memerlukan kursus lengkap tentang Python

Python dan ilmu data tidak identik

[images style=”0″ image=”https%3A%2F%2Felitedatascience. com%2Fwp-content%2Fuploads%2F2017%2F08%2FAAll-uses-for-Python. png” custom_width=”Y” width=”640″ custom_width_val=”360″ align=”center” top_margin=”0″ alt_text=”All%20Uses%20for%20Python” full_width=”Y”]

Anda tidak perlu menghafal semua sintaks

Alih-alih, fokuslah untuk memahami intuisi, seperti kapan fungsi sesuai atau bagaimana pernyataan bersyarat bekerja. Anda akan secara bertahap mengingat sintaks setelah Googling, membaca dokumentasi, dan praktik kuno yang baik

Kami merekomendasikan pendekatan top-down

Kami menganjurkan pendekatan dari atas ke bawah dengan tujuan mendapatkan hasil terlebih dahulu, lalu memperkuat konsep dari waktu ke waktu. Nyatanya, kami lebih suka menghentikan studi "ruang kelas" demi praktik dunia nyata

  1. Anda akan mulai dengan mempelajari konsep pemrograman inti
  2. Selanjutnya, Anda akan mendapatkan pengetahuan kerja tentang perpustakaan ilmu data yang penting
  3. Terakhir, Anda akan berlatih dan menyempurnakan keterampilan Anda melalui proyek nyata

Pendekatan ini akan memungkinkan Anda membangun penguasaan dari waktu ke waktu sambil bersenang-senang

[feature_box style=”33″ title=”Aside%3A%20 Installing%20Python%20through%20 Anaconda” alignment=”center”]

Ada banyak cara untuk menginstal Python di komputer Anda, tetapi kami merekomendasikan bundel Anaconda, yang disertakan dengan pustaka yang Anda perlukan untuk ilmu data. Lihat Panduan Mulai Cepat Python kami untuk informasi lebih lanjut

[/feature_box]

Langkah 1. Konsep Pemrograman Inti

Pemrograman yang efektif bukan tentang menghafal sintaks, melainkan menguasai cara berpikir yang baru

Oleh karena itu, luangkan waktu Anda untuk membangun fondasi yang kuat dari konsep pemrograman inti. Ini akan membantu Anda menerjemahkan solusi di kepala Anda menjadi instruksi untuk komputer

Jika Anda baru dalam pemrograman…

Jika Anda benar-benar baru dalam pemrograman, kami merekomendasikan buku Automate the Boring Stuff with Python yang luar biasa, yang telah dirilis secara online gratis di bawah lisensi creative commons

Buku ini menjanjikan "pemrograman praktis untuk pemula total", dan membuat setiap pelajaran tetap sederhana. Baca hingga Bab 6 – Memanipulasi String dan selesaikan soal latihan di sepanjang jalan

[images style=”1″ image=”https%3A%2F%2Felitedatascience. com%2Fwp-content%2Fuploads%2F2016%2F10%2FAutomate-the-Boring-Stuff-Cover. png” width=”227″ link_url=”https%3A%2F%2Fautomatetheboringstuff. com%2F” new_window=”Y” align=”center” top_margin=”0″ alt_text=”Otomatiskan%20the%20Boring%20Stuff%20by%20Al%20Sweigart” full_width=”Y”]

Jika Anda memiliki pengalaman dalam bahasa lain…

Jika Anda hanya perlu memoles sintaks Python, maka kami merekomendasikan video berikut, yang diberi nama “Pelajari Python dalam Satu Video”. ”

[video_player type=”youtube” youtube_remove_logo=”Y” youtube_show_title_bar=”Y” style=”1″ dimensions=”640×360″ width=”640″ height=”360″ align=”center” margin_top=”0″ margin_bottom

Sekali lagi, tujuan dari langkah ini bukan untuk mempelajari segala sesuatu tentang Python dan pemrograman. Sebaliknya, fokuslah pada intuisi

Anda harus dapat menjawab pertanyaan seperti

  • Apa perbedaan antara integer, float, dan string?
  • Bagaimana saya bisa menggunakan Python sebagai kalkulator?
  • Apa itu for loop?
  • Apa struktur dasar dari suatu fungsi?
  • Bagaimana saya bisa menggunakan pernyataan bersyarat (jika… selain…) untuk menambahkan logika?
  • Bagaimana cara kerja pernyataan impor?

Sumber daya tambahan

Jika Anda ingin lebih banyak berlatih dengan konsep pemrograman inti, lihat referensi berikut

  • Edabit adalah platform dengan banyak tantangan pengkodean singkat yang dapat diselesaikan dalam potongan 5 menit. Sifatnya yang seukuran gigitan sangat cocok untuk membiasakan diri membuat kode setiap hari. Anda juga dapat memfilter tantangan dari Sangat Mudah hingga Pakar, jadi ada kurva perkembangan yang mulus
  • Tantangan Python adalah salah satu teka-teki paling keren di web, jadi jangan kecewa dengan grafiknya dari tahun 1990-an. Anda dapat menyelesaikan semua 33 level dengan bantuan skrip Python. Salah satu pengguna menyebutnya “cara adiktif untuk mempelajari seluk beluk Python…” Kami setuju
  • Berlatih Python. org adalah kumpulan soal latihan singkat dengan Python. Ini sering diperbarui dengan masalah baru. Apa yang benar-benar menyenangkan adalah penulis menyertakan beberapa solusi yang dikirimkan pengguna untuk setiap masalah sehingga Anda dapat melihat cara alternatif untuk menyelesaikannya
  • How to Think Like a Computer Scientist adalah buku online interaktif fantastis yang melakukan tur angin puyuh melalui konsep pemrograman utama (dengan Python). Jika Anda benar-benar baru dalam pemrograman, ini mungkin pilihan yang bagus. Ini seperti huruf “C. S. Kursus 101”.

Langkah 2. Perpustakaan Ilmu Data Esensial

Selanjutnya, kita akan fokus pada untuk ilmu data bagian dari “cara belajar Python untuk ilmu data. ”

Seperti yang kami sebutkan sebelumnya, Python memiliki jajaran perpustakaan all-star untuk ilmu data. Pustaka hanyalah sekumpulan fungsi dan objek yang sudah ada sebelumnya yang dapat Anda impor ke dalam skrip untuk menghemat waktu

Ini adalah langkah-langkah tindakan yang kami rekomendasikan untuk mengambil perpustakaan baru secara efisien

  1. Buka Jupyter Notebook baru (lihat di bawah)
  2. Baca dokumentasi perpustakaan selama 30 menit untuk pengenalan tingkat tinggi modulnya
  3. Impor perpustakaan ke Notebook Jupyter Anda
  4. Ikuti tutorial mulai cepat langkah demi langkah untuk melihat perpustakaan beraksi
  5. Tinjau dokumentasinya selama 30 menit lagi untuk mempelajari kemampuannya

Kami tidak menyarankan menyelam lebih dalam ke perpustakaan sekarang karena Anda mungkin akan melupakan sebagian besar dari apa yang telah Anda pelajari saat Anda terjun ke proyek. Alih-alih, bertujuan untuk menemukan kemampuan setiap perpustakaan

Jika Anda menginstal Python melalui bundel Anaconda seperti yang kami rekomendasikan di atas, itu juga akan disertakan dengan Jupyter Notebook. Jupyter Notebook adalah IDE ringan yang menjadi favorit para data scientist. Kami merekomendasikannya untuk proyek Anda. Anda dapat membuka buku catatan baru melalui Anaconda Navigator, yang disertakan dengan Anaconda. Lihat video singkat ini untuk instruksi

Ini adalah perpustakaan penting yang Anda perlukan

NumPy

NumPy memungkinkan perhitungan numerik yang mudah dan efisien, dan banyak pustaka ilmu data lainnya dibangun di atasnya

  • Dokumentasi
  • Tutorial memulai cepat

Panda

Pandas adalah perpustakaan berkinerja tinggi untuk struktur data dan analisis eksplorasi. Itu dibangun di atas NumPy

  • Dokumentasi
  • Tutorial memulai cepat

Matplotlib

Matplotlib adalah pustaka perencanaan dan visualisasi yang fleksibel. Ini kuat tapi agak rumit. Anda memiliki opsi untuk melewatkan Matplotlib untuk saat ini dan menggunakan Seaborn untuk memulai (lihat rekomendasi Seaborn kami di bawah)

  • Dokumentasi
  • Tutorial memulai cepat

Scikit-Pelajari

Scikit-Learn adalah perpustakaan pembelajaran mesin tujuan umum utama dengan Python. Ini memiliki banyak algoritma dan modul populer untuk pra-pemrosesan, validasi silang, dan banyak lagi

  • Dokumentasi
  • Tutorial memulai cepat

Bonus. Yg keturunan dr laut

Seaborn membuatnya lebih mudah untuk memplot visualisasi data umum. Itu dibangun di atas Matplotlib dan menawarkan pembungkus tingkat tinggi yang lebih menyenangkan

  • Dokumentasi
  • Tutorial memulai cepat

Langkah 3. Proyek Akhir ke Akhir

Sekarang, Anda akan memiliki pemahaman dasar tentang pemrograman dan pengetahuan tentang pustaka penting. Ini sebenarnya mencakup sebagian besar Python yang Anda perlukan untuk memulai ilmu data

Pada titik ini, beberapa siswa akan merasa sedikit kewalahan. Tidak apa-apa, dan itu sangat normal

Jika Anda mengambil pendekatan bottom-up yang lambat dan tradisional, Anda mungkin merasa tidak terlalu kewalahan, tetapi Anda akan membutuhkan waktu 10 kali lebih lama untuk sampai ke sini

Sekarang kuncinya adalah menyelami segera dan mulai merekatkan semuanya. Sekali lagi, tujuan kami sampai di sini adalah untuk belajar cukup untuk memulai

Selanjutnya, saatnya memperkuat pengetahuan Anda melalui banyak latihan dan proyek

Anda memiliki beberapa opsi

Kompetisi Kaggle

Opsi pertama adalah berpartisipasi di Kaggle, situs yang menyelenggarakan kompetisi ilmu data

Keuntungan utama Kaggle adalah bahwa setiap proyek berdiri sendiri. Anda diberi kumpulan data, tujuan, dan tutorial untuk memulai

Kerugian utama dari kompetisi adalah bahwa mereka biasanya tidak mewakili ilmu data dunia nyata. Kompetisi "Memulai" terlalu mendasar sedangkan kompetisi standar (mis. e. mereka yang memiliki kumpulan hadiah) biasanya terlalu sulit untuk pemula

Jika Anda tertarik dengan jalur ini, lihat Panduan Pemula kami untuk Kaggle

Proyek DIY

Pilihan lainnya adalah menyusun proyek Anda sendiri dan memilih kumpulan data yang menarik bagi Anda

Keuntungan utama dari pendekatan ini adalah bahwa proyek tersebut lebih mewakili ilmu data dunia nyata. Anda mungkin perlu menentukan tujuan Anda sendiri, mengumpulkan data, membersihkan kumpulan data, fitur insinyur, dan sebagainya

Kerugian dari proyek DIY adalah Anda harus sudah terbiasa dengan alur kerja ilmu data yang tepat. Tanpa satu, Anda bisa kehilangan langkah-langkah penting atau terjebak tanpa mengetahui bagaimana untuk melanjutkan. Jika Anda mengikuti jalur ini, lihat artikel kami dengan beberapa ide proyek DIY

Bagaimana seharusnya seorang pemula mulai belajar Python?

11 Tips Pemula untuk Mempelajari Pemrograman Python .
Buatlah Menempel. Kiat #1. Kode Setiap Hari. Kiat #2. Tuliskan. .
Jadikan Kolaboratif. Kiat #6. Kelilingi Diri Anda Dengan Orang Lain Yang Sedang Belajar. Kiat #7. Mengajar. .
Buat Sesuatu. Kiat #10. Bangun Sesuatu, Apa Saja. Kiat #11. Berkontribusi pada Sumber Terbuka
Maju dan Belajar

Apakah mudah mempelajari ilmu data dengan Python?

Karena kesederhanaan dan kemudahan penggunaannya, Python untuk ilmu data adalah salah satu bahasa pemrograman paling populer di bidang ilmiah dan penelitian. Orang tanpa latar belakang teknik dapat dengan mudah mempelajari cara menggunakannya karena kesederhanaan dan pustakanya yang besar .

Apa yang harus saya pelajari untuk ilmu data dengan Python?

Jalur pembelajaran komprehensif – Ilmu Data dengan Python .
Langkah 0. Pemanasan. .
Langkah 2. Pelajari dasar-dasar bahasa Python. .
Langkah 3. Pelajari Ekspresi Reguler dengan Python. .
Langkah 4. Pelajari pustaka Ilmiah dengan Python – NumPy, SciPy, Matplotlib, dan Pandas. .
Langkah 5. Visualisasi Data yang Efektif

Berapa hari yang dibutuhkan untuk mempelajari Python untuk ilmu data?

Secara umum, dibutuhkan sekitar dua hingga enam bulan untuk mempelajari dasar-dasar Python. Tapi Anda bisa belajar cukup banyak untuk menulis program singkat pertama Anda dalam hitungan menit. Mengembangkan penguasaan array yang luas dari perpustakaan Python bisa memakan waktu berbulan-bulan atau bertahun-tahun.