Kursus ini adalah langkah awal yang baik untuk memahami proses analisis data secara keseluruhan. Sebelum mempelajari setiap fase individu, penting untuk mempelajari perbedaan antara semua fase proses dan bagaimana mereka berhubungan satu sama lain. Setelah mengikuti kursus ini, Anda akan berada pada posisi yang lebih baik untuk berhasil dalam kursus lain dalam program Nanodegree Analis Data. Misalnya, seorang siswa yang memulai dengan Analisis Data dengan R, yang mencakup fase analisis data eksplorasi, mungkin pada saat itu tidak memahami perbedaan antara eksplorasi data dan perselisihan data. Dengan mengikuti kursus ini terlebih dahulu, Anda akan mempelajari apa yang dicapai setiap fase dan bagaimana hal itu sesuai dengan proses yang lebih besar
Kursus ini juga mencakup pustaka Python NumPy, Pandas, dan Matplotlib, yang merupakan alat yang sangat diperlukan untuk melakukan analisis data dengan Python. Banyak fungsinya yang nyaman dan kinerja tinggi membuat penulisan kode analisis data jauh lebih mudah
Anda tahu Python. Anda tahu Excel. Anda bahkan mungkin tahu cara mengolah angka dalam R menggunakan Tidyverse jika Anda memiliki latar belakang statistik
Tetapi ketika harus menerapkan semua pengetahuan ini ke dunia ilmu data, Anda tahu bahwa Anda membutuhkan lebih dari sekadar alat ini untuk berhasil. Yang membuat keadaan menjadi lebih buruk adalah Anda tidak yakin dengan urutan apa Anda harus mempelajari alat ilmu data mana. Ini bisa menjadi tantangan untuk mengetahui dengan tepat di mana harus fokus, dan bagaimana menerapkan apa yang Anda ketahui
Di Mass Street University, kami memandu ahli statistik dan pengembang yang tertarik untuk mengeksplorasi cara memproses dan menganalisis data—secara efisien. Dalam Python untuk Analisis Data, kami memfokuskan Anda pada apa yang perlu Anda ketahui, dan mengajari Anda cara terbaik untuk memanfaatkan apa yang sudah Anda ketahui
Dalam kursus ini, kami akan mengajari Anda cara menggabungkan pengetahuan Anda tentang Python dengan alat seperti Pandas dan Numpy. Jika Anda hanya bekerja dengan tipe data Python dasar, mendekati beberapa tipe data tingkat tinggi dapat mengintimidasi. Struktur kursus kami membawa Anda dari alat yang paling sederhana ke yang lebih kompleks untuk memastikan Anda tetap fokus pada apa yang Anda butuhkan sambil membangun font pengetahuan sains data Anda
JupyterLab adalah salah satu alat yang mungkin tidak Anda kenal, dan ini adalah notebook analisis data populer yang mendukung banyak bahasa, termasuk Python. Teknologi notebook relatif baru di dunia ilmu data, dan kami akan membahas bagaimana JupyterLab memungkinkan Anda menulis kode dalam jumlah yang jauh lebih kecil secara efisien
Ada banyak alat ilmu data yang berinteraksi sangat baik dengan Python untuk memudahkan ilmu data saat dieksplorasi dan diajarkan dengan benar. Dan di Mass Street University, kami memastikan bahwa dinamika ini dikelola seefisien mungkin. Daftar hari ini di Python untuk Analisis Data agar tetap fokus pada apa yang Anda butuhkan untuk unggul dalam analisis data
Analisis Data selalu menjadi bidang yang sangat penting dan keterampilan yang sangat dituntut. Sampai saat ini, telah dipraktikkan menggunakan alat yang sebagian besar tertutup, mahal, dan terbatas seperti Excel atau Tableau. Python, panda, dan pustaka sumber terbuka lainnya telah mengubah Analisis Data selamanya dan telah menjadi alat yang harus dimiliki oleh siapa pun yang ingin membangun karier sebagai Analis Data
BELAJAR MENGANALISIS DATA DENGAN PYTHON
Pelajari cara menganalisis data menggunakan Python. Kursus ini akan membawa Anda dari dasar-dasar Python hingga menjelajahi berbagai jenis data. Anda akan mempelajari cara menyiapkan data untuk analisis, melakukan analisis statistik sederhana, membuat visualisasi data yang bermakna, memprediksi tren masa depan dari data, dan banyak lagi
- Impor set data
- Bersihkan dan siapkan data untuk analisis
- Memanipulasi panda DataFrame
- Ringkas data
- Bangun model pembelajaran mesin menggunakan scikit-learn
- Membangun saluran data
Analisis Data dengan Python disampaikan melalui kuliah, praktik langsung, dan tugas. Ini termasuk bagian-bagian berikut
- Pustaka Analisis Data. akan belajar menggunakan Pandas DataFrames, array multi-dimensi Numpy, dan pustaka SciPy untuk bekerja dengan berbagai kumpulan data. Kami akan memperkenalkan Anda pada panda, pustaka sumber terbuka, dan kami akan menggunakannya untuk memuat, memanipulasi, menganalisis, dan memvisualisasikan kumpulan data keren. Kemudian kami akan memperkenalkan Anda ke pustaka sumber terbuka lainnya, scikit-learn, dan kami akan menggunakan beberapa algoritme pembelajaran mesinnya untuk membuat model cerdas dan membuat prediksi keren
Modul 1 - Mengimpor Kumpulan Data
- Tujuan pembelajaran
- Memahami Domain
- Memahami Kumpulan Data
- Paket Python untuk ilmu data
- Mengimpor dan Mengekspor Data dengan Python
- Wawasan Dasar dari Kumpulan Data
Modul 2 - Membersihkan dan Menyiapkan Data
- Identifikasi dan Tangani Nilai yang Hilang
- Pemformatan Data
- Set Normalisasi Data
- Binning
- Variabel indikator
Modul 3 - Meringkas Bingkai Data
- Statistik deskriptif
- Dasar Pengelompokan
- ANOVA
- Korelasi
- Lebih lanjut tentang Korelasi
Modul 4 - Pengembangan Model
- Regresi Linear Sederhana dan Berganda
- Evaluasi Model Menggunakan Visualisasi
- Regresi Polinomial dan Pipa
- R-squared dan MSE untuk In-Sample Evaluation
- Prediksi dan Pengambilan Keputusan
Modul 5 - Evaluasi Model
- Evaluasi Model
- Over-fitting, Under-fitting, dan Pemilihan Model
- Regresi Punggungan
- Pencarian Kisi
- Penyempurnaan Model
- Kursus ini berjalan sendiri
- Bisa diambil kapan saja
- Itu dapat diaudit sebanyak yang Anda inginkan
- Pemrograman Python, Statistik
- Beberapa pengalaman Python diharapkan
- Python untuk Ilmu Data