Salah satu bagian penting dalam data science adalah visualisasi data atau data visualization. Saat kita melakukan analisis untuk menemukan insight dari suatu data, kita akan sangat membutuhkan visualisasi agar data yang dimiliki lebih mudah dipahami. Apalagi jika dataset yang sedang dianalisis berukuran sangat besar, tentunya visualisasi data akan sangat membantu. Show Matplotlib adalah salah satu library yang populer yang dapat digunakan dengan mudah untuk data visualization. Pada artikel ini saya akan membahas 5 jenis visualisasi data di Python menggunakan Matplotlib yang sering digunakan untuk menampilkan berbagai informasi dari suatu dataset. Line PlotLine plot atau line chart adalah jenis plot yang menampilkan informasi berupa rangkaian titik data yang terhubung dengan segmen garis lurus. Line plot merupakan jenis plot dasar dalam visualisasi data. Plot jenis ini dapat digunakan pada dataset yang memiliki nilai kontinu untuk melihat pergerakan data. Contoh kode Python untuk membuat Line Plot menggunakan dataset Video Game Sales df_join = df_vg[['Rank','NA_Sales', 'EU_Sales', 'JP_Sales', 'Other_Sales', 'Global_Sales']].head(10) Baca juga: 2 Cara Implementasi One-Hot Encoding di Python Output: Scatter PlotScatter plot adalah jenis visualisasi data untuk menunjukkan hubungan antara dua variabel. Dengan scatter plot, Anda dapat melihat distribusi data dan bagaimana trend-nya. Anda juga dapat menggunakan scatter plot untuk melihat hubungan dari beberapa kelompok data dengan memberikan warna yang berbeda untuk membedakan tiap kelompok data. Contoh kode Python untuk membuat scatter plot menggunakan dataset Iris fig, ax = plt.subplots(figsize=(10, 6)) Output: Bar PlotBar plot atau bar chart adalah jenis plot yang direpresentasikan dengan bar, dimana panjang bar adalah representasi dari ukuran sebuah fitur atau variabel. Bar plot biasanya merepresentasikan variabel numerik dan kategori yang dikelompokkan dalam interval. Baca juga: Algoritma K-Nearest Neighbor (KNN) Untuk Klasifikasi Contoh kode Python untuk membuat bar plot menggunakan dataset California Housing Prices count = df_pri['ocean_proximity'].value_counts() Output: Box PlotBox plot adalah jenis visualisasi data yang secara statistik merepresentasikan distribusi data melalui lima dimensi utama, yaitu nilai minimum, kuartil 1, kuartil 2 (median), kuartil 3, dan nilai maksimum. Biasanya box plot digunakan untuk memeriksa keberadaan outlier dalam dataset. Contoh kode Python untuk membuat box plot menggunakan dataset Iris # create box plot Output: HistogramHistogram adalah jenis visualisasi data untuk merepresentasikan distribusi frekuensi dari dataset numerik. Sumbu X merepresentasikan bin dari data point, sedangkan sumbu Y merepresentasikan frekuensi atau banyaknya data point pada setiap bin. Ukuran bin dapat disesuaikan agar distribusinya terlihat bagus. Namun, default-nya Python akan membagi menjadi 10 bin. Baca juga: Pengenalan Arsitektur Matplotlib Python Contoh kode Python untuk membuat histogram menggunakan dataset California Housing Prices # create histogram Output: Contoh-contoh di atas adalah visualisasi data sederhana yang dapat dibuat dengan Matplotlib di Python. Anda juga dapat membuat plot-plot yang lebih kompleks dengan mengatur parameternya serta memanfaatkan fungsi-fungsi lain yang dapat diterapkan. Library Python manakah yang digunakan di data Science untuk visualisasi data?Matplotlib, merupakan package visualisasi data yang banyak digunakan di Python. Library ini mampu untuk menghasilkan visualisasi seperti histogram, grafik, plot, serta bisa di custom hingga bagian terkecil.
Library Python untuk apa?Library Python ini sendiri merupakan kumpulan modul terkait berisi kumpulan kode yang dapat digunakan berulang kali dalam program yang berbeda. Library ini membuat Pemrograman Python lebih sederhana dan nyaman bagi programmer.
Langkah langkah dalam memvisualisasikan data?Langkah-langkah membuat visualisasi data. Tentukan pertanyaan terkait data. ... . Pahami data dan tentukan bentuk visualnya. ... . 3. Identifikasi pesan yang ingin disampaikan. ... . Pilih bentuk visual yang akan digunakan. ... . Kreasikan dengan berbagai warna dan bentuk.. Library NumPy untuk apa?NumPy (Numerical Python) adalah library Python yang fokus pada scientific computing. Simpelnya: Numpy menyediakan fungsi yang siap pakai untuk memudahkan kita melakukan perhitungan saintifik seperti matriks, aljabar, statistik, dan sebagainya.
|