Tampilkan kerangka data dalam python gui

PandasGUI hadir dengan kumpulan data sampel yang akan diunduh pada penggunaan pertama. Anda juga dapat mengimpor all_datasets yang merupakan kamus dari semua kumpulan data sampel seperti Dict[str, DataFrame]

from pandasgui import show
from pandasgui.datasets import pokemon, titanic, all_datasets
show(pokemon, titanic)
show(**all_datasets)

Fitur

  • Lihat DataFrames dan Seri (dengan dukungan MultiIndex)
  • Plot interaktif
  • Penyaringan
  • Ringkasan statistik
  • Pengeditan data dan salin/tempel
  • Impor file CSV dengan drag & drop
  • Bilah alat pencarian

Info lebih lanjut

Masalah, umpan balik, dan permintaan tarik dipersilakan

Proyek ini masih dalam versi 0. x. y dan dapat melanggar perubahan. Perubahan terbaru akan berada di cabang develop, dan kadang-kadang akan digabungkan ke master sebagai rilis dengan tag yang menunjukkan nomor versi dan dipublikasikan ke PyPi

Jika Anda menyukai proyek ini, ingatlah untuk meninggalkan ⭐. Dan jika Anda ingin memberi lebih banyak dukungan, Anda dapat membeli saya kopi

Berapa kali Anda menggunakan perpustakaan Panda untuk tugas Ilmu Data Anda? . Pandas adalah perpustakaan penting untuk manipulasi data dan menghasilkan wawasan dari kumpulan data dalam bentuk tabel ringkasan, visualisasi, dan banyak lagi

PandasGUI adalah library berbasis Python yang memfasilitasi manipulasi data dan ringkasan statistik untuk diterapkan pada dataset menggunakan GUI. Itu berarti bahwa semua operasi akan dilakukan melalui antarmuka pengguna grafis (GUI), tetapi panda akan digunakan untuk menjalankannya di balik layar.

Pada artikel ini, saya akan memandu Anda melalui semua fitur pustaka ini, cara menghasilkan plot interaktif, dan cara mengakses kode Python otomatis yang dibuat untuk semua operasi yang dilakukan melalui GUI

Tampilkan kerangka data dalam python gui
(Gambar oleh Penulis, Dibuat di Canva)

Instalasi

PandasGUI adalah paket Python dan dapat diinstal melalui pengelola paket pip. Catatan. Saya akan merekomendasikan menggunakan Python 3. 8 ke atas untuk pemasangan. Selain itu, pastikan untuk membuat lingkungan terpisah (lingkungan virtual) dan instal pustaka di lingkungan tersebut

Membuat lingkungan virtual (conda)

Jalankan perintah ini di terminal Anda

conda create -n nameofenv python=version
conda activate nameofenv

Menginstal pandasgui

pip install pandasgui

Butuh sedikit untuk menginstal perpustakaan karena dependensinya cukup berat

Mempersiapkan

Hal pertama yang pertama, muat perpustakaan. Kami tertarik dengan fungsi show() dari pustaka pandasGUI yang menginisialisasi aplikasi

from pandasgui import show
_

Fungsi ini dapat digunakan dengan dua cara

  1. Anda dapat langsung membuat instance fungsi pertunjukan pandasGUI yang akan membuka aplikasi tanpa kumpulan data apa pun
  2. Anda dapat meneruskan kerangka data ke fungsi dan aplikasi akan diisi dengan baris dan kolom kumpulan data. Dengan cara ini, Anda dapat memuat beberapa set data sekaligus melewati semua objek kerangka data ke metode show()

Untuk saat ini, kami akan memuat aplikasi tanpa dataset apa pun,

show()

Dan Anda akan mendapatkan tampilan seperti ini

Layar pertama kali

Berbagai fitur

Sekarang, kami akan menjelajahi semua fitur aplikasi ini selangkah demi selangkah

Memuat Kumpulan Data

Untuk memuat kumpulan data ke dalam aplikasi, Anda memiliki berbagai opsi

  1. Lewati objek dataframe ke dalam fungsi show
  2. Tambahkan secara manual menggunakan opsi "Impor" menu Edit
  3. Impor dataframe dari clipboard menggunakan menu Edit "Import From Clipboard"
  4. Gunakan menu Debug "Browse Sample Datasets" untuk memuat dataset sampel apa pun untuk pengujian
  5. Seret dan jatuhkan file CSV ke dalam aplikasi

Lihat GIF di bawah ini

Tampilkan kerangka data dalam python gui

Operasi di Layar

Terlepas dari berbagai tab dan menu yang ditawarkan oleh aplikasi pandasGUI, ada beberapa operasi yang dapat Anda terapkan secara langsung dengan memicu elemen GUI yang ditampilkan.

1. Semua sel dari kumpulan data yang ditampilkan dapat diedit. Anda dapat mengklik salah satu sel dan melakukan pengeditan. Ini sangat mirip dengan apa yang Anda lakukan di lembar excel. Nilai apa pun dapat langsung diubah

Tampilkan kerangka data dalam python gui

2. Klik kanan pada tajuk kolom akan memberi Anda menu kolom interaktif yang berisi opsi untuk menyortir kolom dengan urutan naik, turun, memindahkan kolom ke ujung ekstrem atau dalam rentang, mem-parsing kolom yang berisi tanggal sebagai string ke format datetime panda,

Opsi Tajuk Kolom

3. Dengan menyeret dan memilih bagian mana pun dari kumpulan data, Anda dapat menyalin bagian tersebut dan menempelkannya ke sel mana pun di lembar excel. Ini akan secara otomatis diubah menjadi format tabel seperti yang ditunjukkan dalam aplikasi itu sendiri

Tampilkan kerangka data dalam python gui

4. Klik kanan pada nama kerangka data di panel kiri muncul opsi untuk menghapus kerangka data dari aplikasi

Filter

Menerapkan filter ke kumpulan data adalah salah satu tugas terpenting dalam tugas ilmu data apa pun. Ini membantu dalam mengisolasi segmen dataset dan mengerjakan bagian yang terisolasi itu. Di panda, Anda biasanya menggunakan perbandingan, nilai ambang dengan kolom, atau seluruh kumpulan data untuk memfilter data. Di pandasGUI, Anda dapat melakukan jenis pemfilteran yang sama menggunakan tab Filter di sebelah kanan

Cukup ketikkan ekspresi untuk pemfilteran dan hanya data yang memenuhi syarat yang akan ditampilkan. Lihat contoh di bawah ini

Memfilter data dengan “cut=ideal”

Anda dapat menerapkan beberapa filter dan mengaktifkan/menonaktifkannya menggunakan kotak centang di sebelah kiri. Lihat contoh di bawah ini di mana beberapa filer diterapkan

Contoh di mana beberapa filter diterapkan ke kumpulan data

Catatan. Semua filter diterapkan menggunakan “pandas. kerangka data. query()” di bawah tenda

Tab Statistik

Statistik memainkan peran penting dalam tampilan deskriptif dari semua fitur dataset. Ini berisi parameter seperti persentil yang membantu dalam mendapatkan wawasan tentang bagaimana data tersebar, rata-rata, yang dipengaruhi oleh outlier, masih dapat memberi tahu kita tentang pusat data dan standar deviasi memberi tahu tentang seberapa banyak data kolom bervariasi di dalamnya. Kolom dengan standar deviasi 0 tidak akan berguna karena ini berarti bahwa semua nilai kolom adalah sama yang tidak membantu untuk memprediksi nilai target

Untuk menyimpulkan wawasan tersebut, klik pada tab statistik dan Anda akan mendapatkan ringkasan jenis data, jumlah, jumlah nilai unik, rata-rata, standar deviasi, dan min-max. Untuk nilai tipe string, parameter yang dihitung secara numerik seperti rata-rata akan menjadi nol

Ringkasan Statistik

Tab Grapher

Grafik dan visualisasi adalah alat yang sangat ampuh dalam menyajikan ringkasan data menggunakan elemen visual. Misalnya, grafik Distribusi dapat membantu dalam menentukan apakah nilai kolom sejajar dengan distribusi normal/kurva berbentuk lonceng yang menyederhanakan tugas kita untuk menentukan parameter populasi dan menyimpulkan fakta berdasarkan sampel

Boxplot membantu dalam menentukan sebaran data, berapa banyak nilai yang harus dianggap sebagai outlier. Itu juga mewakili di mana 50% dari data berada. Jenis plot lain seperti histogram, diagram batang, plot pencar, plot garis, kontur memiliki kelebihannya sendiri, dan oleh karena itu, memplot data itu penting

Untuk memplot visualisasi tersebut menggunakan pandasGUI, cukup beralih ke tab Grapher dan Anda akan mendapatkan layar awal seperti ini

Layar awal tab Grapher

Anda dapat memilih dari histogram, plot pencar, diagram batang, plot kotak, plot biola, 3D pencar, peta panas, plot kontur, diagram lingkaran, splom, kandil, kandil, dan awan kata. Semua plot ini dibuat menggunakan perpustakaan Plotly di backend dan oleh karena itu, plot bersifat interaktif

Mari plot beberapa data. Untuk melakukan plotting, cukup pilih semua jenis plot, lalu seret nama kolom dari panel kiri ke parameter plot yang disebutkan di sebelah kanannya. Lihat contoh di bawah ini

Tampilkan kerangka data dalam python gui
Plot pencar

Anda dapat melihat bahwa ketika "x" meningkat, "harga" meningkat secara eksponensial. Plot bersifat interaktif karena backend plotly. Parameter seperti "x", "y", "color" berubah sesuai plot yang akan ditampilkan. Misalnya, Anda tidak akan mendapatkan parameter "x", "y" untuk kata cloud

Mari plot cloud kata untuk kumpulan data yang berbeda, ulasan aplikasi Google Play Store, yang berisi informasi tekstual tentang umpan balik aplikasi

Awan kata untuk ulasan aplikasi toko Google Play

Opsi umum lainnya tersedia untuk setiap plot yang tersedia di bagian bawah kolom dan panel parameter. Ini termasuk

Kwarg kustom. Saat pembuatan plot dilakukan secara plot, Anda dapat menambahkan semua kwarg yang didukung oleh plotly express. Argumen saat ini mungkin dibatasi untuk kasus penggunaan terbaik, tetapi Anda dapat meneruskan argumen khusus menggunakan opsi ini. Misalnya, nama default kolom "x" dapat diubah menjadi nama lain menggunakan argumen "label".

Kwarg kustom

Simpan HTML. Dengan menggunakan opsi ini, Anda dapat menyimpan plot yang dihasilkan ke dalam file HTML. File ini dapat digunakan secara mandiri tanpa memerlukan backend apa pun. File HTML menampilkan grafik secara interaktif menggunakan JavaScript

Mengatur ulang. Opsi ini menghapus semua nilai parameter

Ekspor Kode. Anda dapat mengekspor kode untuk memplot grafik menggunakan opsi ini. Kode akan kekurangan kata kunci khusus yang disediakan tetapi kode dasar akan membantu Anda memulai dengan merencanakan

Pratinjau kwargs. Ini menampilkan semua argumen saat ini yang digunakan untuk memplot grafik

Menyelesaikan. Setiap kali Anda ingin menjalankan kembali kode plot Anda, Anda dapat mengklik opsi ini. Ini berguna dalam kasus ketika Anda telah menerapkan argumen khusus dan Anda ingin memuat ulang grafik dengan argumen yang diterapkan tersebut

Tab Pembentuk Ulang

Tabel ringkasan seperti tabel Pivot memainkan peran penting untuk meringkas data berdasarkan fungsi agregasi seperti rata-rata, median, jumlah, dll. Anda cukup membuat tabel ini menggunakan tab reshaper. Tab ini menawarkan tabel Pivot, tabel peleburan, penggabungan dan penggabungan tabel. Cukup seret nama kolom dari panel kiri ke parameter yang diperlukan dan klik selesai

Anda akan mendapatkan kerangka data baru dengan ringkasan yang dipilih. Mari buat tabel pivot untuk ringkasan untuk "potong" sebagai indeks, "warna" sebagai kolom baru, dan nilai rata-rata gabungan "kedalaman" dari kumpulan data berlian

Tampilkan kerangka data dalam python gui

Tetapkan Preferensi

Seperti aplikasi lainnya, Anda dapat mengubah pengaturan default pandasGUI menggunakan opsi preferensi set menu pengaturan. Anda dapat mengubah tema aplikasi ke mode gelap, menonaktifkan fitur di layar yang dapat diedit, menyetel auto_finish ke True, mengubah mode render, mengubah fungsi agregasi default dari mean ke fungsi lain, dan memformat judul

Pengaturan preferensi

Ekspor Dataset dan Kode

Setelah Anda selesai dengan semua eksplorasi dan manipulasi data, Anda dapat mengakses kode setara panda untuk semua operasi yang dilakukan menggunakan opsi kode ekspor menu edit. Kode ini akan diformat dalam urutan operasi dengan komentar yang sesuai untuk setiap operasi yang dilakukan

Pembuatan Kode oleh PandasGUI

Di menu edit yang sama, Anda memiliki opsi untuk mengekspor kerangka data yang dimodifikasi. Anda dapat memilih opsi itu atau lebih mudah, Anda dapat menarik dan melepas nama bingkai data ke folder mana pun dan file CSV untuk bingkai data tersebut akan dibuat

Tampilkan kerangka data dalam python gui

Kesimpulan

Dalam artikel mendetail ini, saya memperkenalkan Anda ke PandasGUI. Ini adalah alat yang sangat ampuh untuk melakukan manipulasi dan eksplorasi data melalui antarmuka pengguna grafis. Kami mulai dengan penginstalan pustaka, memuat kumpulan data, lalu menjelajahi semua fungsi di layar, melihat setiap tab dengan lebih mendetail, lalu melihat beberapa fungsi lain-lain

Jika Anda ingin membaca / menjelajahi setiap artikel saya, buka daftar artikel utama saya yang diperbarui setiap kali saya menerbitkan artikel baru di platform apa pun

Untuk segala keraguan, pertanyaan, atau peluang potensial, Anda dapat menghubungi saya melalui

1. Linkedin — di/kaustubh-gupta/

2. Twitter — @Kaustubh1828

3. GitHub — kaustubhgupta

4. Medium — @kaustubhgupta1828

Media yang ditampilkan dalam artikel ini bukan milik Analytics Vidhya dan digunakan atas kebijaksanaan Penulis

Apa GUI untuk Python DataFrame?

PandasGUI adalah pustaka berbasis Python yang memfasilitasi manipulasi data dan ringkasan statistik untuk diterapkan pada kumpulan data menggunakan GUI . Itu berarti bahwa semua operasi akan dilakukan melalui antarmuka pengguna grafis (GUI), tetapi panda akan digunakan untuk menjalankannya di balik layar.

Bagaimana Anda menampilkan DataFrame dengan Python?

Contoh 1. Salah satu cara menampilkan dataframe dalam bentuk tabel adalah dengan menggunakan fungsi display() dari IPython. tampilan .

Bagaimana Anda memvisualisasikan DataFrame di Jupyter?

Anda dapat memvisualisasikan bingkai data panda di notebook Jupyter dengan menggunakan fungsi display( . Fungsi display() hanya didukung pada kernel PySpark. Kerangka kerja Qviz mendukung 1000 baris dan 100 kolom. Misalnya, Anda memiliki kerangka data panda df yang bertuliskan a.

Apakah panda memiliki GUI?

PandasGUI adalah GUI untuk melihat, merencanakan, dan menganalisis Pandas DataFrames.