Salah satu paket Python pihak ke-3 yang paling populer disebut panda. Paket pandas “adalah alat analisis dan manipulasi data open source yang cepat, kuat, fleksibel, dan mudah digunakan, dibangun di atas bahasa pemrograman Python. Ini digunakan oleh ilmuwan data dan insinyur perangkat lunak di seluruh dunia Show
Dalam tutorial ini, Anda akan belajar sedikit tentang membuat berbagai jenis DataFrame kosong atau sebagian kosong dengan panda. Kemudian Anda akan mempelajari beberapa cara berbeda untuk menambahkan data ke DataFrame tersebut Secara khusus, Anda akan belajar tentang hal-hal berikut
Membuat DataFrame Kosong di pandaTerkadang Anda hanya perlu membuat DataFrame kosong, seperti terkadang Anda perlu membuat kamus atau daftar Python kosong Berikut adalah contoh membuat DataFrame yang benar-benar kosong dengan panda >>> import pandas as pd >>> df = pd.DataFrame() >>> df Empty DataFrame Columns: [] Index: [] Tentu saja, DataFrame kosong tidak terlalu berguna. Jadi mari tambahkan sedikit data ke DataFrame >>> import pandas as pd >>> df = pd.DataFrame() >>> df Empty DataFrame Columns: [] Index: [] >>> df["Name"] = ["Mike", "Steve", "Rodrigo"] >>> df["Jobs"] = ["Engineer", "Core Dev", "Content Creator"] >>> df Name Jobs 0 Mike Engineer 1 Steve Core Dev 2 Rodrigo Content Creator_ Contoh ini menunjukkan bagaimana Anda dapat menentukan kolom di panda dan menambahkan data ke kolom tersebut Sekarang mari pelajari cara membuat DataFrame kosong yang menyertakan kolom, tetapi tanpa data Membuat DataFrame Kosong dengan KolomContoh berikut ini akan menunjukkan cara membuat Pandas DataFrame yang menyertakan kolom, tetapi tidak ada indeks atau data kolom Mari lihat >>> import pandas as pd >>> df = pd.DataFrame(columns=["Name", "Job"]) >>> df Empty DataFrame Columns: [Name, Job] Index: [] # Add some data using append() >>> df = df.append({"Name": "Mike", "Job": "Blogger"}, ignore_index=True) >>> df Name Job 0 Mike Blogger >>> df = df.append({"Name": "Luciano", "Job": "Author"}, ignore_index=True) >>> df Name Job 0 Mike Blogger 1 Luciano Author Yah, itu lebih baik daripada DataFrame yang benar-benar kosong. Dalam contoh ini, Anda juga mempelajari cara menggunakan metode append() DataFrame untuk menambahkan data ke setiap kolom Saat Anda menggunakan append() dibutuhkan dalam kamus nama dan nilai kolom. Anda juga menyetel ign_index ke True, yang memungkinkan panda memperbarui indeks untuk Anda secara otomatis Sekarang mari kita lihat cara membuat satu lagi tipe DataFrame kosong dengan panda Membuat DataFrame Kosong dengan Kolom dan IndeksUntuk contoh ini, Anda akan mempelajari cara membuat DataFrame panda yang memiliki dua kolom dan tiga baris atau indeks bernama Begini caranya >>> import pandas as pd >>> df = pd.DataFrame(columns = ["Name", "Job"], index = ["a", "b", "c"]) >>> df Name Job a NaN NaN b NaN NaN c NaN NaN Saat Anda mencetak DataFrame, Anda dapat melihat bahwa semua kolom berisi NaN, yang merupakan singkatan dari "Not a Number". NaN mirip dengan None di Python Salah satu cara untuk menambahkan data ke DataFrame ini di panda adalah dengan menggunakan atribut loc >>> df.loc["a"] = ["Mike", "Engineer"] >>> df Name Job a Mike Engineer b NaN NaN c NaN NaN >>> df.loc["b"] = ["Steve", "Core Dev"] >>> df Name Job a Mike Engineer b Steve Core Dev c NaN NaN >>> df.loc["c"] = ["Rodrigo", "Content Creator"] >>> df Name Job a Mike Engineer b Steve Core Dev c Rodrigo Content Creator_ Saat Anda menggunakan atribut loc, Anda menggunakan sintaks seperti kamus untuk menetapkan indeks tertentu ke daftar nilai. Contoh di atas menunjukkan cara menambahkan tiga baris data MembungkusTutorial ini bahkan tidak mulai menggores permukaan dari apa yang dapat Anda lakukan dengan panda. Tapi itu tidak seharusnya. Itulah gunanya buku. Di sini Anda belajar cara membuat tiga jenis DataFrames kosong Saya akan menjelaskan cara membuat DataFrame kosong di panda dengan atau tanpa nama kolom (nama kolom) dan Indeks. Di bawah ini saya telah menjelaskan salah satu dari banyak skenario di mana Anda perlu membuat DataFrame kosong Saat bekerja dengan file, terkadang kami mungkin tidak menerima file untuk diproses, namun, kami masih perlu membuat DataFrame secara manual dengan nama kolom yang sama seperti yang kami harapkan. Jika kami tidak membuat dengan nama kolom yang sama, operasi/transformasi kami (seperti serikat pekerja) di DataFrame gagal karena kami merujuk ke kolom yang mungkin tidak ada Untuk menangani situasi yang serupa dengan ini, kami selalu perlu membuat DataFrame dengan skema yang sama, yang berarti nama kolom dan tipe data yang sama terlepas dari file yang ada atau pemrosesan file kosong Catatan. DataFrame berisi baris dengan semua nilai NaN tidak dianggap kosong. Untuk menganggap DF kosong, DF harus berbentuk (0, n). bentuk (n,0) tidak dianggap kosong karena memiliki n baris Tutorial PySpark Untuk Pemula. Py Harap aktifkan JavaScript Tutorial PySpark Untuk Pemula. Contoh Piton1. Contoh Cepat Membuat DataFrame Kosong di pandaJika Anda sedang terburu-buru, di bawah ini adalah beberapa contoh cepat tentang cara membuat DataFrame kosong di panda
Untuk memahami secara detail, ikuti membaca artikel 2. Buat DataFrame Kosong Menggunakan KonstruktorSalah satu cara sederhana untuk membuat DataFrame panda kosong adalah dengan menggunakan konstruktornya. Contoh di bawah ini membuat DataFrame dengan nol baris dan kolom (kosong) _Hasil di bawah output. Perhatikan bahwa kolom dan Indeks tidak memiliki nilai 3. Membuat DataFrame Kosong dengan Nama KolomLabel kolom juga dapat ditambahkan saat membuat DataFrame kosong. Dalam hal ini, DataFrame hanya berisi kolom tetapi bukan baris/Indeks. Untuk melakukan ini, akan menggunakan konstruktor DataFrame dengan 6 param. param kolom menerima daftar label kolom _Hasil di bawah output _Semua kolom pada DataFrame di atas memiliki tipe 7, Anda dapat mengubahnya dengan menetapkan tipe data khusus
Hasil di bawah output
4. Tambahkan Kolom dan Indeks Saat Membuat DataFrameMari kita lihat cara menambahkan DataFrame dengan kolom dan baris dengan nilai nan. Perhatikan bahwa ini tidak dianggap sebagai DataFrame kosong karena memiliki baris dengan NaN, Anda dapat memeriksanya dengan memanggil atribut 8, yang mengembalikan 9. Gunakan DataFrame. dropna() untuk membuang semua nilai NaN. Untuk menambahkan indeks/baris, akan menggunakan param indeks, bersama dengan param kolom untuk label kolom
Hasil di bawah output. Perhatikan bahwa, ini bukan DataFrame kosong karena memiliki baris dengan nilai NaN
5. Periksa apakah DataFrame KosongBingkai Data. properti kosong digunakan untuk memeriksa apakah DataFrame kosong atau tidak. Ketika kosong ia mengembalikan 0 jika tidak 9. DataFrame dianggap tidak kosong jika berisi 1 baris atau lebih. Memiliki semua baris dengan nilai NaN masih dianggap sebagai DataFrame tidak kosong
6. Buat DataFrame Kosong Dari DataFrame LainAnda juga dapat membuat DataFrame rekaman nol dari DF lain yang sudah ada. Ini akan dilakukan untuk membuat DataFrame kosong dengan kolom yang sama seperti yang sudah ada tetapi tanpa baris
Hasil di bawah output _07. Tambahkan Baris ke DataFrame KosongMetode 2 digunakan untuk menambahkan/menambahkan baris ke DataFrame kosong. Gunakan append() jika Anda ingin menambahkan beberapa baris karena memiliki masalah kinerja. Untuk menambahkan ratusan atau ribuan baris ke DataFrame, gunakan konstruktor dengan data dalam kumpulan daftar _1Hasil di bawah output _2Untuk menambahkan lebih banyak baris, gunakan konstruktor _38. Tambahkan Baris Dari DataFrame LainJika Anda memiliki bingkai data kosong dan mengisinya dengan data dari satu atau beberapa DataFrame, Anda dapat melakukannya seperti di bawah ini _49. Contoh Lengkap Create Empty DataFrame di pandas _5KesimpulanPada artikel ini, Anda telah mempelajari cara membuat DataFrame dengan baris nol, dengan atau tanpa kolom, menambahkan baris ke DataFrame, dan banyak lagi dengan contoh Bagaimana Anda mengosongkan bingkai data dengan Python?Anda dapat membuat kerangka data kosong dengan mengimpor panda dari pustaka python . Kemudian, menggunakan pd. DataFrame(), buat dataframe kosong tanpa baris dan kolom seperti yang ditunjukkan pada contoh di bawah ini.
Bagaimana cara menghapus semua nilai dari bingkai data?Menghapus semua baris dalam kerangka data
. Kita perlu menghapus semua baris dari DataFrame ini, untuk tujuan ini, kita dapat menggunakan df. metode lepas dan kita dapat menetapkan label indeks sebagai parameter .
Bagaimana cara menghapus semua baris dari DataFrame dengan Python?Anda dapat menghapus daftar baris dari Pandas dengan meneruskan daftar indeks ke metode drop() . Dalam kode ini, [5,6] adalah indeks baris yang ingin Anda hapus. sumbu = 0 menunjukkan bahwa baris harus dihapus dari kerangka data.
Bagaimana Anda mengisi DataFrame kosong di Python dengan 0?Salah satu caranya adalah. df['a'] = 0 # Gunakan ini jika seluruh nilai kolom tidak ada. Atau cara yang lebih baik untuk dilakukan adalah dengan menggunakan fillna panda. df. |