Cara mengosongkan bingkai data dengan python

Salah satu paket Python pihak ke-3 yang paling populer disebut panda. Paket pandas “adalah alat analisis dan manipulasi data open source yang cepat, kuat, fleksibel, dan mudah digunakan, dibangun di atas bahasa pemrograman Python. Ini digunakan oleh ilmuwan data dan insinyur perangkat lunak di seluruh dunia

Dalam tutorial ini, Anda akan belajar sedikit tentang membuat berbagai jenis DataFrame kosong atau sebagian kosong dengan panda. Kemudian Anda akan mempelajari beberapa cara berbeda untuk menambahkan data ke DataFrame tersebut

Secara khusus, Anda akan belajar tentang hal-hal berikut

  • Membuat DataFrame kosong dan menambahkan data
  • Membuat DataFrame kosong dengan kolom dan menambahkan data
  • Membuat DataFrame kosong dengan kolom dan indeks dan menambahkan data

Membuat DataFrame Kosong di panda

Terkadang Anda hanya perlu membuat DataFrame kosong, seperti terkadang Anda perlu membuat kamus atau daftar Python kosong

Berikut adalah contoh membuat DataFrame yang benar-benar kosong dengan panda

>>> import pandas as pd
>>> df = pd.DataFrame()
>>> df
Empty DataFrame
Columns: []
Index: []

Tentu saja, DataFrame kosong tidak terlalu berguna. Jadi mari tambahkan sedikit data ke DataFrame

>>> import pandas as pd
>>> df = pd.DataFrame()
>>> df
Empty DataFrame
Columns: []
Index: []

>>> df["Name"] = ["Mike", "Steve", "Rodrigo"]
>>> df["Jobs"] = ["Engineer", "Core Dev", "Content Creator"]
>>> df
      Name             Jobs
0     Mike         Engineer
1    Steve         Core Dev
2  Rodrigo  Content Creator
_

Contoh ini menunjukkan bagaimana Anda dapat menentukan kolom di panda dan menambahkan data ke kolom tersebut

Sekarang mari pelajari cara membuat DataFrame kosong yang menyertakan kolom, tetapi tanpa data

Membuat DataFrame Kosong dengan Kolom

Contoh berikut ini akan menunjukkan cara membuat Pandas DataFrame yang menyertakan kolom, tetapi tidak ada indeks atau data kolom

Mari lihat

>>> import pandas as pd

>>> df = pd.DataFrame(columns=["Name", "Job"])
>>> df
Empty DataFrame
Columns: [Name, Job]
Index: []

# Add some data using append()
>>> df = df.append({"Name": "Mike", "Job": "Blogger"}, ignore_index=True)
>>> df
   Name      Job
0  Mike  Blogger
>>> df = df.append({"Name": "Luciano", "Job": "Author"}, ignore_index=True)
>>> df
      Name      Job
0     Mike  Blogger
1  Luciano   Author

Yah, itu lebih baik daripada DataFrame yang benar-benar kosong. Dalam contoh ini, Anda juga mempelajari cara menggunakan metode append() DataFrame untuk menambahkan data ke setiap kolom

Saat Anda menggunakan append() dibutuhkan dalam kamus nama dan nilai kolom. Anda juga menyetel ign_index ke True, yang memungkinkan panda memperbarui indeks untuk Anda secara otomatis

Sekarang mari kita lihat cara membuat satu lagi tipe DataFrame kosong dengan panda

Membuat DataFrame Kosong dengan Kolom dan Indeks

Untuk contoh ini, Anda akan mempelajari cara membuat DataFrame panda yang memiliki dua kolom dan tiga baris atau indeks bernama

Begini caranya

>>> import pandas as pd
>>> df = pd.DataFrame(columns = ["Name", "Job"], index = ["a", "b", "c"])
>>> df
  Name  Job
a  NaN  NaN
b  NaN  NaN
c  NaN  NaN

Saat Anda mencetak DataFrame, Anda dapat melihat bahwa semua kolom berisi NaN, yang merupakan singkatan dari "Not a Number". NaN mirip dengan None di Python

Salah satu cara untuk menambahkan data ke DataFrame ini di panda adalah dengan menggunakan atribut loc

>>> df.loc["a"] = ["Mike", "Engineer"]
>>> df
   Name       Job
a  Mike  Engineer
b   NaN       NaN
c   NaN       NaN
>>> df.loc["b"] = ["Steve", "Core Dev"]
>>> df
    Name       Job
a   Mike  Engineer
b  Steve  Core Dev
c    NaN       NaN
>>> df.loc["c"] = ["Rodrigo", "Content Creator"]
>>> df
      Name              Job
a     Mike         Engineer
b    Steve         Core Dev
c  Rodrigo  Content Creator
_

Saat Anda menggunakan atribut loc, Anda menggunakan sintaks seperti kamus untuk menetapkan indeks tertentu ke daftar nilai. Contoh di atas menunjukkan cara menambahkan tiga baris data

Membungkus

Tutorial ini bahkan tidak mulai menggores permukaan dari apa yang dapat Anda lakukan dengan panda. Tapi itu tidak seharusnya. Itulah gunanya buku. Di sini Anda belajar cara membuat tiga jenis DataFrames kosong

Saya akan menjelaskan cara membuat DataFrame kosong di panda dengan atau tanpa nama kolom (nama kolom) dan Indeks. Di bawah ini saya telah menjelaskan salah satu dari banyak skenario di mana Anda perlu membuat DataFrame kosong

Saat bekerja dengan file, terkadang kami mungkin tidak menerima file untuk diproses, namun, kami masih perlu membuat DataFrame secara manual dengan nama kolom yang sama seperti yang kami harapkan. Jika kami tidak membuat dengan nama kolom yang sama, operasi/transformasi kami (seperti serikat pekerja) di DataFrame gagal karena kami merujuk ke kolom yang mungkin tidak ada

Untuk menangani situasi yang serupa dengan ini, kami selalu perlu membuat DataFrame dengan skema yang sama, yang berarti nama kolom dan tipe data yang sama terlepas dari file yang ada atau pemrosesan file kosong

Catatan. DataFrame berisi baris dengan semua nilai NaN tidak dianggap kosong. Untuk menganggap DF kosong, DF harus berbentuk (0, n). bentuk (n,0) tidak dianggap kosong karena memiliki n baris

Tutorial PySpark Untuk Pemula. Py

Harap aktifkan JavaScript

Tutorial PySpark Untuk Pemula. Contoh Piton

1. Contoh Cepat Membuat DataFrame Kosong di panda

Jika Anda sedang terburu-buru, di bawah ini adalah beberapa contoh cepat tentang cara membuat DataFrame kosong di panda


# Below are quick example

# create empty DataFrame using constucor
df = pd.DataFrame()

# Creating Empty DataFrame with Column Names
df = pd.DataFrame(columns = ["Courses", "Fee", "Duration","Discount"])

# Create DataFrame with index and columns
# Note this is not considered empty DataFrame
df = pd.DataFrame(columns = ["Courses", "Fee", "Duration","Discount"],index=['index1'])

# Add rows to empty DataFrame
df2 = df.append({"Courses":"Spark","Fee":20000,"Duration":'30days',"Discount":1000},ignore_index = True)

# Check if DataFrame empty
print("Empty DataFrame :"+ str(df.empty))

Untuk memahami secara detail, ikuti membaca artikel

2. Buat DataFrame Kosong Menggunakan Konstruktor

Salah satu cara sederhana untuk membuat DataFrame panda kosong adalah dengan menggunakan konstruktornya. Contoh di bawah ini membuat DataFrame dengan nol baris dan kolom (kosong)


# create empty DataFrame using constucor
df = pd.DataFrame()
print(df)
print("Empty DataFrame : "+str(df1.empty))

_

Hasil di bawah output. Perhatikan bahwa kolom dan Indeks tidak memiliki nilai

Cara mengosongkan bingkai data dengan python

3. Membuat DataFrame Kosong dengan Nama Kolom

Label kolom juga dapat ditambahkan saat membuat DataFrame kosong. Dalam hal ini, DataFrame hanya berisi kolom tetapi bukan baris/Indeks. Untuk melakukan ini, akan menggunakan konstruktor DataFrame dengan


# create empty DataFrame using constucor
df = pd.DataFrame()
print(df)
print("Empty DataFrame : "+str(df1.empty))

6 param. param kolom menerima daftar label kolom


# Creating Empty DataFrame with Column Names
df = pd.DataFrame(columns = ["Courses", "Fee", "Duration","Discount"])
print(df)
print("Empty DataFrame : "+str(df.empty))
_

Hasil di bawah output


Empty DataFrame
Columns: [Courses, Fee, Duration, Discount]
Index: []
Empty DataFrame : True
_

Semua kolom pada DataFrame di atas memiliki tipe


# create empty DataFrame using constucor
df = pd.DataFrame()
print(df)
print("Empty DataFrame : "+str(df1.empty))

7, Anda dapat mengubahnya dengan menetapkan tipe data khusus


#Create empty DataFrame with specific column types
df = pd.DataFrame({'Courses': pd.Series(dtype='str'),
                   'Fee': pd.Series(dtype='int'),
                   'Duration': pd.Series(dtype='str'),
                   'Discount': pd.Series(dtype='float')})
print(df.dtypes)

Hasil di bawah output


Courses      object
Fee           int32
Duration     object
Discount    float64
dtype: object

4. Tambahkan Kolom dan Indeks Saat Membuat DataFrame

Mari kita lihat cara menambahkan DataFrame dengan kolom dan baris dengan nilai nan. Perhatikan bahwa ini tidak dianggap sebagai DataFrame kosong karena memiliki baris dengan NaN, Anda dapat memeriksanya dengan memanggil atribut


# create empty DataFrame using constucor
df = pd.DataFrame()
print(df)
print("Empty DataFrame : "+str(df1.empty))

8, yang mengembalikan

# create empty DataFrame using constucor
df = pd.DataFrame()
print(df)
print("Empty DataFrame : "+str(df1.empty))

9. Gunakan DataFrame. dropna() untuk membuang semua nilai NaN. Untuk menambahkan indeks/baris, akan menggunakan param indeks, bersama dengan param kolom untuk label kolom


#Add columns and index while creating empty DataFrame
df = pd.DataFrame(columns = ["Courses", "Fee", "Duration","Discount"],index=['index1'])
print(df)
print("Empty DataFrame : "+str(df.empty))

Hasil di bawah output. Perhatikan bahwa, ini bukan DataFrame kosong karena memiliki baris dengan nilai NaN


       Courses  Fee Duration Discount
index1     NaN  NaN      NaN      NaN
Empty DataFrame : False

5. Periksa apakah DataFrame Kosong

Bingkai Data. properti kosong digunakan untuk memeriksa apakah DataFrame kosong atau tidak. Ketika kosong ia mengembalikan


# Creating Empty DataFrame with Column Names
df = pd.DataFrame(columns = ["Courses", "Fee", "Duration","Discount"])
print(df)
print("Empty DataFrame : "+str(df.empty))
0 jika tidak

# create empty DataFrame using constucor
df = pd.DataFrame()
print(df)
print("Empty DataFrame : "+str(df1.empty))

9. DataFrame dianggap tidak kosong jika berisi 1 baris atau lebih. Memiliki semua baris dengan nilai NaN masih dianggap sebagai DataFrame tidak kosong


if df.empty:
  print("Empty DataFrame")
else
  print("Non Empty DataFrame")

6. Buat DataFrame Kosong Dari DataFrame Lain

Anda juga dapat membuat DataFrame rekaman nol dari DF lain yang sudah ada. Ini akan dilakukan untuk membuat DataFrame kosong dengan kolom yang sama seperti yang sudah ada tetapi tanpa baris


# create empty DataFrame from another DataFrame
columns_list = df.columns
df2 = pd.DataFrame(columns = columns_list)
print(df2)

Hasil di bawah output


# create empty DataFrame using constucor
df = pd.DataFrame()
print(df)
print("Empty DataFrame : "+str(df1.empty))

_0

7. Tambahkan Baris ke DataFrame Kosong

Metode


# Creating Empty DataFrame with Column Names
df = pd.DataFrame(columns = ["Courses", "Fee", "Duration","Discount"])
print(df)
print("Empty DataFrame : "+str(df.empty))
2 digunakan untuk menambahkan/menambahkan baris ke DataFrame kosong. Gunakan append() jika Anda ingin menambahkan beberapa baris karena memiliki masalah kinerja. Untuk menambahkan ratusan atau ribuan baris ke DataFrame, gunakan konstruktor dengan data dalam kumpulan daftar


# create empty DataFrame using constucor
df = pd.DataFrame()
print(df)
print("Empty DataFrame : "+str(df1.empty))

_1

Hasil di bawah output


# create empty DataFrame using constucor
df = pd.DataFrame()
print(df)
print("Empty DataFrame : "+str(df1.empty))

_2

Untuk menambahkan lebih banyak baris, gunakan konstruktor


# create empty DataFrame using constucor
df = pd.DataFrame()
print(df)
print("Empty DataFrame : "+str(df1.empty))

_3

8. Tambahkan Baris Dari DataFrame Lain

Jika Anda memiliki bingkai data kosong dan mengisinya dengan data dari satu atau beberapa DataFrame, Anda dapat melakukannya seperti di bawah ini


# create empty DataFrame using constucor
df = pd.DataFrame()
print(df)
print("Empty DataFrame : "+str(df1.empty))

_4

9. Contoh Lengkap Create Empty DataFrame di pandas


# create empty DataFrame using constucor
df = pd.DataFrame()
print(df)
print("Empty DataFrame : "+str(df1.empty))

_5

Kesimpulan

Pada artikel ini, Anda telah mempelajari cara membuat DataFrame dengan baris nol, dengan atau tanpa kolom, menambahkan baris ke DataFrame, dan banyak lagi dengan contoh

Bagaimana Anda mengosongkan bingkai data dengan Python?

Anda dapat membuat kerangka data kosong dengan mengimpor panda dari pustaka python . Kemudian, menggunakan pd. DataFrame(), buat dataframe kosong tanpa baris dan kolom seperti yang ditunjukkan pada contoh di bawah ini.

Bagaimana cara menghapus semua nilai dari bingkai data?

Menghapus semua baris dalam kerangka data . Kita perlu menghapus semua baris dari DataFrame ini, untuk tujuan ini, kita dapat menggunakan df. metode lepas dan kita dapat menetapkan label indeks sebagai parameter .

Bagaimana cara menghapus semua baris dari DataFrame dengan Python?

Anda dapat menghapus daftar baris dari Pandas dengan meneruskan daftar indeks ke metode drop() . Dalam kode ini, [5,6] adalah indeks baris yang ingin Anda hapus. sumbu = 0 menunjukkan bahwa baris harus dihapus dari kerangka data.

Bagaimana Anda mengisi DataFrame kosong di Python dengan 0?

Salah satu caranya adalah. df['a'] = 0 # Gunakan ini jika seluruh nilai kolom tidak ada. Atau cara yang lebih baik untuk dilakukan adalah dengan menggunakan fillna panda. df.