Salah satu paket Python pihak ke-3 yang paling populer disebut panda. Paket pandas “adalah alat analisis dan manipulasi data open source yang cepat, kuat, fleksibel, dan mudah digunakan, dibangun di atas bahasa pemrograman Python. Ini digunakan oleh ilmuwan data dan insinyur perangkat lunak di seluruh dunia
Dalam tutorial ini, Anda akan belajar sedikit tentang membuat berbagai jenis DataFrame kosong atau sebagian kosong dengan panda. Kemudian Anda akan mempelajari beberapa cara berbeda untuk menambahkan data ke DataFrame tersebut
Secara khusus, Anda akan belajar tentang hal-hal berikut
- Membuat DataFrame kosong dan menambahkan data
- Membuat DataFrame kosong dengan kolom dan menambahkan data
- Membuat DataFrame kosong dengan kolom dan indeks dan menambahkan data
Membuat DataFrame Kosong di panda
Terkadang Anda hanya perlu membuat DataFrame kosong, seperti terkadang Anda perlu membuat kamus atau daftar Python kosong
Berikut adalah contoh membuat DataFrame yang benar-benar kosong dengan panda
>>> import pandas as pd >>> df = pd.DataFrame() >>> df Empty DataFrame Columns: [] Index: []Tentu saja, DataFrame kosong tidak terlalu berguna. Jadi mari tambahkan sedikit data ke DataFrame
>>> import pandas as pd >>> df = pd.DataFrame() >>> df Empty DataFrame Columns: [] Index: [] >>> df["Name"] = ["Mike", "Steve", "Rodrigo"] >>> df["Jobs"] = ["Engineer", "Core Dev", "Content Creator"] >>> df Name Jobs 0 Mike Engineer 1 Steve Core Dev 2 Rodrigo Content Creator_Contoh ini menunjukkan bagaimana Anda dapat menentukan kolom di panda dan menambahkan data ke kolom tersebut
Sekarang mari pelajari cara membuat DataFrame kosong yang menyertakan kolom, tetapi tanpa data
Membuat DataFrame Kosong dengan Kolom
Contoh berikut ini akan menunjukkan cara membuat Pandas DataFrame yang menyertakan kolom, tetapi tidak ada indeks atau data kolom
Mari lihat
>>> import pandas as pd >>> df = pd.DataFrame(columns=["Name", "Job"]) >>> df Empty DataFrame Columns: [Name, Job] Index: [] # Add some data using append() >>> df = df.append({"Name": "Mike", "Job": "Blogger"}, ignore_index=True) >>> df Name Job 0 Mike Blogger >>> df = df.append({"Name": "Luciano", "Job": "Author"}, ignore_index=True) >>> df Name Job 0 Mike Blogger 1 Luciano AuthorYah, itu lebih baik daripada DataFrame yang benar-benar kosong. Dalam contoh ini, Anda juga mempelajari cara menggunakan metode append() DataFrame untuk menambahkan data ke setiap kolom
Saat Anda menggunakan append() dibutuhkan dalam kamus nama dan nilai kolom. Anda juga menyetel ign_index ke True, yang memungkinkan panda memperbarui indeks untuk Anda secara otomatis
Sekarang mari kita lihat cara membuat satu lagi tipe DataFrame kosong dengan panda
Membuat DataFrame Kosong dengan Kolom dan Indeks
Untuk contoh ini, Anda akan mempelajari cara membuat DataFrame panda yang memiliki dua kolom dan tiga baris atau indeks bernama
Begini caranya
>>> import pandas as pd >>> df = pd.DataFrame(columns = ["Name", "Job"], index = ["a", "b", "c"]) >>> df Name Job a NaN NaN b NaN NaN c NaN NaNSaat Anda mencetak DataFrame, Anda dapat melihat bahwa semua kolom berisi NaN, yang merupakan singkatan dari "Not a Number". NaN mirip dengan None di Python
Salah satu cara untuk menambahkan data ke DataFrame ini di panda adalah dengan menggunakan atribut loc
>>> df.loc["a"] = ["Mike", "Engineer"] >>> df Name Job a Mike Engineer b NaN NaN c NaN NaN >>> df.loc["b"] = ["Steve", "Core Dev"] >>> df Name Job a Mike Engineer b Steve Core Dev c NaN NaN >>> df.loc["c"] = ["Rodrigo", "Content Creator"] >>> df Name Job a Mike Engineer b Steve Core Dev c Rodrigo Content Creator_Saat Anda menggunakan atribut loc, Anda menggunakan sintaks seperti kamus untuk menetapkan indeks tertentu ke daftar nilai. Contoh di atas menunjukkan cara menambahkan tiga baris data
Membungkus
Tutorial ini bahkan tidak mulai menggores permukaan dari apa yang dapat Anda lakukan dengan panda. Tapi itu tidak seharusnya. Itulah gunanya buku. Di sini Anda belajar cara membuat tiga jenis DataFrames kosong
Saya akan menjelaskan cara membuat DataFrame kosong di panda dengan atau tanpa nama kolom (nama kolom) dan Indeks. Di bawah ini saya telah menjelaskan salah satu dari banyak skenario di mana Anda perlu membuat DataFrame kosong
Saat bekerja dengan file, terkadang kami mungkin tidak menerima file untuk diproses, namun, kami masih perlu membuat DataFrame secara manual dengan nama kolom yang sama seperti yang kami harapkan. Jika kami tidak membuat dengan nama kolom yang sama, operasi/transformasi kami (seperti serikat pekerja) di DataFrame gagal karena kami merujuk ke kolom yang mungkin tidak ada
Untuk menangani situasi yang serupa dengan ini, kami selalu perlu membuat DataFrame dengan skema yang sama, yang berarti nama kolom dan tipe data yang sama terlepas dari file yang ada atau pemrosesan file kosong
Catatan. DataFrame berisi baris dengan semua nilai NaN tidak dianggap kosong. Untuk menganggap DF kosong, DF harus berbentuk (0, n). bentuk (n,0) tidak dianggap kosong karena memiliki n baris
Tutorial PySpark Untuk Pemula. Py
Harap aktifkan JavaScript
Tutorial PySpark Untuk Pemula. Contoh Piton1. Contoh Cepat Membuat DataFrame Kosong di panda
Jika Anda sedang terburu-buru, di bawah ini adalah beberapa contoh cepat tentang cara membuat DataFrame kosong di panda
# Below are quick example # create empty DataFrame using constucor df = pd.DataFrame() # Creating Empty DataFrame with Column Names df = pd.DataFrame(columns = ["Courses", "Fee", "Duration","Discount"]) # Create DataFrame with index and columns # Note this is not considered empty DataFrame df = pd.DataFrame(columns = ["Courses", "Fee", "Duration","Discount"],index=['index1']) # Add rows to empty DataFrame df2 = df.append({"Courses":"Spark","Fee":20000,"Duration":'30days',"Discount":1000},ignore_index = True) # Check if DataFrame empty print("Empty DataFrame :"+ str(df.empty))Untuk memahami secara detail, ikuti membaca artikel
2. Buat DataFrame Kosong Menggunakan Konstruktor
Salah satu cara sederhana untuk membuat DataFrame panda kosong adalah dengan menggunakan konstruktornya. Contoh di bawah ini membuat DataFrame dengan nol baris dan kolom (kosong)
# create empty DataFrame using constucor df = pd.DataFrame() print(df) print("Empty DataFrame : "+str(df1.empty)) _Hasil di bawah output. Perhatikan bahwa kolom dan Indeks tidak memiliki nilai
3. Membuat DataFrame Kosong dengan Nama Kolom
Label kolom juga dapat ditambahkan saat membuat DataFrame kosong. Dalam hal ini, DataFrame hanya berisi kolom tetapi bukan baris/Indeks. Untuk melakukan ini, akan menggunakan konstruktor DataFrame dengan # create empty DataFrame using constucor df = pd.DataFrame() print(df) print("Empty DataFrame : "+str(df1.empty)) 6 param. param kolom menerima daftar label kolom
Hasil di bawah output
Empty DataFrame Columns: [Courses, Fee, Duration, Discount] Index: [] Empty DataFrame : True _Semua kolom pada DataFrame di atas memiliki tipe # create empty DataFrame using constucor df = pd.DataFrame() print(df) print("Empty DataFrame : "+str(df1.empty)) 7, Anda dapat mengubahnya dengan menetapkan tipe data khusus
#Create empty DataFrame with specific column types df = pd.DataFrame({'Courses': pd.Series(dtype='str'), 'Fee': pd.Series(dtype='int'), 'Duration': pd.Series(dtype='str'), 'Discount': pd.Series(dtype='float')}) print(df.dtypes)Hasil di bawah output
Courses object Fee int32 Duration object Discount float64 dtype: object4. Tambahkan Kolom dan Indeks Saat Membuat DataFrame
Mari kita lihat cara menambahkan DataFrame dengan kolom dan baris dengan nilai nan. Perhatikan bahwa ini tidak dianggap sebagai DataFrame kosong karena memiliki baris dengan NaN, Anda dapat memeriksanya dengan memanggil atribut # create empty DataFrame using constucor df = pd.DataFrame() print(df) print("Empty DataFrame : "+str(df1.empty)) 8, yang mengembalikan # create empty DataFrame using constucor df = pd.DataFrame() print(df) print("Empty DataFrame : "+str(df1.empty)) 9. Gunakan DataFrame. dropna() untuk membuang semua nilai NaN. Untuk menambahkan indeks/baris, akan menggunakan param indeks, bersama dengan param kolom untuk label kolom
#Add columns and index while creating empty DataFrame df = pd.DataFrame(columns = ["Courses", "Fee", "Duration","Discount"],index=['index1']) print(df) print("Empty DataFrame : "+str(df.empty))Hasil di bawah output. Perhatikan bahwa, ini bukan DataFrame kosong karena memiliki baris dengan nilai NaN
Courses Fee Duration Discount index1 NaN NaN NaN NaN Empty DataFrame : False5. Periksa apakah DataFrame Kosong
Bingkai Data. properti kosong digunakan untuk memeriksa apakah DataFrame kosong atau tidak. Ketika kosong ia mengembalikan # Creating Empty DataFrame with Column Names df = pd.DataFrame(columns = ["Courses", "Fee", "Duration","Discount"]) print(df) print("Empty DataFrame : "+str(df.empty)) 0 jika tidak # create empty DataFrame using constucor df = pd.DataFrame() print(df) print("Empty DataFrame : "+str(df1.empty)) 9. DataFrame dianggap tidak kosong jika berisi 1 baris atau lebih. Memiliki semua baris dengan nilai NaN masih dianggap sebagai DataFrame tidak kosong
if df.empty: print("Empty DataFrame") else print("Non Empty DataFrame")6. Buat DataFrame Kosong Dari DataFrame Lain
Anda juga dapat membuat DataFrame rekaman nol dari DF lain yang sudah ada. Ini akan dilakukan untuk membuat DataFrame kosong dengan kolom yang sama seperti yang sudah ada tetapi tanpa baris
# create empty DataFrame from another DataFrame columns_list = df.columns df2 = pd.DataFrame(columns = columns_list) print(df2)Hasil di bawah output
# create empty DataFrame using constucor df = pd.DataFrame() print(df) print("Empty DataFrame : "+str(df1.empty)) _07. Tambahkan Baris ke DataFrame Kosong
Metode # Creating Empty DataFrame with Column Names df = pd.DataFrame(columns = ["Courses", "Fee", "Duration","Discount"]) print(df) print("Empty DataFrame : "+str(df.empty)) 2 digunakan untuk menambahkan/menambahkan baris ke DataFrame kosong. Gunakan append() jika Anda ingin menambahkan beberapa baris karena memiliki masalah kinerja. Untuk menambahkan ratusan atau ribuan baris ke DataFrame, gunakan konstruktor dengan data dalam kumpulan daftar
# create empty DataFrame using constucor df = pd.DataFrame() print(df) print("Empty DataFrame : "+str(df1.empty)) _1Hasil di bawah output
# create empty DataFrame using constucor df = pd.DataFrame() print(df) print("Empty DataFrame : "+str(df1.empty)) _2Untuk menambahkan lebih banyak baris, gunakan konstruktor
# create empty DataFrame using constucor df = pd.DataFrame() print(df) print("Empty DataFrame : "+str(df1.empty)) _38. Tambahkan Baris Dari DataFrame Lain
Jika Anda memiliki bingkai data kosong dan mengisinya dengan data dari satu atau beberapa DataFrame, Anda dapat melakukannya seperti di bawah ini
# create empty DataFrame using constucor df = pd.DataFrame() print(df) print("Empty DataFrame : "+str(df1.empty)) _49. Contoh Lengkap Create Empty DataFrame di pandas
# create empty DataFrame using constucor df = pd.DataFrame() print(df) print("Empty DataFrame : "+str(df1.empty)) _5Kesimpulan
Pada artikel ini, Anda telah mempelajari cara membuat DataFrame dengan baris nol, dengan atau tanpa kolom, menambahkan baris ke DataFrame, dan banyak lagi dengan contoh