Ini menghasilkan iterator yang dapat digunakan untuk mengulangi semua kolom kerangka data. Untuk setiap kolom dalam Dataframe mengembalikan sebuah iterator ke tuple yang berisi nama kolom dan isi kolom sebagai seri Show
Misalkan, kami menggunakan daftar elemen dan mengulanginya dan kami ingin membuat DataFrame dengan melakukan beberapa operasi pada elemen-elemen ini dan ingin menambahkan nilai-nilai ini dalam DataFrame. Jika kita menambahkan setiap nilai secara langsung di dalam loop, itu akan menimpa nilai sebelumnya dan hanya nilai terakhir yang akan ditambahkan ke DataFrame Untuk menambahkan panda DataFrame yang dihasilkan dalam for a loop, pertama-tama kita akan membuat daftar kosong dan kemudian di dalam loop, kita akan menambahkan nilai yang dimodifikasi di dalam daftar kosong ini, dan terakhir, di luar loop, kita akan menggabungkan semua nilai dari Untuk bekerja dengan panda, kita perlu mengimpor paket panda terlebih dahulu, di bawah ini adalah sintaksnya import pandas as pd Mari kita pahami dengan bantuan sebuah contoh, Kode python untuk menambahkan panda DataFrames dihasilkan dalam for loop# Importing pandas package import pandas as pd # Creating a List of some values list = ['Pranit','Mark','Jhon','Tony'] # Defining an empty list list_2 = [] # Generating new values inside a for loop for value in list: dataframe_values = 'Mr. '+value # Appending this new value in new list list_2.append(dataframe_values) # Finally concatenating all the values to # create DataFrame df = pd.DataFrame(list_2, columns=['Name'],index=['A','B','C','D']) # Display DataFrame print("Created DataFrame:\n",df,"\n")_ Keluaran Program Python Panda » (Jika kita mengasumsikan suhu 25 derajat Celcius dan tekanan 1013 hPa, faktor konversinya adalah 1. 882) In [4]: air_quality["london_mg_per_cubic"] = air_quality["station_london"] * 1.882 In [5]: air_quality.head() Out[5]: station_antwerp .. london_mg_per_cubic datetime .. 2019-05-07 02:00:00 NaN .. 43.286 2019-05-07 03:00:00 50.5 .. 35.758 2019-05-07 04:00:00 45.0 .. 35.758 2019-05-07 05:00:00 NaN .. 30.112 2019-05-07 06:00:00 NaN .. NaN [5 rows x 4 columns] Untuk membuat kolom baru, gunakan tanda kurung Catatan Perhitungan nilai dilakukan berdasarkan elemen. Ini berarti semua nilai dalam kolom yang diberikan dikalikan dengan nilai 1. 882 sekaligus. Anda tidak perlu menggunakan loop untuk mengulangi setiap baris
Juga operator matematika lainnya ( In [2]: air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True) In [3]: air_quality.head() Out[3]: station_antwerp station_paris station_london datetime 2019-05-07 02:00:00 NaN NaN 23.0 2019-05-07 03:00:00 50.5 25.0 19.0 2019-05-07 04:00:00 45.0 27.7 19.0 2019-05-07 05:00:00 NaN 50.4 16.0 2019-05-07 06:00:00 NaN 61.9 NaN0, In [2]: air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True) In [3]: air_quality.head() Out[3]: station_antwerp station_paris station_london datetime 2019-05-07 02:00:00 NaN NaN 23.0 2019-05-07 03:00:00 50.5 25.0 19.0 2019-05-07 04:00:00 45.0 27.7 19.0 2019-05-07 05:00:00 NaN 50.4 16.0 2019-05-07 06:00:00 NaN 61.9 NaN1, In [2]: air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True) In [3]: air_quality.head() Out[3]: station_antwerp station_paris station_london datetime 2019-05-07 02:00:00 NaN NaN 23.0 2019-05-07 03:00:00 50.5 25.0 19.0 2019-05-07 04:00:00 45.0 27.7 19.0 2019-05-07 05:00:00 NaN 50.4 16.0 2019-05-07 06:00:00 NaN 61.9 NaN2, / ,…) atau operator logika (In [2]: air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True) In [3]: air_quality.head() Out[3]: station_antwerp station_paris station_london datetime 2019-05-07 02:00:00 NaN NaN 23.0 2019-05-07 03:00:00 50.5 25.0 19.0 2019-05-07 04:00:00 45.0 27.7 19.0 2019-05-07 05:00:00 NaN 50.4 16.0 2019-05-07 06:00:00 NaN 61.9 NaN4, In [2]: air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True) In [3]: air_quality.head() Out[3]: station_antwerp station_paris station_london datetime 2019-05-07 02:00:00 NaN NaN 23.0 2019-05-07 03:00:00 50.5 25.0 19.0 2019-05-07 04:00:00 45.0 27.7 19.0 2019-05-07 05:00:00 NaN 50.4 16.0 2019-05-07 06:00:00 NaN 61.9 NaN5, In [2]: air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True) In [3]: air_quality.head() Out[3]: station_antwerp station_paris station_london datetime 2019-05-07 02:00:00 NaN NaN 23.0 2019-05-07 03:00:00 50.5 25.0 19.0 2019-05-07 04:00:00 45.0 27.7 19.0 2019-05-07 05:00:00 NaN 50.4 16.0 2019-05-07 06:00:00 NaN 61.9 NaN6,…) bekerja berdasarkan elemen. Yang terakhir sudah digunakan untuk memfilter baris tabel menggunakan ekspresi bersyarat Jika Anda memerlukan logika yang lebih canggih, Anda dapat menggunakan kode Python arbitrer via
Pemetaan tidak boleh dibatasi hanya untuk nama tetap, tetapi juga bisa menjadi fungsi pemetaan. Misalnya, mengonversi nama kolom menjadi huruf kecil juga dapat dilakukan dengan menggunakan fungsi In [10]: air_quality_renamed = air_quality_renamed.rename(columns=str.lower) In [11]: air_quality_renamed.head() Out[11]: betr801 fr04014 .. london_mg_per_cubic ratio_paris_antwerp datetime .. 2019-05-07 02:00:00 NaN NaN .. 43.286 NaN 2019-05-07 03:00:00 50.5 25.0 .. 35.758 0.495050 2019-05-07 04:00:00 45.0 27.7 .. 35.758 0.615556 2019-05-07 05:00:00 NaN 50.4 .. 30.112 NaN 2019-05-07 06:00:00 NaN 61.9 .. NaN NaN [5 rows x 5 columns] Ke panduan pengguna Detail tentang penggantian nama label kolom atau baris disediakan di bagian panduan pengguna INGAT
|