Dalam tutorial hari ini kita akan belajar bagaimana menggabungkan dua atau lebih DataFrames yang memiliki kolom yang sama di Pandas. Ini akan sangat berguna jika Anda menerima beberapa file nilai yang dipisahkan koma (CSV) atau spreadsheet Excel yang perlu Anda gabungkan bersama sebelum memulai proses Analisis Data Anda Show
Membuat contoh dataMari kita mulai dengan membuat beberapa DataFrame yang ingin kita tambahkan satu sama lain
Menggabungkan beberapa DataFramesPada contoh pertama kami ingin menggunakan pd. concat() berfungsi untuk menambahkan dua atau lebih DataFrames. Mari kita lihat bagaimana kita membuatnya dengan Python _Catatan. Perhatikan pesan TypeError jika mengirimkan daftar daftar atau objek kamus ke pd. concat. Anda dapat melewati daftar DataFrames yang ditunjukkan di atas TypeError: cannot concatenate object of type '<class 'list'>'; only Series and DataFrame objs are valid Inilah nilai DataFrame yang dihasilkan areacitycandidates0PythonLondon241RParis652PythonMadrid823RNYC724PythonLA1105RSeattle123Catatan. pd. fungsi concat menerima iterable, dalam kasus kami daftar dua DataFrames dan hanya menyatukannya. Menggunakan metode ini sangat berguna jika kedua DataFrame memiliki kolom yang sama Kami dapat mencapai hasil yang serupa jika menggunakan metode append DataFrame
Tambahkan DataFrames menggunakan for loopContoh yang lebih menarik adalah ketika kita ingin menggabungkan DataFrame yang memiliki kolom berbeda. Dalam contoh ini kami akan mengulang ke daftar DataFrames dan menambahkan kontennya ke DataFrame kosong. Mari lihat Misalkan, kami menggunakan daftar elemen dan mengulanginya dan kami ingin membuat DataFrame dengan melakukan beberapa operasi pada elemen-elemen ini dan ingin menambahkan nilai-nilai ini dalam DataFrame. Jika kita menambahkan setiap nilai secara langsung di dalam loop, itu akan menimpa nilai sebelumnya dan hanya nilai terakhir yang akan ditambahkan ke DataFrame Untuk menambahkan panda DataFrame yang dihasilkan dalam for a loop, pertama-tama kita akan membuat daftar kosong dan kemudian di dalam loop, kita akan menambahkan nilai yang dimodifikasi di dalam daftar kosong ini, dan terakhir, di luar loop, kita akan menggabungkan semua nilai dari Untuk bekerja dengan panda, kita perlu mengimpor paket panda terlebih dahulu, di bawah ini adalah sintaksnya import pandas as pd_ Mari kita pahami dengan bantuan sebuah contoh, Kode python untuk menambahkan panda DataFrames dihasilkan dalam for loop# Importing pandas package import pandas as pd # Creating a List of some values list = ['Pranit','Mark','Jhon','Tony'] # Defining an empty list list_2 = [] # Generating new values inside a for loop for value in list: dataframe_values = 'Mr. '+value # Appending this new value in new list list_2.append(dataframe_values) # Finally concatenating all the values to # create DataFrame df = pd.DataFrame(list_2, columns=['Name'],index=['A','B','C','D']) # Display DataFrame print("Created DataFrame:\n",df,"\n") Keluaran Program Python Panda » Dalam python, saat beroperasi pada daftar, kita mungkin perlu menyimpan setiap keluaran loop dalam kerangka data dengan setiap iterasi Jadi resep ini adalah contoh singkat tentang cara menambahkan keluaran for loop dalam kerangka data panda. Mari kita mulai Langkah 1 - Impor perpustakaan
Mari kita jeda dan lihat impor ini. Panda umumnya digunakan untuk manipulasi dan analisis data Langkah 2 - Siapkan Data
Mari kita buat kerangka data yang berisi beberapa tabel 9 dan 10 Langkah 3 - Menambahkan bingkai data dalam for loop
Dibandingkan dengan menambahkan fungsi dalam daftar, ini berlaku sedikit berbeda untuk kerangka data. Segera setelah kerangka data apa pun ditambahkan menggunakan fungsi append, itu tidak tercermin dalam kerangka data asli. Untuk menyimpan informasi yang ditambahkan dalam kerangka data, kami menetapkannya kembali ke kerangka data asli Bagaimana Anda mengulang dan menambahkan DataFrame dengan Python?Langkah 1 - Impor perpustakaan. impor panda sebagai pd. . Langkah 2 - Siapkan Data. df=pd. DataFrame({'Tabel 9'. [9,18,27], 'Tabel 10'. [10,20,30]}). Langkah 3 - Menambahkan bingkai data dalam for loop. untuk saya dalam rentang (4,11). df=df. tambahkan({'Tabel 9'. i*9,'Tabel 10'. i*10},ignore_index=True). Langkah 4 - Mencetak hasil. cetak('df\n',df) Bagaimana cara menambahkan DataFrame dengan Python?append() digunakan untuk menambahkan baris kerangka data lain ke akhir kerangka data yang diberikan, mengembalikan objek kerangka data baru . Kolom yang tidak ada dalam kerangka data asli ditambahkan sebagai kolom baru dan sel baru diisi dengan nilai NaN. Parameter. lainnya. DataFrame atau objek seperti Seri/dict, atau daftar ini.
Bisakah Anda mengulang DataFrame dengan Python?Anda dapat mengulangi bingkai data panda, untuk setiap kolom baris demi baris .
Bagaimana Anda menambahkan daftar dengan Python menggunakan for loop?Menggunakan. Di dalam square_root() , Anda membuat daftar kosong bernama result dan memulai for loop yang mengulangi item dalam angka. Di setiap iterasi, Anda menggunakan matematika. sqrt() untuk menghitung akar kuadrat dari angka saat ini dan kemudian gunakan. append() untuk menambahkan hasil ke result |