Pandas adalah alat khusus yang memungkinkan kita melakukan manipulasi data yang rumit secara efektif dan efisien. Di dalam panda, kami kebanyakan berurusan dengan kumpulan data dalam bentuk DataFrame. DataFrames adalah struktur data 2 dimensi dalam panda. DataFrames terdiri dari baris, kolom, dan data
Memilih baris di mana kolom daftar berisi salah satu dari daftar string
Kami diberi DataFrame dengan banyak kolom, di mana kolom tertentu hanya berisi daftar string
Kita perlu mengekstrak DataFrame yang hanya berisi baris-baris itu, yang berisi beberapa string tertentu yang disertakan dalam daftar
Daftar adalah kumpulan elemen heterogen dan bisa berubah. Tuple juga merupakan tipe data bawaan python yang digunakan untuk menyimpan elemen heterogen
String adalah sekelompok karakter, karakter ini dapat terdiri dari semua huruf kecil, huruf besar, dan karakter khusus yang ada pada keyboard sistem komputer. String adalah tipe data dan jumlah karakter dalam string dikenal sebagai panjang string
Kode #1. Memilih semua baris dari kerangka data yang diberikan di mana 'Persentase' lebih besar dari 80 menggunakan metode dasar
# importing pandas
import pandas as pd
record= {
# importing pandas0# importing pandas1# importing pandas2# importing pandas3# importing pandas4# importing pandas3# importing pandas6_______7_______3# importing pandas8________7______3________8______0_______7_________3____3_______3____3
import5# importing pandas1________8______7# importing pandas3import9# importing pandas3pandas as pd1_______7_______3pandas as pd3________7______3________9______5# importing pandas__3____8
0# importing pandas1 2# importing pandas3 4# importing pandas3 6# importing pandas3____10________________________________________________________________________________________________________________________________________________________________________________G
record5# importing pandas1record7# importing pandas3record9# importing pandas3=1# importing pandas3____12_______3____7__________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ E jelas 5_______________3
{0
{1= {3= {5# importing pandas0# importing pandas3import5# importing pandas3 0________7______3________11____3__0
Anda dapat menggunakan salah satu metode berikut untuk memilih baris dalam DataFrame panda berdasarkan nilai kolomMetode 1. Pilih Baris di mana Kolom Sama dengan Nilai Tertentu
Metode 2. Pilih Baris di mana Nilai Kolom berada di Daftar Nilai
df.loc[df['col1'].isin([value1, value2, value3, ...])]_Metode 3. Pilih Baris Berdasarkan Beberapa Kondisi Kolom
df.loc[(df['col1'] == value) & (df['col2'] < value)]Contoh berikut menunjukkan cara menggunakan setiap metode dengan DataFrame panda berikut
import pandas as pd #create DataFrame df = pd.DataFrame({'team': ['A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'], 'points': [5, 7, 7, 9, 12, 9, 9, 4], 'rebounds': [11, 8, 10, 6, 6, 5, 9, 12], 'blocks': [4, 7, 7, 6, 5, 8, 9, 10]}) #view DataFrame df team points rebounds blocks 0 A 5 11 4 1 A 7 8 7 2 B 7 10 7 3 B 9 6 6 4 B 12 6 5 5 C 9 5 8 6 C 9 9 9 7 C 4 12 10Metode 1. Pilih Baris di mana Kolom Sama dengan Nilai Tertentu
Kode berikut menunjukkan cara memilih setiap baris di DataFrame di mana kolom 'poin' sama dengan 7
#select rows where 'points' column is equal to 7 df.loc[df['points'] == 7] team points rebounds blocks 1 A 7 8 7 2 B 7 10 7 _Metode 2. Pilih Baris di mana Nilai Kolom berada di Daftar Nilai
Kode berikut menunjukkan cara memilih setiap baris dalam DataFrame di mana kolom 'poin' sama dengan 7, 9, atau 12
#select rows where 'points' column is equal to 7 df.loc[df['points'].isin([7, 9, 12])] team points rebounds blocks 1 A 7 8 7 2 B 7 10 7 3 B 9 6 6 4 B 12 6 5 5 C 9 5 8 6 C 9 9 9Metode 3. Pilih Baris Berdasarkan Beberapa Kondisi Kolom
Kode berikut menunjukkan cara memilih setiap baris dalam DataFrame di mana kolom 'tim' sama dengan 'B' dan di mana kolom 'poin' lebih besar dari 8
#select rows where 'team' is equal to 'B' and points is greater than 8 df.loc[(df['team'] == 'B') & (df['points'] > 8)] team points rebounds blocks 3 B 9 6 6 4 B 12 6 5_Perhatikan bahwa hanya dua baris di mana tim sama dengan 'B' dan 'poin' lebih besar dari 8 yang dikembalikan