Pustaka yang kami identifikasi untuk mem-parsing file Excel adalah import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')9. Pustaka ini adalah bagian dari serangkaian pustaka untuk bekerja dengan file Excel dengan Python
Ada tiga pustaka utama untuk menangani file Excel
import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')_9Membaca file Excel
import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') for sheet in book.sheets(): print sheet.name1Menulis dan memformat file Excel
import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') for sheet in book.sheets(): print sheet.name2Seperangkat alat untuk operasi lebih lanjut di Excel (memerlukan import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')9 dan import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') for sheet in book.sheets(): print sheet.name1)
Anda harus menginstal masing-masing secara terpisah jika ingin menggunakannya; . Karena kita ingin membaca file Excel ke dalam Python, Anda harus memastikan bahwa Anda telah import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')9 terinstal sebelum melanjutkan
pip install xlrd_Siapkan lingkungan kerja Anda untuk file Excel ini dengan melakukan hal berikut (atau sesuatu seperti itu, bergantung pada sistem organisasi Anda)
Buat folder untuk pekerjaan Excel Anda
Buat file Python baru bernama parse_excel. py dan letakkan di folder yang Anda buat
Tempatkan file Excel dari repositori buku bernama SOWC 2014 Stat Tables_Table 9. xlsx di folder yang sama
Dari folder ini, ketikkan perintah berikut di terminal Anda untuk menjalankan skrip dari baris perintah
python parse_excel.py_Di akhir bab ini, kita akan menulis skrip untuk mengurai data pekerja anak dan pernikahan yang disimpan di file Excel ini
Untuk memulai skrip kita, kita perlu mengimpor import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')9 dan membuka buku kerja Excel kita dengan Python. Kami menyimpan file yang dibuka dalam variabel import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') for sheet in book.sheets(): print sheet.name8
import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')Tidak seperti CSV, buku Excel dapat memiliki banyak tab atau lembar. Untuk mendapatkan data kami, kami hanya akan menarik lembar dengan data yang kami inginkan
Jika Anda memiliki beberapa lembar, Anda dapat menebak indeksnya, tetapi itu tidak akan berhasil jika Anda memiliki banyak lembar. Jadi, Anda harus tahu tentang buku perintah. sheet_by_name(import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') for sheet in book.sheets(): print sheet.name9), di mana import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') for sheet in book.sheets(): print sheet.name9 adalah nama sheet yang ingin Anda akses
Mari kita lihat nama-nama sheet yang kita miliki
import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') for sheet in book.sheets(): print sheet.nameLembar yang kita cari adalah import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet1. Jadi, mari masukkan itu ke dalam skrip kita
import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheetJika Anda menjalankan kode itu, kode itu keluar dengan kesalahan yang memberi Anda informasi berikut
xlrd.biffh.XLRDError: No sheet named <'Table 9'>Pada titik ini, Anda mungkin benar-benar bingung. Masalahnya terletak pada perbedaan antara apa yang kita lihat dan apa yang sebenarnya ada
Jika Anda membuka buku kerja Excel Anda dan memilih nama lembar dengan mengklik dua kali, Anda akan menemukan bahwa ada ruang ekstra di bagian akhir. Ruang ini tidak terlihat oleh pengguna di browser. Di , kita akan belajar cara memecahkan masalah ini dengan Python. Untuk saat ini, perbarui kode Anda untuk mencerminkan ruang
Ubah baris ini
sheet = book.sheet_by_name('Table 9')untuk ini
sheet = book.sheet_by_name('Table 9 ')Sekarang, jika kita menjalankan skrip kita, itu akan berfungsi. Anda akan melihat output yang mirip dengan ini
Mari kita jelajahi apa yang bisa kita lakukan dengan sheet. Tambahkan yang berikut ini setelah Anda menetapkan variabel import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet2 dan jalankan kembali skrip Anda
print dir(sheet)Dalam daftar yang ditampilkan, Anda akan melihat metode bernama import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet3. Kami akan menggunakan metode ini untuk mengulangi semua baris. Jika kita menulis import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet_4, jumlah total baris akan dikembalikan
Coba ini sekarang
python parse_excel.py_0Anda seharusnya mendapatkan kembali import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet5. Kita perlu mengulangi setiap baris, yang berarti kita membutuhkan import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet6 loop. Seperti yang telah kita pelajari di , import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet_6 mengulang item dalam daftar, jadi kita perlu mengubah import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet5 menjadi daftar yang dapat kita ulangi lebih dari 303 kali. Untuk melakukan ini, kita akan menggunakan fungsi ________16______9
Dengan penambahan fungsi import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet9 kita dapat mengubah import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet5 ke dalam daftar import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet6 loop kita dapat berulang, skrip kita akan terlihat seperti berikut
python parse_excel.py_1Mengulangi indeks xlrd.biffh.XLRDError: No sheet named <'Table 9'>_3 di xlrd.biffh.XLRDError: No sheet named <'Table 9'>4, yang akan menjadi daftar 303 bilangan bulat yang bertambah satu
Keluaran xlrd.biffh.XLRDError: No sheet named <'Table 9'>_3, yang akan menjadi angka dari 0 hingga 302
Dari sini, kita perlu melakukan pencarian pada setiap baris untuk mengeluarkan isi setiap baris, bukan hanya mencetak nomornya. Untuk melakukan pencarian, kami akan menggunakan xlrd.biffh.XLRDError: No sheet named <'Table 9'>3 sebagai referensi indeks untuk mengambil baris ke-n
Untuk mendapatkan nilai setiap baris, kita akan menggunakan xlrd.biffh.XLRDError: No sheet named <'Table 9'>7, yang merupakan metode lain yang dikembalikan oleh xlrd.biffh.XLRDError: No sheet named <'Table 9'>8 sebelumnya. Kita dapat melihat dari dokumentasi xlrd.biffh.XLRDError: No sheet named <'Table 9'>_7 bahwa metode mengharapkan nomor indeks dan mengembalikan nilai baris yang sesuai. Perbarui import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet_6 loop Anda untuk mencerminkan ini dan jalankan kembali skrip Anda
python parse_excel.py_2Menggunakan xlrd.biffh.XLRDError: No sheet named <'Table 9'>_3 sebagai indeks untuk mencari nilai baris. Karena berada dalam lingkaran import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet_6 yang membentang sepanjang lembar, kami memanggil metode ini untuk setiap baris dalam lembar kami
Saat Anda menjalankan kode ini, Anda akan melihat daftar untuk setiap baris. Berikut adalah subkumpulan data yang akan Anda lihat
python parse_excel.py_3Sekarang kita dapat melihat setiap baris, kita perlu mengeluarkan informasi yang kita inginkan. Untuk membantu kami menentukan informasi apa yang kami butuhkan dan cara mendapatkannya, jauh lebih mudah untuk membuka file dalam program untuk menampilkan file Excel, seperti Microsoft Excel di Windows atau Numbers di Mac. Jika Anda mengunjungi tab kedua di spreadsheet, Anda akan melihat beberapa baris tajuk
Catatan
Dalam kode kami, kami akan bertujuan untuk mengambil teks bahasa Inggris. Namun, jika Anda menginginkan tantangan ekstra, coba keluarkan judul dan negara Prancis atau Spanyol
Pada tab kedua, lihat informasi yang dapat Anda ekstrak dan pikirkan cara terbaik mengaturnya. Kami menyediakan satu cara yang mungkin untuk melakukannya di sini, tetapi ada banyak cara berbeda menggunakan struktur data yang berbeda
Untuk latihan ini, kami akan mengeluarkan statistik pekerja anak dan pernikahan anak. Berikut adalah salah satu cara untuk mengatur dataâkita akan menggunakan ini sebagai contoh untuk bekerja
python parse_excel.py_4Jika Anda melihat data di Excel, beberapa angka ini mungkin muncul. Ini karena Excel akan sering membulatkan angka. Kami menunjukkan angka yang akan Anda temukan saat menggunakan Python untuk mengurai sel
Tip
Merencanakan seperti apa hasil yang Anda inginkan dan menulis contoh data Anda akan menghemat waktu Anda saat Anda mulai membuat kode. Setelah Anda mengidentifikasi bagaimana Anda ingin memformat data, Anda dapat bertanya pada diri sendiri, âApa yang harus saya lakukan selanjutnya untuk sampai ke sana?â Hal ini sangat membantu ketika Anda merasa terhalang pada langkah berikutnya
Ada dua konstruksi Python yang akan kita gunakan untuk mengeluarkan data. Metode pertama yang akan kita gunakan adalah loop bersarang import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet6, yang merupakan loop import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet6 di dalam loop import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet6 lainnya. Ini sering digunakan ketika Anda memiliki baris x yang berisi objek y. Untuk mengakses setiap objek, Anda memerlukan import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet_6 loop untuk setiap baris, lalu import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet6 loop lainnya untuk setiap objek. Kami juga menggunakan loop bersarang import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet_6 dalam contoh di
Kita akan menggunakan loop import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet6 bersarang untuk menampilkan setiap sel dari setiap baris. Ini akan menampilkan item yang kita lihat sebelumnya, di mana setiap baris terdaftar
python parse_excel.py_5Mengambil daftar yang merupakan setiap baris dan menyimpannya ke variabel sheet = book.sheet_by_name('Table 9 ')0. Ini membuat kode kita lebih mudah dibaca
Ulangi setiap item dalam daftar, yang mewakili setiap sel untuk baris saat ini
Mengeluarkan nilai sel
Jika Anda menjalankan kode lengkap Anda dengan loop import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet6 bersarang, Anda akan melihat output Anda tidak begitu membantu lagi. Itu membawa kita ke mekanisme kedua untuk menjelajahi file Excel kitaâsebuah penghitung
Mari tambahkan penghitung ke kode kita sehingga kita dapat menelusuri sel dan baris untuk menemukan apa yang ingin kita tarik. Berhati-hatilah saat Anda meletakkan penghitungâAnda akan mendapatkan hasil yang sangat berbeda jika Anda meletakkannya di tingkat sel versus tingkat baris
Setel ulang import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet_6 loop Anda agar terlihat seperti kode yang ditampilkan di sini
Keluaran xlrd.biffh.XLRDError: No sheet named <'Table 9'>_3 dan baris sehingga kita benar-benar dapat melihat nomor baris mana yang memiliki informasi mana
Sekarang, jika kita kembali ke hasil akhir yang kita inginkan, yang benar-benar perlu kita pikirkan adalah di mana nama negara dimulai. Ingat, nama negara adalah kunci pertama dari kamus keluaran kami
python parse_excel.py_7Jika Anda menjalankan skrip Anda dengan penghitung di dalamnya di mana sheet = book.sheet_by_name('Table 9 ')4, Anda akan melihat dari output bahwa kami belum mencapai baris di mana nama negara dimulai
Karena kami melewatkan beberapa baris untuk mendapatkan data yang kami minati, kami ingin mengidentifikasi nomor baris mana yang kami perlukan untuk memulai pengumpulan data kami. Dari upaya kami sebelumnya, kami mengetahui nama negara dimulai dari baris ke-10. Tapi bagaimana kita tahu harus mulai dari mana?
Jawabannya ada di contoh kode berikutnya, tetapi sebelum Anda melihat, coba perbarui penghitung untuk memulai dari baris di mana nama negara dimulai. (Ada beberapa cara untuk melakukan ini, jadi jika jawaban Anda sedikit berbeda dari yang kami miliki dalam contoh kode berikut, tidak apa-apa. )
Setelah Anda mengidentifikasi nomor baris yang tepat, Anda perlu menambahkan pernyataan sheet = book.sheet_by_name('Table 9 ')5 untuk mulai mengeluarkan nilai setelah baris tersebut. Ini agar kami hanya bekerja dengan data di bawah garis itu
Jika Anda bisa membuatnya berfungsi, kode Anda akan menyukai sesuatu seperti ini
python parse_excel.py_8Baris ini akan mengulangi 20 baris pertama untuk mengidentifikasi baris mana nama negara dimulai
Pernyataan sheet = book.sheet_by_name('Table 9 ')_5 ini memulai output pada titik di mana baris negara muncul
Pada titik ini, Anda harus memiliki keluaran yang terlihat seperti ini
python parse_excel.py_9Sekarang, kita perlu mengubah setiap baris menjadi format kamus kita. Ini akan membuat data lebih berarti bagi kami saat kami mencoba melakukan hal lain dengannya di bab mendatang
Melihat kembali contoh kita sebelumnya tentang bagaimana kita ingin keluaran kita diatur, kita akan membutuhkan kamus dan kita akan menggunakan negara sebagai kunci. Untuk mengeluarkan nama negara, kita perlu melakukan beberapa pengindeksan
Mari kita tambahkan kamus ke kode kita, lalu keluarkan nama negara dari setiap baris dan tambahkan sebagai kunci kamus kita
Perbarui import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet_6 loop Anda untuk mencerminkan hal ini
import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')0Ini membuat kamus kosong untuk menyimpan data kami
sheet = book.sheet_by_name('Table 9 ')8 mengeluarkan negara dari setiap baris yang kita ulangi
sheet = book.sheet_by_name('Table 9 ')9 menambahkan negara sebagai kunci kamus 0. Kami menetapkan nilai ke kamus lain, karena di situlah kami akan menyimpan data kami dalam langkah-langkah berikut
Ini menghasilkan data, sehingga kita dapat melihat seperti apa tampilannya
Pada titik ini, output Anda akan terlihat seperti ini
import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')_1Sekarang, kita perlu mencocokkan setiap nilai di sisa baris dengan nilai yang sesuai di spreadsheet, lalu menyimpannya di kamus kita
Catatan
Saat Anda mencoba menarik semua nilai dan memeriksanya dengan lembar Excel Anda, Anda akan membuat banyak kesalahan. Itu bagus dan diharapkan. Proses ini harus dirangkulâartinya Anda sedang menyelesaikan masalah
Pertama, mari kita buat versi kosong dari struktur data tempat kita dapat menyimpan data. Mari kita juga menghapus penghitung kita, karena kita tahu bahwa baris data dimulai dari baris 14. Karena kita tahu 1 dapat menerima titik awal dan akhir, kita dapat memulai penghitungan kita pada 14 dan berakhir pada akhir file. Mari kita lihat kode terbaru kami
import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')_2Kami dapat menghapus semua referensi kami ke penghitung dan memulai import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet6 loop kami mulai dari baris ke-14 lembar kami. Baris ini memulai perulangan dengan nilai 14, jadi kami secara otomatis melewati baris yang tidak diperlukan untuk kumpulan data kami
Baris ini memperluas kamus ke beberapa baris untuk mengisi poin data lainnya
Ini membuat kunci _3 dan menyetelnya sama dengan kamus lain
Kamus memiliki string untuk menjelaskan setiap bagian dari data yang disimpannya. Untuk setiap kunci ini, nilainya adalah daftar
Ini menampilkan nilai yang terkait dengan kunci ________21______4
Data keluaran kami untuk 4 terlihat seperti ini
import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')_3Sekarang mari kita isi datanya. Karena kami memiliki akses ke setiap kolom dari setiap baris menggunakan indeks, kami dapat mengisi daftar ini dengan nilai dari sheet. Dengan melihat lembar kami dan mengatur kolom mana yang berhubungan dengan bagian mana dari data, kami dapat memperbarui kamus data untuk mencerminkan hal berikut
import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')_4Karena ada dua sel untuk setiap kolom, kode kita menyimpan kedua nilai tersebut. Karena di baris ini total pekerja anak kita adalah kolom kelima dan keenam dan kita tahu Python tidak diindeks, kita ingin indeks keempat dan kelima
Saat kami menjalankan kode kami lagi, kami mendapatkan keluaran seperti ini
import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')5Peringatan
Sebelum Anda melanjutkan, keluarkan beberapa catatan dan periksa nomornya di kamus. Sangat mudah untuk mengakhiri satu indeks dan merusak sisa data Anda
Terakhir, untuk mempratinjau data kami, kami dapat menggunakan 6 alih-alih pernyataan 7. Dalam struktur data yang rumit (seperti kamus), ini membuatnya jauh lebih mudah untuk meninjau hasilnya. Tambahkan yang berikut ke bagian akhir file Anda untuk mempratinjau data dengan cara yang diformat
import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')_6Mengimpor perpustakaan _6. Biasanya, pernyataan _9 muncul di awal file, tetapi kami meletakkannya di sini untuk kemudahan. Setelah selesai, Anda ingin menghapus baris-baris ini, karena tidak penting untuk skrip Anda
Meneruskan data ke fungsi print dir(sheet)_0
Jika Anda menelusuri output Anda, Anda akan melihat sebagian besar tampilannya bagus. Tapi ada beberapa catatan yang tampaknya tidak pada tempatnya
Jika Anda melihat spreadsheet, Anda harus mencatat bahwa baris terakhir untuk negara adalah Zimbabwe. Jadi, kami ingin mencari kapan negaranya sama dengan print dir(sheet)1, dan keluar dari sana. Untuk keluar, kami menambahkan print dir(sheet)2 ke kode kami, yang merupakan cara kami memutus loop import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet6 sebelum waktunya untuk melanjutkan sisa skrip. Mari kita tambahkan itu sebagai titik perhentian kita. Di akhir import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet_6 loop, tambahkan kode berikut dan jalankan kembali kode Anda
import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')_7Jika negaranya sama dengan Zimbabweâ¦
Keluar dari import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet_6 loop
Peringatan
Setelah menambahkan print dir(sheet)_2, apakah Anda berakhir dengan kesalahan print dir(sheet)7? . Pernyataan sheet = book.sheet_by_name('Table 9 ')_5 harus menjorok empat spasi untuk berada di import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet6 loop
Melangkah melalui kode dapat membantu dalam mengidentifikasi masalah. Jika Anda perlu memecahkan masalah untuk mencari tahu apa variabel, seperti python parse_excel.py00, sama dengan dalam import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet6 loop, coba tambahkan 7 pernyataan di dalam import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx') sheet = book.sheet_by_name('Table 9') print sheet6 loop dan perhatikan nilainya sebelum skrip Anda keluar dengan kesalahan. Mereka kemungkinan besar akan memberi Anda petunjuk tentang apa yang terjadi
Pada titik ini, keluaran skrip kami cocok dengan tujuan akhir kami. Hal terakhir yang ingin kami lakukan pada skrip kami adalah memastikan bahwa kami mendokumentasikannya dengan beberapa komentar
Skrip Anda sekarang akan terlihat seperti ini
import xlrd book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')_8Ini adalah komentar multibaris yang digunakan untuk menjelaskan secara umum apa yang terjadi dalam skrip ini
Ini adalah komentar satu baris untuk mendokumentasikan mengapa kita mulai pada baris 14 dan bukan lebih awal
Kita dapat dan harus menghapus baris-baris ini saat kita bergerak melampaui penguraian data sederhana ke dalam analisis data
Pada titik ini, kita memiliki keluaran yang serupa dengan data bab sebelumnya. Di bab selanjutnya, kita akan melangkah lebih jauh dan mem-parsing data yang sama dari PDF