Bagaimana cara menggunakan excel sebagai database di python?

Pustaka yang kami identifikasi untuk mem-parsing file Excel adalah

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
9. Pustaka ini adalah bagian dari serangkaian pustaka untuk bekerja dengan file Excel dengan Python

Ada tiga pustaka utama untuk menangani file Excel

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
_9

Membaca file Excel

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')

for sheet in book.sheets():
    print sheet.name
1

Menulis dan memformat file Excel

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')

for sheet in book.sheets():
    print sheet.name
2

Seperangkat alat untuk operasi lebih lanjut di Excel (memerlukan

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
9 dan
import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')

for sheet in book.sheets():
    print sheet.name
1)

Anda harus menginstal masing-masing secara terpisah jika ingin menggunakannya; . Karena kita ingin membaca file Excel ke dalam Python, Anda harus memastikan bahwa Anda telah

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
9 terinstal sebelum melanjutkan

pip install xlrd
_

Siapkan lingkungan kerja Anda untuk file Excel ini dengan melakukan hal berikut (atau sesuatu seperti itu, bergantung pada sistem organisasi Anda)

  1. Buat folder untuk pekerjaan Excel Anda

  2. Buat file Python baru bernama parse_excel. py dan letakkan di folder yang Anda buat

  3. Tempatkan file Excel dari repositori buku bernama SOWC 2014 Stat Tables_Table 9. xlsx di folder yang sama

Dari folder ini, ketikkan perintah berikut di terminal Anda untuk menjalankan skrip dari baris perintah

python parse_excel.py
_

Di akhir bab ini, kita akan menulis skrip untuk mengurai data pekerja anak dan pernikahan yang disimpan di file Excel ini

Untuk memulai skrip kita, kita perlu mengimpor

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
9 dan membuka buku kerja Excel kita dengan Python. Kami menyimpan file yang dibuka dalam variabel
import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')

for sheet in book.sheets():
    print sheet.name
8

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')

Tidak seperti CSV, buku Excel dapat memiliki banyak tab atau lembar. Untuk mendapatkan data kami, kami hanya akan menarik lembar dengan data yang kami inginkan

Jika Anda memiliki beberapa lembar, Anda dapat menebak indeksnya, tetapi itu tidak akan berhasil jika Anda memiliki banyak lembar. Jadi, Anda harus tahu tentang buku perintah. sheet_by_name(

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')

for sheet in book.sheets():
    print sheet.name
9), di mana
import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')

for sheet in book.sheets():
    print sheet.name
9 adalah nama sheet yang ingin Anda akses

Mari kita lihat nama-nama sheet yang kita miliki

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')

for sheet in book.sheets():
    print sheet.name

Lembar yang kita cari adalah

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
1. Jadi, mari masukkan itu ke dalam skrip kita

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet

Jika Anda menjalankan kode itu, kode itu keluar dengan kesalahan yang memberi Anda informasi berikut

xlrd.biffh.XLRDError: No sheet named <'Table 9'>

Pada titik ini, Anda mungkin benar-benar bingung. Masalahnya terletak pada perbedaan antara apa yang kita lihat dan apa yang sebenarnya ada

Jika Anda membuka buku kerja Excel Anda dan memilih nama lembar dengan mengklik dua kali, Anda akan menemukan bahwa ada ruang ekstra di bagian akhir. Ruang ini tidak terlihat oleh pengguna di browser. Di , kita akan belajar cara memecahkan masalah ini dengan Python. Untuk saat ini, perbarui kode Anda untuk mencerminkan ruang

Ubah baris ini

sheet = book.sheet_by_name('Table 9')

untuk ini

sheet = book.sheet_by_name('Table 9 ')

Sekarang, jika kita menjalankan skrip kita, itu akan berfungsi. Anda akan melihat output yang mirip dengan ini

Mari kita jelajahi apa yang bisa kita lakukan dengan sheet. Tambahkan yang berikut ini setelah Anda menetapkan variabel

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
2 dan jalankan kembali skrip Anda

print dir(sheet)

Dalam daftar yang ditampilkan, Anda akan melihat metode bernama

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
3. Kami akan menggunakan metode ini untuk mengulangi semua baris. Jika kita menulis
import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
_4, jumlah total baris akan dikembalikan

Coba ini sekarang

python parse_excel.py
_0

Anda seharusnya mendapatkan kembali

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
5. Kita perlu mengulangi setiap baris, yang berarti kita membutuhkan
import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
6 loop. Seperti yang telah kita pelajari di ,
import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
_6 mengulang item dalam daftar, jadi kita perlu mengubah
import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
5 menjadi daftar yang dapat kita ulangi lebih dari 303 kali. Untuk melakukan ini, kita akan menggunakan fungsi ________16______9

Dengan penambahan fungsi

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
9 kita dapat mengubah
import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
5 ke dalam daftar
import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
6 loop kita dapat berulang, skrip kita akan terlihat seperti berikut

python parse_excel.py
_1

Mengulangi indeks

xlrd.biffh.XLRDError: No sheet named <'Table 9'>
_3 di
xlrd.biffh.XLRDError: No sheet named <'Table 9'>
4, yang akan menjadi daftar 303 bilangan bulat yang bertambah satu

Keluaran

xlrd.biffh.XLRDError: No sheet named <'Table 9'>
_3, yang akan menjadi angka dari 0 hingga 302

Dari sini, kita perlu melakukan pencarian pada setiap baris untuk mengeluarkan isi setiap baris, bukan hanya mencetak nomornya. Untuk melakukan pencarian, kami akan menggunakan

xlrd.biffh.XLRDError: No sheet named <'Table 9'>
3 sebagai referensi indeks untuk mengambil baris ke-n

Untuk mendapatkan nilai setiap baris, kita akan menggunakan

xlrd.biffh.XLRDError: No sheet named <'Table 9'>
7, yang merupakan metode lain yang dikembalikan oleh
xlrd.biffh.XLRDError: No sheet named <'Table 9'>
8 sebelumnya. Kita dapat melihat dari dokumentasi
xlrd.biffh.XLRDError: No sheet named <'Table 9'>
_7 bahwa metode mengharapkan nomor indeks dan mengembalikan nilai baris yang sesuai. Perbarui
import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
_6 loop Anda untuk mencerminkan ini dan jalankan kembali skrip Anda

python parse_excel.py
_2

Menggunakan

xlrd.biffh.XLRDError: No sheet named <'Table 9'>
_3 sebagai indeks untuk mencari nilai baris. Karena berada dalam lingkaran
import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
_6 yang membentang sepanjang lembar, kami memanggil metode ini untuk setiap baris dalam lembar kami

Saat Anda menjalankan kode ini, Anda akan melihat daftar untuk setiap baris. Berikut adalah subkumpulan data yang akan Anda lihat

python parse_excel.py
_3

Sekarang kita dapat melihat setiap baris, kita perlu mengeluarkan informasi yang kita inginkan. Untuk membantu kami menentukan informasi apa yang kami butuhkan dan cara mendapatkannya, jauh lebih mudah untuk membuka file dalam program untuk menampilkan file Excel, seperti Microsoft Excel di Windows atau Numbers di Mac. Jika Anda mengunjungi tab kedua di spreadsheet, Anda akan melihat beberapa baris tajuk

Catatan

Dalam kode kami, kami akan bertujuan untuk mengambil teks bahasa Inggris. Namun, jika Anda menginginkan tantangan ekstra, coba keluarkan judul dan negara Prancis atau Spanyol

Pada tab kedua, lihat informasi yang dapat Anda ekstrak dan pikirkan cara terbaik mengaturnya. Kami menyediakan satu cara yang mungkin untuk melakukannya di sini, tetapi ada banyak cara berbeda menggunakan struktur data yang berbeda

Untuk latihan ini, kami akan mengeluarkan statistik pekerja anak dan pernikahan anak. Berikut adalah salah satu cara untuk mengatur dataâkita akan menggunakan ini sebagai contoh untuk bekerja

python parse_excel.py
_4

Jika Anda melihat data di Excel, beberapa angka ini mungkin muncul. Ini karena Excel akan sering membulatkan angka. Kami menunjukkan angka yang akan Anda temukan saat menggunakan Python untuk mengurai sel

Tip

Merencanakan seperti apa hasil yang Anda inginkan dan menulis contoh data Anda akan menghemat waktu Anda saat Anda mulai membuat kode. Setelah Anda mengidentifikasi bagaimana Anda ingin memformat data, Anda dapat bertanya pada diri sendiri, âApa yang harus saya lakukan selanjutnya untuk sampai ke sana?â Hal ini sangat membantu ketika Anda merasa terhalang pada langkah berikutnya

Ada dua konstruksi Python yang akan kita gunakan untuk mengeluarkan data. Metode pertama yang akan kita gunakan adalah loop bersarang

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
6, yang merupakan loop
import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
6 di dalam loop
import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
6 lainnya. Ini sering digunakan ketika Anda memiliki baris x yang berisi objek y. Untuk mengakses setiap objek, Anda memerlukan
import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
_6 loop untuk setiap baris, lalu
import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
6 loop lainnya untuk setiap objek. Kami juga menggunakan loop bersarang
import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
_6 dalam contoh di

Kita akan menggunakan loop

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
6 bersarang untuk menampilkan setiap sel dari setiap baris. Ini akan menampilkan item yang kita lihat sebelumnya, di mana setiap baris terdaftar

python parse_excel.py
_5

Mengambil daftar yang merupakan setiap baris dan menyimpannya ke variabel

sheet = book.sheet_by_name('Table 9 ')
0. Ini membuat kode kita lebih mudah dibaca

Ulangi setiap item dalam daftar, yang mewakili setiap sel untuk baris saat ini

Mengeluarkan nilai sel

Jika Anda menjalankan kode lengkap Anda dengan loop

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
6 bersarang, Anda akan melihat output Anda tidak begitu membantu lagi. Itu membawa kita ke mekanisme kedua untuk menjelajahi file Excel kitaâsebuah penghitung

Mari tambahkan penghitung ke kode kita sehingga kita dapat menelusuri sel dan baris untuk menemukan apa yang ingin kita tarik. Berhati-hatilah saat Anda meletakkan penghitungâAnda akan mendapatkan hasil yang sangat berbeda jika Anda meletakkannya di tingkat sel versus tingkat baris

Setel ulang

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
_6 loop Anda agar terlihat seperti kode yang ditampilkan di sini

python parse_excel.py
_6

Keluaran

xlrd.biffh.XLRDError: No sheet named <'Table 9'>
_3 dan baris sehingga kita benar-benar dapat melihat nomor baris mana yang memiliki informasi mana

Sekarang, jika kita kembali ke hasil akhir yang kita inginkan, yang benar-benar perlu kita pikirkan adalah di mana nama negara dimulai. Ingat, nama negara adalah kunci pertama dari kamus keluaran kami

python parse_excel.py
_7

Jika Anda menjalankan skrip Anda dengan penghitung di dalamnya di mana

sheet = book.sheet_by_name('Table 9 ')
4, Anda akan melihat dari output bahwa kami belum mencapai baris di mana nama negara dimulai

Karena kami melewatkan beberapa baris untuk mendapatkan data yang kami minati, kami ingin mengidentifikasi nomor baris mana yang kami perlukan untuk memulai pengumpulan data kami. Dari upaya kami sebelumnya, kami mengetahui nama negara dimulai dari baris ke-10. Tapi bagaimana kita tahu harus mulai dari mana?

Jawabannya ada di contoh kode berikutnya, tetapi sebelum Anda melihat, coba perbarui penghitung untuk memulai dari baris di mana nama negara dimulai. (Ada beberapa cara untuk melakukan ini, jadi jika jawaban Anda sedikit berbeda dari yang kami miliki dalam contoh kode berikut, tidak apa-apa. )

Setelah Anda mengidentifikasi nomor baris yang tepat, Anda perlu menambahkan pernyataan

sheet = book.sheet_by_name('Table 9 ')
5 untuk mulai mengeluarkan nilai setelah baris tersebut. Ini agar kami hanya bekerja dengan data di bawah garis itu

Jika Anda bisa membuatnya berfungsi, kode Anda akan menyukai sesuatu seperti ini

python parse_excel.py
_8

Baris ini akan mengulangi 20 baris pertama untuk mengidentifikasi baris mana nama negara dimulai

Pernyataan

sheet = book.sheet_by_name('Table 9 ')
_5 ini memulai output pada titik di mana baris negara muncul

Pada titik ini, Anda harus memiliki keluaran yang terlihat seperti ini

python parse_excel.py
_9

Sekarang, kita perlu mengubah setiap baris menjadi format kamus kita. Ini akan membuat data lebih berarti bagi kami saat kami mencoba melakukan hal lain dengannya di bab mendatang

Melihat kembali contoh kita sebelumnya tentang bagaimana kita ingin keluaran kita diatur, kita akan membutuhkan kamus dan kita akan menggunakan negara sebagai kunci. Untuk mengeluarkan nama negara, kita perlu melakukan beberapa pengindeksan

Mari kita tambahkan kamus ke kode kita, lalu keluarkan nama negara dari setiap baris dan tambahkan sebagai kunci kamus kita

Perbarui

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
_6 loop Anda untuk mencerminkan hal ini

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
0

Ini membuat kamus kosong untuk menyimpan data kami

sheet = book.sheet_by_name('Table 9 ')
8 mengeluarkan negara dari setiap baris yang kita ulangi

sheet = book.sheet_by_name('Table 9 ')
9 menambahkan negara sebagai kunci kamus
0. Kami menetapkan nilai ke kamus lain, karena di situlah kami akan menyimpan data kami dalam langkah-langkah berikut

Ini menghasilkan data, sehingga kita dapat melihat seperti apa tampilannya

Pada titik ini, output Anda akan terlihat seperti ini

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
_1

Sekarang, kita perlu mencocokkan setiap nilai di sisa baris dengan nilai yang sesuai di spreadsheet, lalu menyimpannya di kamus kita

Catatan

Saat Anda mencoba menarik semua nilai dan memeriksanya dengan lembar Excel Anda, Anda akan membuat banyak kesalahan. Itu bagus dan diharapkan. Proses ini harus dirangkulâartinya Anda sedang menyelesaikan masalah

Pertama, mari kita buat versi kosong dari struktur data tempat kita dapat menyimpan data. Mari kita juga menghapus penghitung kita, karena kita tahu bahwa baris data dimulai dari baris 14. Karena kita tahu

1 dapat menerima titik awal dan akhir, kita dapat memulai penghitungan kita pada 14 dan berakhir pada akhir file. Mari kita lihat kode terbaru kami

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
_2

Kami dapat menghapus semua referensi kami ke penghitung dan memulai

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
6 loop kami mulai dari baris ke-14 lembar kami. Baris ini memulai perulangan dengan nilai 14, jadi kami secara otomatis melewati baris yang tidak diperlukan untuk kumpulan data kami

Baris ini memperluas kamus ke beberapa baris untuk mengisi poin data lainnya

Ini membuat kunci

_3 dan menyetelnya sama dengan kamus lain

Kamus memiliki string untuk menjelaskan setiap bagian dari data yang disimpannya. Untuk setiap kunci ini, nilainya adalah daftar

Ini menampilkan nilai yang terkait dengan kunci ________21______4

Data keluaran kami untuk

4 terlihat seperti ini

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
_3

Sekarang mari kita isi datanya. Karena kami memiliki akses ke setiap kolom dari setiap baris menggunakan indeks, kami dapat mengisi daftar ini dengan nilai dari sheet. Dengan melihat lembar kami dan mengatur kolom mana yang berhubungan dengan bagian mana dari data, kami dapat memperbarui kamus data untuk mencerminkan hal berikut

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
_4

Karena ada dua sel untuk setiap kolom, kode kita menyimpan kedua nilai tersebut. Karena di baris ini total pekerja anak kita adalah kolom kelima dan keenam dan kita tahu Python tidak diindeks, kita ingin indeks keempat dan kelima

Saat kami menjalankan kode kami lagi, kami mendapatkan keluaran seperti ini

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
5

Peringatan

Sebelum Anda melanjutkan, keluarkan beberapa catatan dan periksa nomornya di kamus. Sangat mudah untuk mengakhiri satu indeks dan merusak sisa data Anda

Terakhir, untuk mempratinjau data kami, kami dapat menggunakan

6 alih-alih pernyataan 
7. Dalam struktur data yang rumit (seperti kamus), ini membuatnya jauh lebih mudah untuk meninjau hasilnya. Tambahkan yang berikut ke bagian akhir file Anda untuk mempratinjau data dengan cara yang diformat

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
_6

Mengimpor perpustakaan

_6. Biasanya, pernyataan 
_9 muncul di awal file, tetapi kami meletakkannya di sini untuk kemudahan. Setelah selesai, Anda ingin menghapus baris-baris ini, karena tidak penting untuk skrip Anda

Meneruskan data ke fungsi

print dir(sheet)
_0

Jika Anda menelusuri output Anda, Anda akan melihat sebagian besar tampilannya bagus. Tapi ada beberapa catatan yang tampaknya tidak pada tempatnya

Jika Anda melihat spreadsheet, Anda harus mencatat bahwa baris terakhir untuk negara adalah Zimbabwe. Jadi, kami ingin mencari kapan negaranya sama dengan

print dir(sheet)
1, dan keluar dari sana. Untuk keluar, kami menambahkan
print dir(sheet)
2 ke kode kami, yang merupakan cara kami memutus loop
import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
6 sebelum waktunya untuk melanjutkan sisa skrip. Mari kita tambahkan itu sebagai titik perhentian kita. Di akhir
import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
_6 loop, tambahkan kode berikut dan jalankan kembali kode Anda

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
_7

Jika negaranya sama dengan Zimbabweâ¦

Keluar dari

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
_6 loop

Peringatan

Setelah menambahkan

print dir(sheet)
_2, apakah Anda berakhir dengan kesalahan
print dir(sheet)
7? . Pernyataan
sheet = book.sheet_by_name('Table 9 ')
_5 harus menjorok empat spasi untuk berada di
import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
6 loop

Melangkah melalui kode dapat membantu dalam mengidentifikasi masalah. Jika Anda perlu memecahkan masalah untuk mencari tahu apa variabel, seperti

python parse_excel.py
00, sama dengan dalam
import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
6 loop, coba tambahkan
7 pernyataan di dalam 
import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
sheet = book.sheet_by_name('Table 9')

print sheet
6 loop dan perhatikan nilainya sebelum skrip Anda keluar dengan kesalahan. Mereka kemungkinan besar akan memberi Anda petunjuk tentang apa yang terjadi

Pada titik ini, keluaran skrip kami cocok dengan tujuan akhir kami. Hal terakhir yang ingin kami lakukan pada skrip kami adalah memastikan bahwa kami mendokumentasikannya dengan beberapa komentar

Skrip Anda sekarang akan terlihat seperti ini

import xlrd

book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')
_8

Ini adalah komentar multibaris yang digunakan untuk menjelaskan secara umum apa yang terjadi dalam skrip ini

Ini adalah komentar satu baris untuk mendokumentasikan mengapa kita mulai pada baris 14 dan bukan lebih awal

Kita dapat dan harus menghapus baris-baris ini saat kita bergerak melampaui penguraian data sederhana ke dalam analisis data

Pada titik ini, kita memiliki keluaran yang serupa dengan data bab sebelumnya. Di bab selanjutnya, kita akan melangkah lebih jauh dan mem-parsing data yang sama dari PDF

Apakah mungkin menggunakan Excel sebagai database?

Excel adalah alat tabular, jadi tata letak terbaik adalah tabel database . Yang perlu Anda lakukan hanyalah membuat kolom dan baris, yang akan bertindak sebagai bidang basis data, lalu memasukkan data. Setelah data Anda masuk, Anda dapat mencari database, meninjau informasi Anda, dan bahkan meringkas data.

Bisakah Python menarik data dari Excel?

Seseorang dapat mengambil informasi dari spreadsheet . Membaca, menulis, atau memodifikasi data dapat dilakukan dengan Python dapat dilakukan dengan menggunakan metode yang berbeda.

Bagaimana cara membuat database menggunakan Excel?

Buat database tanpa menggunakan template .
Pada tab File, klik Baru, lalu klik Database Kosong
Ketik nama file di kotak Nama File. .
Klik Buat. .
Mulailah mengetik untuk menambahkan data, atau Anda bisa menempelkan data dari sumber lain, seperti yang dijelaskan di bagian Menyalin data dari sumber lain ke dalam tabel Access

Bagaimana cara mengonversi Excel ke SQL dengan Python?

Pengembang Python dapat dengan mudah memuat & mengonversi file XLSX ke SQL hanya dalam beberapa baris kode. .
Muat file XLSX dengan instance Workbook
Panggil Buku Kerja. Simpan metode
Lewati jalur keluaran dengan ekstensi SQL sebagai parameter
Periksa jalur yang ditentukan untuk file SQL yang dihasilkan