Cara membaca fail excel (xlsx) di python

How Read Excel File Python



The .xlsx adalah peluasan dokumen excel yang dapat menyimpan sejumlah besar data dalam bentuk tabel, dan banyak jenis pengiraan aritmetik dan logik dapat dilakukan dengan mudah dalam spreadsheet excel. Kadang-kadang diperlukan untuk membaca data dari dokumen excel menggunakan skrip Python untuk tujuan pengaturcaraan. Terdapat banyak modul di Python untuk membaca dokumen excel. Beberapa modul berguna adalah xlrd , openpyxl , dan panda . Kaedah menggunakan modul ini untuk membaca fail excel di Python telah ditunjukkan dalam tutorial ini.

Pra-syarat:

Fail dummy excel dengan sambungan .xlsx diperlukan untuk memeriksa contoh tutorial ini. Anda boleh menggunakan fail excel yang ada atau membuat yang baru. Di sini, fail excel baru bernama penjualan.xlsx fail telah dibuat dengan data berikut. Fail ini telah digunakan untuk membaca dengan menggunakan modul python yang berbeza di bahagian seterusnya dari tutorial ini.







penjualan.xlsx



Tarikh Jualan Orang Jualan Jumlah
05/12/18 Sila Ahmed 60000
12/06/19 Saya Hossain 50,000
08/09/20 Sarmin Jahan 45000
04/07/21 Mahmudul Hasan 30000

Contoh-1: Baca fail excel menggunakan xlrd

Modul xlrd tidak dipasang dengan Python secara lalai. Jadi, anda harus memasang modul sebelum menggunakannya. Versi terbaru modul ini tidak menyokong fail excel dengan sambungan .xlsx. Jadi, anda harus memasang versi 1.2.0 modul ini untuk membaca fail xlsx. Jalankan arahan berikut dari terminal untuk memasang versi yang diperlukan xlrd .



$pippasang xlrd== 1.2.0

Setelah menyelesaikan proses pemasangan, buat fail python dengan skrip berikut untuk membaca penjualan.xlsx fail menggunakan yang xlrd modul. open_workbook () fungsi digunakan dalam skrip buka fail xlsx untuk membaca. Fail excel ini mengandungi satu helaian sahaja. Jadi buku kerja.sheet_by_index () fungsi telah digunakan dalam skrip dengan nilai argumen 0. Seterusnya, bersarang ‘Untuk’ gelung telah digunakan untuk membaca nilai sel lembaran kerja menggunakan nilai baris dan lajur. Dua fungsi () fungsi telah digunakan dalam skrip untuk menentukan ukuran baris dan lajur berdasarkan data lembaran. The nilai_ sel () fungsi telah digunakan untuk membaca nilai sel tertentu dari helaian dalam setiap lelaran gelung. Setiap medan dalam output akan dipisahkan oleh ruang satu tab.





# Import modul xlrd
import xlrd

# Buka Buku Kerja
buku kerja = xlrd.open_workbook('penjualan.xlsx')

# Buka lembaran kerja
lembaran kerja = buku kerja.sheet_by_index(0)

# Ulangi baris dan lajur
untukidalamjulat(0,5):
untukjdalamjulat(0,3):
# Cetak nilai sel dengan ruang tab
mencetak(lembaran kerja.cell_value(i, j),akhir=' t')
mencetak('')

Pengeluaran:

Output berikut akan muncul setelah melaksanakan skrip di atas.



Contoh-2: Baca fail excel menggunakan openpyxl

The openpyxl adalah modul python lain untuk membaca fail xlsx, dan ia juga tidak dipasang dengan Python secara lalai. Jalankan arahan berikut dari terminal untuk memasang modul ini sebelum menggunakannya.

$pippasangopenpyxl

Setelah menyelesaikan proses pemasangan, buat fail python dengan skrip berikut untuk membaca penjualan.xlsx fail. Seperti modul xlrd, yang openpyxl modul mempunyai memuatkan_buku kerja () berfungsi untuk membuka fail xlsx untuk membaca. The penjualan.xlsx fail digunakan sebagai nilai argumen fungsi ini. Objek dari wookbook.aktif telah dibuat dalam skrip untuk membaca nilai-nilai max_row dan juga kolum maksimum harta benda. Sifat-sifat ini telah digunakan di sarang untuk gelung untuk membaca kandungan penjualan.xlsx fail. Fungsi range () telah digunakan untuk membaca baris lembar, dan fungsi iter_cols () telah digunakan untuk membaca lajur helaian. Setiap medan dalam output akan dipisahkan oleh dua ruang tab.

# Import modul openyxl
import openpyxl

# Tentukan pemboleh ubah untuk memuatkan buku wook
wookbook = openpyxl.load_workbook('penjualan.xlsx')

# Tentukan pemboleh ubah untuk membaca lembaran aktif:
lembaran kerja = wookbook.active

# Ulangi gelung untuk membaca nilai sel
untukidalamjulat(0, lembaran kerja.max_row):
untuk dengan dalamlembaran kerja.iter_cols(1, lembaran kerja.max_column):
mencetak(dengan[i]. nilai,akhir=' t t')
mencetak('')

Pengeluaran:

Output berikut akan muncul setelah melaksanakan skrip di atas.

Contoh-3: Baca fail excel menggunakan panda

Modul panda tidak dipasang dengan python seperti modul sebelumnya. Oleh itu, jika anda tidak memasangnya sebelumnya, anda mesti memasangnya. Jalankan arahan berikut untuk memasang panda dari terminal.

$pippasangpanda

Setelah menyelesaikan proses pemasangan, buat fail python dengan skrip berikut untuk membaca penjualan.xlsx fail. The baca_excel () fungsi panda digunakan untuk membaca fail xlsx. Fungsi ini telah digunakan dalam skrip untuk membaca penjualan.xlsx fail. The DataFrame () fungsi telah digunakan di sini untuk membaca kandungan fail xlsx dalam kerangka data dan menyimpan nilai dalam pemboleh ubah bernama data . Nilai data telah dicetak kemudian.

# Import panda
panda importsebagaipd

# Muatkan fail xlsx
excel_data = pd.read_excel('penjualan.xlsx')
# Baca nilai fail dalam kerangka data
data = pd.DataFrame(excel_data,lajur=['Tarikh Jualan','Orang Jualan','Jumlah'])
# Cetak kandungannya
mencetak('Kandungan fail adalah: n', data)

Pengeluaran:

Output berikut akan muncul setelah melaksanakan skrip di atas. Keluaran skrip ini berbeza dengan dua contoh sebelumnya. Nombor baris dicetak pada lajur pertama, di mana nilai baris telah dikira dari 0. Nilai tarikh diselaraskan secara terpusat. Nama jurujual diselaraskan ke kanan. Jumlahnya diselaraskan ke kiri.

Kesimpulan:

Pengguna python perlu bekerja dengan fail xlsx untuk tujuan pengaturcaraan yang berbeza. Tiga cara berbeza untuk membaca fail xlsx telah ditunjukkan dalam tutorial ini dengan menggunakan tiga modul python. Setiap modul mempunyai fungsi dan sifat yang berbeza untuk membaca fail xlsx. Tutorial ini akan membantu pengguna python membaca fail xlsx dengan mudah menggunakan skrip python setelah membaca tutorial ini.