XLSX kepada CSV dalam Python

Xlsx Kepada Csv Dalam Python



Dalam beberapa tahun kebelakangan ini, Python telah meningkat sebagai salah satu bahasa pengaturcaraan yang dominan. Komuniti Python telah berkembang dengan ketara hasil daripada populariti dan utiliti Python. Kami akan menerangkan secara terperinci dalam artikel ini tentang cara menggunakan Python untuk menukar XLSX kepada CSV. Kami sedar bahawa fail excel kerap digunakan untuk melakukan analisis kewangan, menyusun data, kemasukan data, perakaunan, pengurusan data, mencipta carta dan graf, dsb. Walau bagaimanapun, kebanyakannya kami lebih suka menggunakan fail CSV untuk import dan eksport data. Salah satu pendekatannya ialah memindahkan data berstruktur menggunakan fail teks biasa.

Apakah Fail Xslx?

Apabila membuat hamparan dalam versi terkini Excel, Microsoft menggunakan fail XLSX sebagai jenis fail lalai. Sama seperti jenis fail DOCX Word, kami boleh membuka fail XLSX menggunakan pelbagai aplikasi/program.

Apakah Fail CSV?

Format fail CSV ialah apa yang boleh kita gunakan untuk menyimpan nilai data jadual dalam hamparan dan pangkalan data. Data jadual, teks atau teks, disimpan sebagai teks biasa dalam fail CSV. Rekod dalam fail CSV ialah nilai data yang disimpan pada setiap baris fail. Setiap rekod boleh mempunyai lebih daripada satu medan yang dipisahkan dengan koma.







Perbezaan Utama Antara Fail XLSX dan CSV

Pengguna sering menggunakan CSV dan XLSX secara bergantian, dan mereka secara amnya tidak mengetahui perbezaan antara mereka, apakah ciri asas mereka dan cara ia berfungsi. Ia hanya berfungsi sebagai sumber maklumat untuk pengguna. Hampir setiap perniagaan dan korporat menggunakan kedua-duanya untuk membantu pengguna dalam mengurus, mengemas kini dan menyimpan data untuk pengguna. Berikut ialah beberapa perbezaan utama antara fail XLSX dan CSV yang perlu anda ketahui:



  • Format CSV menyimpan data jadual ke dalam fail teks pembatas dengan sambungan .csv. Manakala, fail excel atau XLSX ialah hamparan yang menyimpan fail dalam format proprietarinya, iaitu. xls atau XLSX.
  • Fail Excel ialah fail binari yang mengandungi data pada setiap lembaran kerja dalam buku kerja. Manakala, CSV ialah format teks biasa dan ringkas dengan jujukan nilai data yang dipisahkan dengan koma.
  • Operasi data tidak boleh dijalankan pada fail CSV. Walau bagaimanapun, ia boleh dijalankan pada fail Excel.
  • Fail CSV lebih pantas dan menggunakan kurang memori daripada fail XLSX. Walau bagaimanapun, Excel menggunakan lebih banyak memori apabila mengimport data.
  • Jika kita membandingkan CSV dengan Excel, kita boleh membuka fail CSV dalam mana-mana editor teks Windows manakala fail Excel tidak boleh.

Bagaimanakah Fail XLSX Boleh Ditukar kepada CSV Menggunakan Python?

Fail XLSX boleh diubah menjadi fail CSV dalam Python menggunakan pelbagai kaedah. Python termasuk pelbagai modul dan fungsi yang boleh membantu kami menyelesaikan tugas ini. Di sini, kami akan melalui beberapa kaedah yang boleh digunakan untuk menukar fail XLSX kepada fail CSV dalam Python.



Prasyarat untuk Melaksanakan Penukaran Excel kepada CSV

Memasang keperluan adalah langkah pertama. Kami menggunakan modul seperti menggabungkan Pandas, CSV, dan Openpyxl, dsb. dalam tutorial ini. Pakej Pandas Python membenarkan manipulasi dan analisis data. Pandas ialah perpustakaan yang terkenal di kalangan pengaturcara Python. Fail Excel boleh dibaca dan ditulis menggunakan pakej Python yang dikenali sebagai Openpyxl. Kami tidak akan berurusan dengan perpustakaan ini secara langsung. Panda sebaliknya menggunakan Openpyxl secara dalaman.





Menggunakan repositori PyPI, kami boleh memasang kedua-dua pakej:

Kaedah 1: Menukar XLSX kepada CSV Menggunakan Modul Pandas

Contoh 1: Menukar Satu Fail XLSX kepada CSV



Pandas ialah modul sumber terbuka yang dicipta untuk bahasa pengaturcaraan Python untuk memanipulasi dan menganalisis data. Untuk bekerja dengan siri masa dan jadual berangka, Pandas menyediakan pelbagai fungsi dan ciri. Menggunakan panda, kedua-dua set data kecil dan besar boleh dibaca, ditapis dan disusun semula. Dan hasilnya boleh dihasilkan dalam pelbagai format seperti Excel, JSON dan CSV. Kami menggunakan kaedah read_excel() Pandas untuk membaca fail excel, dan kaedah to_csv() untuk mengubah DataFrame menjadi fail CSV.

Kami mencetak fail .csv kami sebagai DataFrame seperti yang boleh dilihat dalam output. Skrip sebelumnya menukar fail XLSX kami kepada CSV dan mencipta fail 'salary.csv' dalam direktori semasa.

Contoh 2: Menukar Fail XLSX (dengan Helaian Berbilang) kepada CSV

Dalam contoh yang berikut, kami mula-mula membaca nama helaian fail Excel. Nama helaian individu kemudian digelung dan disimpan sebagai fail CSV yang berbeza. Skrip menyimpan CSV di lokasi yang sama.

Kami menggunakan sampel fail XLSX yang mempunyai dua atau lebih lembaran kerja atau hamparan.

Seperti yang dapat dilihat, fail XLSX kami terdiri daripada dua helaian (sheet1 dan sheet2). Sekarang, kami menulis kod untuk menukar fail XLSX ini kepada CSV.

Pengeluaran:

Skrip berjaya menukar fail XLSX dengan dua helaian menjadi satu fail CSV dengan satu helaian.

Contoh 3: Menukar Berbilang Fail XLSX kepada Fail CSV Berasingan

Pertimbangkan senario di mana anda perlu menukar beberapa fail Excel dalam direktori kerja anda kepada CSV. Anda boleh menggunakan kaedah ini. Kita mulakan dengan mengandaikan bahawa setiap fail hanya mengandungi satu helaian. Kemudian, kami melanjutkan kaedah kami untuk mengendalikan berbilang fail dan beberapa helaian. Kod Python yang berikut menggunakan modul standard glob. Kami memadankan laluan fail menggunakan corak dengan Glob. Ia sepadan dengan semua fail dengan sambungan .xlsx dalam direktori kerja. Selepas itu, kami membangunkan fungsi yang membaca fail Excel dan menyimpannya sebagai fail CSV. Kami memanggil fungsi ini pada setiap laluan fail yang ditemui.

Skrip sebelumnya ini menukar semua fail xlsx dalam direktori semasa kepada fail CSV.

Kini, kami menukar fail XLSX dengan berbilang hamparan kepada CSV. Ini kemungkinan besar bahagian yang sukar. Tiga fail Excel berada dalam direktori kerja kami. Selain itu, sebahagian daripadanya terdiri daripada lebih daripada satu helaian. Kami berhasrat untuk:

  1. Buat direktori untuk setiap fail hamparan,
  2. Tukar helaian fail excel kepada CSV dan ia harus disimpan dalam direktori yang baru dibuat.

Skrip menukar XLSX dengan helaian tunggal dan berbilang ke dalam fail CSV berasingan dan menyimpannya dalam direktori baharu dengan nama yang sama.

Untuk mendapatkan semula setiap fail Excel yang terdapat dalam direktori semasa, fungsi glob digunakan. Selepas itu, folder dicipta untuk setiap fail XLSX menggunakan fungsi os.mkdir. Fail CSV kemudian dibuat untuk setiap helaian di dalam direktori baharu dengan menggelungkan nama helaian.

Kaedah 2: Menukar XLSX kepada CSV Menggunakan Modul Openpyxl dan CSV

Dalam kaedah ini, kami akan menggunakan modul openpyxl dan CSV untuk menukar fail XLSX kepada CSV. Untuk membaca dan menulis fail xlsx, xlsm, xltx dan xltm 2010, modul Python openpyxl boleh digunakan. Modul CSV termasuk kelas yang membolehkan pembacaan dan penulisan data jadual berformat CSV.

Untuk membaca atau memuatkan fail xlsx kami, kami menggunakan fungsi load_workbook() modul openpyxl. Anda boleh menggunakan fungsi ini jika anda perlu menulis atau membaca fail XLSX/Excel sedia ada dalam Python. Selepas pengaktifan excel, kami menggunakan fungsi csv.writer() untuk mencipta fail CSV kami. Kemudian, gelung untuk digunakan untuk menyimpan data dalam sel data fail CSV. Kami menukar fail example.xlsx kami kepada myfile.csv seperti yang dilihat dalam imej berikut:

Kesimpulan

Dalam tutorial ini, kami memberi anda pengenalan ringkas kepada fail XLSX dan fail CSV. Kami menerangkan perbezaan utama antara kedua-dua format fail. Kami membincangkan dua kaedah dengan berbilang contoh untuk mengajar cara fail XLSX dengan helaian tunggal atau berbilang boleh ditukar kepada fail CSV. Kami melaksanakan contoh untuk menukar berbilang fail XLSX kepada fail CSV secara serentak. Ia boleh menjadi mudah atau sukar untuk menukar data daripada Excel kepada CSV. Jika anda hanya mempunyai satu fail dengan sebilangan kecil helaian, ia mudah. Tetapi jika tidak, ia boleh menjadi sukar.