Lajur Jumlah Panda

Lajur Jumlah Panda



'Artikel ini akan menunjukkan cara menjumlahkan semua atau lajur tertentu dalam Pandas DataFrame menggunakan Python. Fungsi DataFrame.sum() akan digunakan bersama-sama dengan beberapa parameter berguna dalam banyak contoh tutorial ini.”

Apabila tutorial ini tamat, anda mungkin tahu cara untuk:







    • Cari jumlah lajur bingkai data dalam Panda.
    • Menambah lajur bingkai data bersama-sama
    • Tambahkan Lajur pada Bingkai Data Pandas yang memenuhi Syarat yang ditentukan.
    • Tentukan jumlah selepas mengumpulkan data rangka data.

Bagaimana untuk Menentukan Jumlah Lajur Bingkai Data?

Fungsi 'dataframe.sum()' dalam Pandas mengembalikan jumlah keseluruhan untuk paksi yang ditentukan. Jika input ialah paksi indeks, fungsi menambah nilai setiap lajur secara individu, kemudian melakukan perkara yang sama untuk setiap lajur, mengembalikan siri yang menyimpan jumlah data/nilai dalam setiap lajur. Selain itu, ia menyokong pengiraan jumlah bingkai data dengan mengabaikan nilai yang hilang.



Sintaks: DataFrame.sum(axis = Tiada, skipna = Tiada, tahap = Tiada, numeric_only = Tiada, min_count = 0, **kwargs)



di mana,





paksi: {lajur (1), indeks (0)}

pesanan: Abaikan nilai NA/null apabila mengira hasilnya.



peringkat: Jika paksi yang ditentukan adalah hierarki (berbilang indeks), kira pada tahap indeks tertentu sebelum menukar kepada Siri.

numeric_only: Hanya float, int dan lajur boolean boleh diterima. Jika Tiada, cuba gunakan segala-galanya; jika tidak, hanya data berangka. Untuk Siri, tidak dilaksanakan.

kiraan_min: Bilangan nilai yang mungkin diperlukan untuk menyelesaikan operasi. Hasilnya akan menjadi NA jika terdapat lebih sedikit nilai bukan NA daripada min_count.

Pulangan: DataFrame (jika tahap dinyatakan) atau Siri.

Contoh # 01: Tentukan Jumlah Lajur Bingkai Data dan Semua Lajur

Kami telah memerlukan kerangka data terlebih dahulu dengan jenis data yang sah, iaitu, int, apungan, dsb., lajur atau lajur yang mana kami boleh mencari jumlah data. Kerangka data akan dibuat dengan menggunakan fungsi pd.DataFrame().


Kami telah mencipta kerangka data yang diperlukan daripada kamus python di dalam fungsi pd.DataFrame(). Dalam bingkai data yang dibuat di atas, terdapat empat lajur 'Nama', 'hari1', 'hari2', dan 'hari3'. Daripada empat lajur, tiga lajur iaitu 'hari1', 'hari2', dan 'hari3' ialah lajur berangka dengan nilai data (4, 4, 3, 2, 4, 6, 5, 3), (2, 4, 5, 2, 3, 4, 6, 2), dan (7, 4, 3, 5, 6, 2, 1, 4) masing-masing. Kami hanya boleh mencari jumlah untuk tiga lajur ini. Jumlah untuk kedua-dua siri (iaitu, lajur) dan keseluruhan kerangka data boleh ditentukan menggunakan kaedah sum(). Mari mulakan dengan mengajar cara menjumlahkan semua data dalam lajur Pandas.


Untuk menentukan jumlah, kami menggunakan kaedah sum() pada lajur 'hari2'. Fungsi ini telah mengembalikan nilai jumlah 28. Sama seperti ini, kami boleh menentukan jumlah setiap lajur Bingkai Data. Hanya menggunakan kaedah sum() merentas keseluruhan kerangka data akan mencapai ini.


Seperti yang dapat dilihat, jumlah lajur 'hari1' ialah 31; untuk 'hari2', nilai jumlah ialah 28, manakala, untuk lajur 'hari3', nilai jumlah ialah 32.

Contoh # 02: Menggunakan Fungsi sum() untuk Menjumlahkan Nilai Lajur Bingkai Data Bersama

Seperti yang anda lihat daripada output contoh sebelumnya, fungsi itu tidak mengembalikan data lajur bingkai data sebenar yang membentuk jumlahnya. Walau bagaimanapun, dengan memberikan kaedah 'DataFrame.sum()'  kepada lajur DataFrame, anda boleh mengakses setiap lajur dalam DataFrame, termasuk lajur jumlah. Pertama, kami mencipta satu lagi kerangka data untuk contoh ini.


Menggunakan pd.DataFrame() bingkai data kami telah dibuat. Kami telah mencipta bingkai data dengan tiga lajur: item, harga dan cukai. Item lajur yang mengandungi nilai rentetan (“pen”, “penanda”, “pembaris”, “pemadam”, “pensel”, “papan klip”, “stapler”, “pin”), harga lajur yang menyimpan nilai (20, 15, 10, 3, 5, 30, 35, 10), dan lajur 'cukai' terdiri daripada nilai (8, 5, 3, 3, 4, 10, 5, 2). Sekarang mari kita tambah nilai lajur harga dan cukai dan simpan hasilnya dalam lajur baharu dengan mengekalkan lajur kerangka data asal.


Memandangkan ia boleh diperhatikan bersama-sama dengan lajur baharu 'jumlah', lajur asal kerangka data yang diberikan juga dikembalikan oleh fungsi tersebut. Lajur 'jumlah' menyimpan jumlah nilai lajur 'harga' dan 'cukai' terhadap setiap data 'item'.

Contoh # 03: Menggunakan Fungsi sum() untuk Menentukan Jumlah Lajur Bingkai Data Ditentukan

Untuk menjumlahkan berbilang lajur bingkai data bersama-sama, kita boleh menentukan senarai dengan label lajur dan kemudian menggunakan kaedah jumlah() pada senarai untuk mencari jumlah. Seperti contoh sebelumnya, kami akan membuat kerangka data terlebih dahulu.


Kami telah mencipta kerangka data kami dengan empat lajur 'pelajar', 'markah1', 'markah2', dan 'markah3'. Lajur “pelajar” menyimpan data (“Larry”, “James”, “Rob”, “Arya”, “Max”, “Ben”, “Gwen”, “Bill”), dan lajur “marks1” yang menyimpan nilai (8, 9, 6, 8, 10, 7, 9, 9), manakala lajur 'marks2' dan 'marks3' menyimpan nilai berangka (6, 6, 8, 6, 7, 9, 10, 9 ) dan (7, 6, 9, 7, 8, 7, 10, 10) masing-masing.


Pertama, kami telah mencipta objek senarai dengan label lajur 'pelajar', 'markah1', dan 'markah3'. Kemudian kaedah sum() digunakan pada senarai. Fungsi ini telah merumuskan nilai lajur markah1 dan markah3 hanya kerana lajur 'pelajar' bukan angka, jadi fungsi sum() tidak dapat mencari jumlah nilai lajur 'pelajar'. Kami telah menyimpan jumlah nilai lajur 'marks1' dan 'marks3' dalam lajur 'sum'.

Contoh # 04: Tambah Lajur Bingkai Data Pandas Yang Memenuhi Syarat Tertentu

Dalam contoh ini, kami akan menambah nilai lajur yang ditentukan jika ia memenuhi syarat yang ditentukan.


Terdapat 5 lajur dalam bingkai data yang baru dibuat, iaitu, 'syarikat', 'jualan_minggu1', 'jualan_minggu2', 'jualan_minggu3' dan 'cawangan'. Sekarang, katakan kita tidak mahu menambah nilai lajur terakhir apabila kita menambah atau mencari jumlah nilai baris bingkai data yang diberikan. Katakan kami hanya mahu menambah nilai lajur dengan perkataan 'minggu' dalam labelnya. Pemahaman senarai boleh dibuat untuk menentukan sama ada perkataan 'minggu' terdapat dalam label lajur atau tidak.


Kini kami telah mengambil lajur yang mempunyai perkataan 'minggu' dalam labelnya. Kita boleh meringkaskan lajur yang mengandungi perkataan 'minggu' menggunakan argumen axis=1 dalam fungsi sum().


Dengan cara ini, kami boleh meringkaskan data dengan selamat merentas lajur mengikut baris tanpa memasukkan sebarang lajur yang kami tidak mahu.

Contoh # 5: Tentukan Jumlah Selepas Mengumpul Data Bingkai Data

Kami juga boleh mencari jumlah lajur bingkai data selepas mengumpulkan data satu atau lebih lajur. Kaedah groupby() akan digunakan untuk mengumpulkan data ke dalam kategori di dalam lajur. Mari buat bingkai data supaya kita boleh mengumpulkan data salah satu lajurnya.


Sekarang kami akan mengumpulkan data dalam lajur 'umur' dan menjumlahkan nilai lajur 'skor1' dan 'skor2' untuk setiap kategori kumpulan.


Kita dapat melihat bahawa merumuskan data dalam bingkai data selepas pertama kali mengumpulkan nilai data mengikut umur menghasilkan jumlah mengikut lajur bergantung pada kumpulan umur.

Kesimpulan

Dalam tutorial ini, kami cuba mengajar anda cara mengira jumlah merentas bingkai data menggunakan kaedah jumlah Pandas. Kami telah membincangkan penambahan nilai baris dan lajur dalam contoh siaran ini. Selain itu, anda mempelajari cara menambah lajur secara bersyarat dan cara menjumlahkan nilai selepas mengumpulkan lajur bingkai data. Kini anda mungkin boleh menjumlahkan lajur bingkai data bersama-sama atau menjumlahkan nilai dalam lajur bingkai data sendiri.