Pandas Reindex

Pandas Reindex



'Dalam 'pandas,' kita boleh menyimpan banyak maklumat dalam bentuk jadual, yang juga dikenali sebagai DataFrame. 'Panda' memudahkan kami dengan kaedah 'DataFrame()' untuk membina DataFrame. DataFrame mengandungi indeks, dan kami juga boleh menukar indeks DataFrame dengan menggunakan fungsi 'pandas'. Kaedah yang kami gunakan untuk mengindeks semula DataFrame ialah kaedah 'reindex()'. Kaedah ini membantu dalam menukar nilai indeks baris serta nilai indeks lajur. Dengan menggunakan kaedah ini, kami boleh menukar indeks lalai DataFrame, dan juga, kami boleh menukar indeks yang kami tetapkan semasa mencipta DataFrame. Kami akan menggunakan kaedah 'reindex()' dalam contoh 'pandas' kami dalam tutorial ini dan akan menerangkan konsep ini secara mendalam di sini.'

Contoh # 01

Alat 'Spyder' membantu kami dalam membangunkan kod 'pandas' di sini dalam tutorial ini, dan kami memulakan kod kami dengan kata kunci 'import,' yang akan membantu dalam mengimport fungsi 'pandas'. Kami meletakkan 'pandas sebagai pd' selepas menaip 'import'. Selepas ini, kami mencipta DataFrame dengan menaip 'pd.DataFrame()'. Kami menulis 'pd' ini di sini kerana 'DataFrame()' ialah kaedah 'pandas'. 'value_df' ialah nama pembolehubah yang mana DataFrame disimpan. Kami menambah 'RandomName', iaitu nama lajur dan 'RandomName' mengandungi 'Thomas, Oscar, Lilly, Rowan, John, Bromley, Peter, Alexander dan Samuel'.







Kemudian, kami mempunyai 'Nilai_1,' di mana kami telah memasukkan '16, 29, 24, 35, 44, 50, 69, 74, dan 88'. Kemudian datang 'Nilai_2,' dan kami telah menambah '25, 38, 42, 56, 54, 65, 78, 89, dan 99'. Sekarang, 'Nilai_3' datang seterusnya, dan kami meletakkan '36, 48, 52, 69, 74, 75, 87, 91 dan 69' di dalamnya. Lajur 'Nilai_4' hadir selepas ini, di mana kami telah memasukkan '52, 64, 72, 88, 82, 95, 97, 21, dan 39'. Lajur terakhir ialah lajur 'Nilai_5' di sini dan dalam lajur ini, nilai yang telah kami tambahkan ialah '66, 78, 82, 99, 34, 45, 57, 61 dan 89'. Selepas ini, kami menggunakan fungsi 'print()' di mana 'Values_df' ditambah begitu. Ia akan mencetak pada terminal.




Selepas menekan “Shift+Enter”, kami boleh mendapatkan hasil kod kami dengan mudah dalam apl “Spyder”. Di sini, kod ini mengembalikan DataFrame dengan indeks lalai. Sekarang, kami akan menggunakan kaedah 'reindex()' untuk mengindeks semula DataFrame ini dalam 'pandas'.




Fungsi 'reindex()' digunakan di sini untuk mengindeks semula nilai indeks baris. Dalam DataFrame di atas, anda boleh melihat bahawa nilai indeks lalai baris dipaparkan, dan kini, kami menggunakan kaedah 'indeks semula()' untuk mengindeks semula indeks baris tersebut. Kami meletakkan nama DataFrame dan kemudian kaedah 'reindex()' di mana kami meletakkan nilai indeks yang ingin kami tambahkan pada DataFrame di atas. Kami meletakkan 'ind_A, ind_B, ind_C, ind_D, ind_E, ind_F, ind_G, ind_H dan ind_I' dalam fungsi 'reindex()'. Jadi, indeks baris ini akan dikemas kini pada DataFrame apabila kami melaksanakan kod ini.






Nilai indeks baris dipaparkan dalam hasil ini dan anda boleh ambil perhatian bahawa nilai DataFrame tidak dipaparkan di sini dan nilai 'NaN' telah muncul. Ini kerana nilai indeks baharu tidak sepadan dengan nilai indeks sebelumnya bagi DataFrame. Apabila indeks baharu dan indeks lama tidak sepadan, maka ia memaparkan 'Nan' di sana. Nilai 'NaN' ini muncul secara lalai apabila kami menukar indeks dan ia tidak sepadan dengan indeks sebelumnya.



Contoh # 02

Kami kini menukar nilai indeks lajur 'Value_df', yang telah kami buat sebelum ini dalam contoh 1. Selepas mencetak 'Value_df', kami meletakkan pembolehubah 'lajur' dan menambah beberapa nilai padanya. Kami menambah 'a_1, b_1, c_1, d_1 dan e_1'. Sekarang, kami ingin melaraskan nilai ini sebagai indeks lajur, jadi, untuk ini, kami menggunakan kaedah 'indeks semula ()' dan letakkan nama 'lajur' pembolehubah di mana nilai indeks lajur baharu disimpan dan juga tetapkan 'paksi' kepada 'lajur' jadi, ia akan mengemas kini indeks paksi lajur. Kami meletakkan kaedah 'reindex()' dalam 'print()', jadi ia juga akan dipaparkan pada terminal.


Memandangkan kami telah menggunakan kaedah 'reindex()', nilai indeks lajur yang terdapat dalam DataFrame pertama dikemas kini dan nilai baharu ditambah dalam DataFrame yang dikemas kini. Anda juga boleh ambil perhatian bahawa semua nilai DataFrame ditukar kepada 'NaN' kerana kedua-dua nilai indeks lajur adalah berbeza.

Contoh # 03

“Programming_data” dalam kod ini mengandungi “P_Languages,” yang mana kami telah menambahkan “JavaScript, CSS, Kejuruteraan Web, OOP, C#, AI, Java dan JavaScript”. Kemudian, kita mempunyai 'Jam' di mana kita meletakkan '4_hrs, 2_hrs, 3_hrs, 7_hrs, 6_hrs, 5_hrs, 8_hrs dan 6_hrs'. Selepas ini, 'P_Code' dimasukkan, dan kami memasukkan '11523, 12423, 12321, 11456, 11454, 12267, 13106, dan 14123'. Kami menambah pembolehubah 'p_index' dan meletakkan 'Pro_A, Pro_B, Pro_C, Pro_D, Pro_E, Pro_F, Pro_G dan Pro_H'.

Nilai ini akan digunakan sebagai nilai indeks baris. Kami menukar 'Programming_data' dalam 'Programming_df' DataFrame. Kami juga menambah 'p_index' pada DataFrame ini dengan menggunakan kaedah 'index'. Kami meletakkan 'Programming_df' dan kemudian kaedah 'index' dan menetapkan 'p_index' untuk ini. Kini, nilai indeks di atas ditambah sebagai nilai indeks baris pada DataFrame. Kami mencetak 'Programming_df' juga.

Selepas ini, kami menambah beberapa nilai indeks baharu dalam pembolehubah 'indeks_baru', dan ini ialah 'P_1, P_2, P_3, P_4, P_5, P_6, P_7 dan P_8'. Memandangkan kami ingin mengemas kini nilai indeks baris, kami menggunakan kaedah 'reindex()' dan meletakkan 'new_index' sebagai parameter fungsi ini dan juga menyimpan DataFrame yang dikemas kini dalam 'newProgramming_df' dan meletakkan 'newProgramming_df' dalam ' print()” untuk paparan.


Nilai indeks dikemas kini, dan kami juga boleh mengatakan bahawa kami telah mengindeks semula DataFrame yang telah kami buat. Semua nilai DataFrame juga ditukar kepada 'NaN' kerana kedua-dua nilai indeks adalah berbeza.

Contoh # 04

Kami sedang mengubah nilai indeks lajur 'Programming_df's', yang kami bangunkan sebelum ini dalam contoh 3. Kami meletakkan pembolehubah 'lajur' dan memasukkan nilai baharu ke dalamnya. “P_Code, P_Languages, Hours dan New” ditambahkan pada pembolehubah “lajur”. Kemudian, kami sekali lagi menggunakan kaedah 'reindex()' di mana kami menetapkan pembolehubah 'lajur', yang akan mengemas kini nilai indeks lajur sebelumnya dan menambah nilai indeks lajur baharu ini pada DataFrame.

Di sini, anda boleh ambil perhatian bahawa nilai baharu yang telah kami tambahkan dalam 'lajur' adalah sama seperti yang telah kami tambahkan dalam DataFrame di atas, tetapi urutannya berbeza, jadi ia akan mengubah urutan lajur dan melaraskan semua lajur semasa kami disebut dalam pembolehubah 'lajur'. Selain itu, kami menambah satu lagi nilai indeks yang tidak terdapat dalam DataFrame di atas, iaitu 'Baharu' di sini, jadi nilai 'NaN' akan muncul dalam lajur ini.


Urutan lajur ditukar di sini dan semua nilai kelihatan seperti yang terdapat dalam lajur DataFrame asal dan lajur 'Baharu' dalam DataFrame yang dikemas kini mengandungi semua nilai 'NaN' kerana lajur ini tidak terdapat dalam DataFrame asal.

Kesimpulan

Kami telah membentangkan tutorial ini yang membantu kami memahami pengertian 'pandas reindex' secara terperinci. Kami telah membincangkan cara kami boleh mengindeks semula lajur DataFrame serta nilai indeks baris. Kami telah menjelaskan bahawa fungsi 'reindex()' bagi 'pandas' digunakan untuk melakukan ini. Kami telah melakukan contoh yang berbeza di mana kami telah menukar nilai indeks baris DataFrame dan juga nilai indeks indeks lajur DataFrame. Kami telah memberikan keputusan semua kod yang telah kami lakukan di sini dalam tutorial ini dan juga menerangkannya secara mendalam.