Bingkai Data Pandas Unik

Bingkai Data Pandas Unik



Pustaka Python paling popular yang digunakan dalam sains data dipanggil Pandas. Ia menawarkan pengaturcara Python berprestasi tinggi, mesra pengguna, dan alat analisis data. Sebaik sahaja anda memahami fungsi asas dan cara menggunakannya, Pandas ialah alat yang ampuh untuk mengubah data. Dalam 'pandas' kaedah standard untuk menyimpan data dalam bentuk jadual ialah DataFrames. Kami boleh menggunakan beberapa kaedah 'pandas' untuk mendapatkan nilai unik dalam lajur DataFrame 'pandas'. Apabila kita perlu mendapatkan nilai unik dalam lajur DataFrame dan tidak mahu pertindihan nilai dalam lajur DataFrame 'pandas', kita boleh menggunakan kaedah yang disediakan 'pandas' untuk melakukan ini. Mari lihat kaedah sedemikian dalam panduan ini, bersama beberapa contoh dan output untuk mendapatkan nilai unik dalam lajur DataFrame bagi 'pandas'.

Kaedah untuk Mendapatkan Nilai Unik dalam Lajur DataFrame 'pandas'.

Kami boleh menggunakan dua kaedah untuk mendapatkan nilai unik dalam lajur DataFrame 'pandas'. Kami menggugurkan nilai pendua dan hanya mendapat nilai unik dalam lajur DataFrames. Kaedah yang disediakan oleh 'pandas' untuk melakukan tugas ini ialah:







  • Dengan menggunakan kaedah unique().
  • Dengan menggunakan kaedah drop_dupliactes().

Sekarang, kami akan menggunakan kedua-dua kaedah dalam kod 'pandas' untuk mendapatkan nilai unik dalam lajur DataFrame 'pandas'.



Contoh # 01

Apl 'Spyder' digunakan di sini untuk menjana kod 'pandas' ini untuk menggunakan kaedah tersebut yang membantu kami mendapatkan nilai unik dalam lajur DataFrame 'pandas'. Kami mesti mengimport modul 'pandas', yang diperlukan untuk kod 'pandas', sebelum membuat DataFrame. Dengan menggunakan istilah 'import' dan meletakkan 'pandas sebagai pd', kami mengimport modul ini.



Kini, dengan bantuan 'pd', kita boleh mendapatkan fungsi atau kaedah 'pandas' dengan cepat. Kami kemudian meletakkan 'Subject_data' di mana kami menambah 'Nama' dan dalam 'Nama', kami menambah data nama iaitu 'Roman, William, Peter, Smith, John, Milli, Thomas, dan James'. Kemudian, kami menambah data subjek dalam 'Subj' iaitu 'Matematik, Ekonomi, Sains, Matematik, Statistik, Statistik, Statistik dan Komputer'. Kemudian, kami menukar 'Subject_data' ini kepada 'Subject_df' DataFrame dengan menggunakan kaedah 'pd.DataFrame()'. Kami meletakkan 'Subject_df' dalam kaedah 'print()' supaya ia akan dipaparkan pada terminal.





Sekarang, kami ingin mendapatkan nilai unik dalam lajur DataFrame 'Subj' 'pandas'. Untuk tujuan ini, kami menggunakan kaedah 'unik()' di sini dan kami menambah nama lajur dan juga nama DataFrame seperti yang ditunjukkan di bawah. Kami menambah kaedah ini dalam 'cetak ()' supaya hasilnya juga akan ditunjukkan pada terminal.



Sekarang, kami menekan 'Shift+Enter' untuk mendapatkan hasil kod ini dan ia dipaparkan pada terminal dan juga ditunjukkan di sini, yang mengandungi DataFrame dengan semua nilai. Ini ialah DataFrame asal yang telah kami tambahkan dalam kod dan di bawahnya memaparkan nilai unik lajur 'Subj'. Ia menjatuhkan nilai pendua dan memaparkan nilai unik lajur 'Subj' DataFrame.

Contoh # 02

Kami mencipta 'Sample_list' yang mengandungi beberapa maklumat. Kami memasukkan 'Layla, 21, 28, 31, 14, dan 39' yang akan muncul sebagai lajur pertama apabila kami menukar senarai ini ke DataFrame. Kemudian, kami menambah 'Lusy, 31, 25, 34, 26, dan 21' sebagai baris kedua DataFrame. Selepas ini, kami mempunyai 'Peter, 38, 20, 20, 35, dan 24' dan 'Layla 38, 23, 39 24, 23' yang akan menjadi baris ketiga dan keempat DataFrame. Kami juga memasukkan tiga lagi data iaitu 'Stella, 21, 24, 24, 28, 31', 'Layla, 33, 32, 26, 30, 25' dan juga 'Peter, 21, 21, 31, 21, 29' .

Sekarang, kami menukar 'Sample_list' kepada 'DF_Sample' yang merupakan nama DataFrame di sini dengan meletakkan fungsi 'pd.DataFrame()'. Selain itu, kami menetapkan nama lajur DataFrame ini dan nama ini ialah 'Nama, Ass_1, Ass_2, Ass_3, Ass_4 dan Ass_5'. Kemudian, kami menggunakan 'print()' yang membantu dalam memaparkan DataFrame 'DF_Sample'. Sekarang, kami menggunakan kaedah lain dalam contoh ini untuk mendapatkan nilai unik dalam lajur DataFrame. Kaedah ini ialah kaedah 'drop_duplicates()' bagi 'pandas'.

Dalam kaedah 'drop_duplicates()', kami menetapkan nama lajur yang kami mahu mendapatkan nilai unik dalam lajur DataFrame. Kami mendapat nilai unik lajur 'Nama' dengan menjatuhkan nilai pendua dalam lajur ini dengan bantuan kaedah 'drop_duplicates()' dan juga memberikan nilai unik ini menggunakan fungsi 'print()' di sini.

Nama yang diduakan digugurkan dan nilai unik diberikan selepas menggunakan kaedah 'drop_duplicates()'. Anda boleh ambil perhatian bahawa nama 'Layla' muncul dalam tiga sel lajur 'Nama'. Tetapi apabila kaedah 'drop_duplicates()' digunakan pada lajur ini, semua nilai pendua digugurkan dan satu nama 'Layla' telah muncul pada skrin. Selepas menjatuhkan nilai pendua, DataFrame baharu muncul yang mengandungi nilai unik dalam lajur 'Nama' ini. Dengan cara ini, kita boleh menggugurkan nilai pendua dan mendapatkan nilai unik dalam lajur DataFrame dengan bantuan kaedah 'drop_duplicates()'.

Contoh # 03

DataFrame yang sama digunakan semula dan kini kami menggunakan kaedah 'unik()' di sini. Dengan kaedah 'unik()' kami meletakkan nama lajur serta nama DataFrame yang kami mahu gunakan kaedah 'unik()' ini untuk mendapatkan nilai unik. Ini hanya akan memberikan nilai unik lajur itu dan tidak akan menunjukkan nilai ini dalam bentuk DataFrame.

Di sini, DataFrame mengandungi tujuh nilai dalam lajur 'Nama' tetapi apabila kami menggunakan kaedah 'unik()' pada lajur ini, hanya empat nilai telah muncul dan ini ialah nilai unik lajur itu. Ia tidak memberikan nilai pendua.

Contoh # 04

DataFrame yang kami cipta dalam contoh ini ialah 'F_G_df'. Kami memasukkan 'My_fruits' dan 'my_Vegs' dalam DataFrame ini. Lajur 'My_fruits' mengandungi 'Apple, Orange, Apple, Pear, Lychee, Apple, Apple, Pear dan Apple'. Seterusnya, kami mempunyai 'My_Vegs' yang mengandungi nama-nama sayur-sayuran iaitu 'Cili, Bawa, Lobak Merah, Kentang, Kentang, Lobak Merah, Bawang Besar, Bawang Putih, dan Halia'. DataFrame ini mengandungi hanya dua lajur.

Kini, kami mendapat nilai unik dalam kedua-dua lajur  dengan bantuan kaedah 'unik()'. Kami menyebut nama DataFrame. Kemudian, letakkan nama lajur pertama lajur. Selepas ini, kami menggunakan kaedah append(). Dalam lampiran ini, kami sekali lagi meletakkan nama DataFrame dan nama lajur kedua dan meletakkan kaedah 'unik()'. Ini akan mendapat nilai unik kedua-dua lajur dan kemudian menambahkan nilai unik kedua-dua lajur dan memaparkannya pada skrin.

DataFrame dipaparkan terlebih dahulu yang mengandungi semua nilai. Selepas ini, kaedah 'unik()' digunakan dan nilai unik kedua-dua lajur dipaparkan di bawah. Dalam kod ini, kami mendapat nilai unik dalam berbilang lajur DataFrame dengan menggunakan kaedah 'unik()'.

Kesimpulan

Penjelasan penuh untuk mendapatkan nilai unik dalam lajur DataFrame terdapat dalam panduan ini. Kami telah membincangkan kaedah 'unik()' dan 'drop_duplicates()' yang membantu kami mendapatkan nilai unik lajur DataFrame. Kami telah meneroka cara menggunakan kaedah ini dalam kod 'pandas' dengan menggunakan kaedah ini di sini dalam kod kami. Kami telah menggambarkan contoh yang berbeza dalam panduan ini dan telah menunjukkan kepada anda cara mendapatkan nilai unik bagi satu lajur dengan menggunakan kaedah 'unik()' serta kaedah 'drop_duplicates()'. Kami juga telah meneroka cara mendapatkan nilai unik dalam berbilang lajur dengan menggunakan kaedah 'unik()' dalam panduan ini.