Bagaimana Anda menjatuhkan nilai dalam kolom dengan python?

Deepanshu mendirikan ListenData dengan tujuan sederhana - Membuat analitik mudah dipahami dan diikuti. Dia memiliki lebih dari 10 tahun pengalaman dalam ilmu data. Selama masa jabatannya, dia telah bekerja dengan klien global di berbagai domain seperti Perbankan, Asuransi, Ekuitas Swasta, Telekomunikasi dan Sumber Daya Manusia

Bingkai data Pandas adalah struktur data dua dimensi yang memungkinkan Anda menyimpan data dalam baris dan kolom. Ini sangat berguna saat Anda menganalisis data

Saat Anda memiliki daftar catatan data dalam kerangka data, Anda mungkin perlu membuang daftar baris tertentu tergantung pada kebutuhan model dan tujuan Anda saat mempelajari analitik Anda

Dalam tutorial ini, Anda akan mempelajari cara menghapus daftar baris dari kerangka data Pandas

Untuk mempelajari cara menjatuhkan kolom, Anda dapat membaca di sini tentang Cara Menjatuhkan Kolom di Pandas

Cara Menjatuhkan Baris atau Kolom dalam Bingkai Data Pandas

Untuk menghapus baris atau kolom dalam bingkai data, Anda perlu menggunakan metode drop() yang tersedia di bingkai data. Anda dapat membaca lebih lanjut tentang metode drop()_ di dokumen di sini

Sumbu Bingkai Data

  • Baris dilambangkan menggunakan axis=0
  • Kolom dilambangkan menggunakan axis=1

Label Bingkai Data

  • Baris diberi label menggunakan nomor indeks yang dimulai dengan 0, secara default
  • Kolom diberi label menggunakan nama

Drop() Metode Parameter

  • index - daftar baris yang akan dihapus
  • axis=0 - Menandai baris dalam kerangka data yang akan dihapus
  • df.drop([5,6], axis=0, inplace=True)
    
    df
    
    1 - Melakukan operasi drop dalam kerangka data yang sama, daripada membuat objek kerangka data baru selama operasi penghapusan

Contoh DataFrame Pandas

Kerangka data sampel kami berisi kolom product_name, Unit_Price, No_Of_Units, Available_Quantity, dan kolom Available_Since_Date. Itu juga memiliki baris dengan nilai NaN yang digunakan untuk menunjukkan nilai yang hilang

import pandas as pd

data = {"product_name":["Keyboard","Mouse", "Monitor", "CPU","CPU", "Speakers",pd.NaT],
        "Unit_Price":[500,200, 5000.235, 10000.550, 10000.550, 250.50,None],
        "No_Of_Units":[5,5, 10, 20, 20, 8,pd.NaT],
        "Available_Quantity":[5,6,10,"Not Available","Not Available", pd.NaT,pd.NaT],
        "Available_Since_Date":['11/5/2021', '4/23/2021', '08/21/2021','09/18/2021','09/18/2021','01/05/2021',pd.NaT]
       }

df = pd.DataFrame(data)

df
_

Kerangka data akan terlihat seperti ini

product_nameUnit_PriceNo_Of_UnitsAvailable_QuantityAvailable_Since_Date0Keyboard500. 0005511/5/20211Mouse200. 000564/23/20212Monitor5000. 235101008/21/20213CPU10000. 55020Tidak Tersedia09/18/20214CPU10000. 55020Tidak Tersedia18/09/20215Speaker250. 5008NaT01/05/20216NaTNaNNaTNaTNaT

Dan seperti itu kami telah membuat kerangka data sampel kami

Setelah setiap operasi pelepasan, Anda akan mencetak kerangka data dengan menggunakan

df.drop([5,6], axis=0, inplace=True)

df
2 yang akan mencetak kerangka data dalam format tabel
df.drop([5,6], axis=0, inplace=True)

df
3 biasa

Anda dapat membaca di sini tentang cara Pretty Print a Dataframe untuk mencetak dataframe dalam berbagai format visual

Selanjutnya, Anda akan mempelajari cara menghapus daftar baris dalam kasus penggunaan yang berbeda

Cara Menjatuhkan Daftar Baris berdasarkan Indeks di Pandas

Anda dapat menghapus daftar baris dari Panda dengan meneruskan daftar indeks ke metode drop()

df.drop([5,6], axis=0, inplace=True)

df

Dalam kode ini,

  • df.drop([5,6], axis=0, inplace=True)
    
    df
    
    5 adalah indeks baris yang ingin Anda hapus
  • axis=0 menunjukkan bahwa baris harus dihapus dari kerangka data
  • df.drop([5,6], axis=0, inplace=True)
    
    df
    
    1 melakukan operasi drop dalam kerangka data yang sama

Setelah menjatuhkan baris dengan indeks 5 dan 6, Anda akan memiliki data di bawah ini dalam kerangka data

product_nameUnit_PriceNo_Of_UnitsAvailable_QuantityAvailable_Since_Date0Keyboard500. 0005511/5/20211Mouse200. 000564/23/20212Monitor5000. 235101008/21/20213CPU10000. 55020Tidak Tersedia09/18/20214CPU10000. 55020Tidak Tersedia09/18/2021

Ini adalah bagaimana Anda dapat menghapus baris dengan indeks tertentu

Selanjutnya, Anda akan belajar tentang menjatuhkan kisaran indeks

Cara Menjatuhkan Baris berdasarkan Rentang Indeks di Pandas

Anda juga dapat menjatuhkan daftar baris dalam rentang tertentu

Rentang adalah kumpulan nilai dengan batas bawah dan batas atas

Ini mungkin berguna jika Anda ingin membuat kumpulan data sampel yang mengecualikan rentang data tertentu

Anda dapat membuat rentang baris dalam kerangka data dengan menggunakan metode

df.drop([5,6], axis=0, inplace=True)

df
8. Kemudian Anda dapat meneruskan rentang ini ke metode drop() untuk menghapus baris seperti yang ditunjukkan di bawah ini

df.drop(df.index[2:4], inplace=True)

df
_

Inilah yang dilakukan kode ini

  • df.drop(df.index[2:4], inplace=True)
    
    df
    
    0 menghasilkan rentang baris dari 2 hingga 4. Batas bawah rentang bersifat inklusif dan batas atas rentang bersifat eksklusif. Artinya baris 2 dan 3 akan dihapus dan baris 4 tidak akan dihapus
  • df.drop([5,6], axis=0, inplace=True)
    
    df
    
    1 melakukan operasi drop dalam kerangka data yang sama

Setelah menjatuhkan baris dalam rentang 2-4, Anda akan memiliki data di bawah ini dalam kerangka data

product_nameUnit_PriceNo_Of_UnitsAvailable_QuantityAvailable_Since_Date0Keyboard500. 005511/5/20211Mouse200. 00564/23/20214CPU10000. 5520Tidak Tersedia09/18/2021

Ini adalah bagaimana Anda dapat menghapus daftar baris dalam bingkai data menggunakan jangkauannya

Cara Menjatuhkan Semua Baris setelah Indeks di Pandas

Anda dapat menghapus semua baris setelah indeks tertentu dengan menggunakan

df.drop(df.index[2:4], inplace=True)

df
2

Anda dapat menggunakan

df.drop(df.index[2:4], inplace=True)

df
_2 untuk memilih baris dengan menggunakan indeks posisinya. Anda dapat menentukan posisi awal dan akhir yang dipisahkan oleh
df.drop(df.index[2:4], inplace=True)

df
4. Misalnya, Anda akan menggunakan
df.drop(df.index[2:4], inplace=True)

df
_5 untuk memilih baris dari 2 hingga 3. Jika Anda ingin memilih semua baris, Anda bisa menggunakan
df.drop(df.index[2:4], inplace=True)

df
4 di
df.drop(df.index[2:4], inplace=True)

df
2

Ini mungkin berguna jika Anda ingin membagi kumpulan data untuk tujuan pelatihan dan pengujian

Gunakan cuplikan di bawah ini untuk memilih baris dari 0 hingga indeks 2. Ini menghasilkan penurunan baris setelah indeks 2

df = df.iloc[:2]

df

Dalam kode ini,

df.drop(df.index[2:4], inplace=True)

df
_8 memilih baris hingga indeks 2

Ini adalah bagaimana Anda dapat menghapus semua baris setelah indeks tertentu

Setelah menjatuhkan baris setelah indeks 2, Anda akan memiliki data di bawah ini dalam kerangka data

product_nameUnit_PriceNo_Of_UnitsAvailable_QuantityAvailable_Since_Date0Keyboard500. 05511/5/20211Mouse200. 0564/23/2021

Ini adalah bagaimana Anda dapat menghapus baris setelah indeks tertentu

Selanjutnya, Anda akan mempelajari cara menghapus baris dengan kondisi

Cara Menjatuhkan Baris dengan Berbagai Kondisi di Pandas

Anda dapat menghapus baris dalam bingkai data berdasarkan kondisi tertentu

Misalnya, Anda dapat membuang baris yang nilai kolomnya lebih besar dari X dan lebih kecil dari Y

Ini mungkin berguna jika Anda ingin membuat kumpulan data yang mengabaikan kolom dengan nilai tertentu

Untuk menghapus baris berdasarkan kondisi tertentu, pilih indeks baris yang melewati kondisi tertentu dan teruskan indeks tersebut ke metode drop()

df.drop(df[(df['Unit_Price'] >400) & (df['Unit_Price'] < 600)].index, inplace=True)

df

Dalam kode ini,

  • df = df.iloc[:2]
    
    df
    
    0 adalah kondisi untuk menghapus baris
  • df = df.iloc[:2]
    
    df
    
    1 memilih indeks baris yang melewati kondisi tersebut
  • df.drop([5,6], axis=0, inplace=True)
    
    df
    
    1 melakukan operasi drop dalam kerangka data yang sama daripada membuat yang baru

Setelah menjatuhkan baris dengan kondisi yang memiliki

df = df.iloc[:2]

df
3 lebih besar dari 400 dan kurang dari 600, Anda akan memiliki data di bawah ini dalam kerangka data

product_nameUnit_PriceNo_Of_UnitsAvailable_QuantityAvailable_Since_Date1Mouse200. 0564/23/2021

Ini adalah bagaimana Anda dapat menghapus baris dalam kerangka data menggunakan kondisi tertentu

Kesimpulan

Sebagai rangkuman, dalam artikel ini Anda telah mempelajari apa itu metode drop() dalam kerangka data Pandas. Anda juga telah melihat bagaimana baris dan kolom bingkai data diberi label. Dan terakhir, Anda telah mempelajari cara menghapus baris menggunakan indeks, kisaran indeks, dan berdasarkan kondisi

Jika Anda menyukai artikel ini, jangan ragu untuk membagikannya

Anda Mungkin Juga Menyukai

  • Cara Menambahkan Kolom ke Bingkai Data di Pandas
  • Cara Mengganti Nama Kolom di Pandas

IKLAN

IKLAN

IKLAN

IKLAN

IKLAN

IKLAN

IKLAN

IKLAN


Bagaimana Anda menjatuhkan nilai dalam kolom dengan python?
Vikram Aruchamy

Arsitek Solusi AWS dan penulis Teknis Purna Waktu di stackvidhya. com dan jsowl. com


Jika Anda membaca sejauh ini, tweet ke penulis untuk menunjukkan bahwa Anda peduli. Tweet terima kasih

Belajar kode secara gratis. Kurikulum open source freeCodeCamp telah membantu lebih dari 40.000 orang mendapatkan pekerjaan sebagai pengembang. Memulai

Bagaimana Anda menjatuhkan nilai tertentu di kolom dengan Python?

Gunakan metode drop() untuk menghapus baris berdasarkan nilai kolom di panda DataFrame, sebagai bagian dari pembersihan data, Anda akan diminta untuk menghapus baris dari DataFrame saat kolom .

Bagaimana cara menjatuhkan baris yang berisi nilai tertentu di panda?

Sekarang, untuk menghapus baris dengan string tertentu, kita dapat menggunakan fungsi contains() dari perpustakaan panda. .
Sintaksis. seri. str. berisi(string, case=Benar, bendera=0, na=Tidak ada, regex=Benar).
Sintaksis. .
sintaksis. df[df[“nama_kolom”]. str. berisi(“string”)==Salah]

Bagaimana cara menghapus nilai string dari kolom di panda?

Untuk menghapus karakter dari kolom di Pandas DataFrame, gunakan metode replace(~). .
Bingkai Data({"A". ["a","ab","cc"]}) df. A. 0 sebuah. 1 ab. 2 cc. .
df["A"]. str. ganti("a","") 1 b. 2 cc. Nama. A, tipe d. obyek. .
df["A"]. str. ganti("[ab]","") 2 cc. Nama. A, tipe d. obyek. Di sini, [ab] adalah regex dan cocok dengan karakter apa pun yang merupakan a atau b