Bagaimana cara menghapus baris yang tidak diinginkan dengan python?

Saat bekerja dengan kumpulan data Python, Insinyur membersihkan kumpulan data sesuai kebutuhan proyek. Fungsi jatuhkan sering digunakan untuk menghapus baris & kolom yang mungkin tidak berguna untuk proyek

Dalam tutorial ini, kita akan belajar tentang drop row python panda. Selain itu, kami akan membahas topik ini

  • Fungsi Jatuhkan Python Panda
  • Python panda menjatuhkan baris berdasarkan indeks
  • Python panda menjatuhkan baris berdasarkan kondisi
  • Python panda menjatuhkan baris dengan nan di kolom tertentu
  • Python panda menjatuhkan baris dengan nan
  • Python panda menjatuhkan baris berdasarkan nilai kolom
  • Python panda menjatuhkan baris yang berisi string

Kumpulan data yang kami gunakan dalam tutorial ini diunduh dari Kaggle

Daftar isi

Fungsi Jatuhkan Python Panda

Pandas drop adalah fungsi dalam panda Python yang digunakan untuk menjatuhkan baris atau kolom dari kumpulan data. Fungsi ini sering digunakan dalam pembersihan data. sumbu = 0 disebut baris dan sumbu = 1 disebut kolom

Sintaksis

Berikut adalah sintaks untuk implementasi pandas drop()

DataFrame.drop(
    labels=None, 
    axis=0, 
    index=None, 
    columns=None, 
    level=None, 
    inplace=False, 
    errors='raise'
)
OpsiPenjelasanlabelLabel tunggal atau seperti daftar
Label Indeks atau Kolom untuk dijatuhkan. sumbujatuhkan akan menghapus sumbu yang disediakan, sumbu bisa 0 atau 1
sumbu = 0 mengacu pada baris atau indeks (vertikal)
sumbu = 1 mengacu pada kolom (horizontal)
secara default, axis = 0indexsingle label atau list-like
indeksnya adalah baris (vertikal) & setara dengan sumbu=0kolomLabel tunggal atau seperti daftar
kolomnya horizontal dalam tampilan tabular & dilambangkan dengan sumbu=1. levelint atau nama level, opsional
Untuk MultiIndex, tingkat asal label akan dihapus. inplaceaccepts bool (Benar atau Salah), standarnya adalah Salah
Inplace membuat perubahan saat itu & di sana. tidak perlu menetapkan variabel. kesalahankesalahan bisa 'diabaikan' atau 'dibesarkan'. standarnya adalah 'dibesarkan'
jika diabaikan, hilangkan kesalahan dan hanya label yang ada yang dihapus
jika dinaikkan maka itu akan menampilkan pesan kesalahan & tidak mengizinkan menjatuhkan data

Baca juga, Cara menggunakan fungsi Pandas drop() di Python

Python panda menjatuhkan baris berdasarkan indeks

  • Pada bagian ini, kita akan mempelajari cara menghapus baris berdasarkan indeks di Python Pandas. Untuk menghapus baris berdasarkan indeks, yang harus kita lakukan adalah meneruskan nomor indeks atau daftar nomor indeks jika terjadi beberapa kali penurunan
  • untuk menjatuhkan baris berdasarkan indeks cukup gunakan kode ini. df.drop(index). Di sini df adalah kerangka data tempat Anda bekerja dan sebagai pengganti indeks, ketikkan nomor atau nama indeks
  • Berikut adalah implementasi kode pada notebook jupyter, harap baca komentar dan penurunan harga untuk penjelasan langkah demi langkah

Baca Cara mengonversi float ke integer di Pandas

Python panda menjatuhkan baris berdasarkan kondisi

Di bagian ini, kita akan mempelajari cara menghapus baris dengan kondisi di Python panda. Jadi mungkin ada sejumlah kondisi yang dapat diterapkan tergantung pada proyeknya

Berikut adalah implementasi dari baris drop dengan kondisi pada notebook jupyter. Baca komentar dan penurunan harga untuk memahami lebih baik

Baca, Cara Menjatuhkan Duplikat menggunakan fungsi drop_duplicates() di Python Pandas

Python panda menjatuhkan baris dengan nan di kolom tertentu

  • Pada bagian ini, kita akan belajar cara menghapus baris dengan nan atau nilai yang hilang di kolom tertentu di Python panda
  • untuk menghapus nilai yang hilang dari dataset, fungsi dropna() digunakan. Tetapi untuk menghapus dari kolom tertentu kita harus memberikan nilai subset di dalam fungsidropna()

Sintaksis

Berikut adalah sintaks untuk menghapus nilai yang hilang atau nan dari kolom tertentu

# remove from single column
df.drop(subset='column_name')

# remove from multiple columns
df.drop(subset=['column1', column2, 'column3']
_

Berikut implementasi pada notebook jupyter. Silakan merujuk ke komentar & penurunan harga untuk penjelasan langkah demi langkah

Python panda menjatuhkan baris dengan nan

  • Pada bagian ini, kita akan mempelajari cara menghapus baris dengan nan. nan adalah singkatan dari 'not a number' dan mengacu pada nilai dataset yang hilang
  • fungsi dropna() digunakan untuk menghapus semua nilai yang hilang dari dataset di Python panda

Berikut adalah implementasi baris drop dengan nan pada notebook jupyter. Silakan baca komentar dan penurunan harga untuk penjelasan langkah demi langkah

Baca perluasan kamus Python

Python panda menjatuhkan baris berdasarkan nilai kolom

Di bagian ini, kita akan mempelajari cara menghapus baris berdasarkan nilai kolom di Python Pandas. Di sini kita dapat memfilter dan menghapus baris yang tidak sesuai dengan kriteria

Berikut adalah implementasi dari baris drop berdasarkan nilai kolom pada notebook jupyter

Python panda menjatuhkan baris yang berisi string

  • Pada bagian ini, kita akan mempelajari cara menghapus baris yang berisi string di Python Pandas. Jadi akan menjatuhkan semua baris kolom yang berisi tipe data sebagai string di dalamnya
  • jadi yang harus kita lakukan di sini adalah memfilter kolom numerik dan menghapus kolom yang tersisa
  • df.select_dtypes(exclude='number') potongan kode ini akan mengembalikan semua kolom yang tidak memiliki int sebagai tipe data di dalamnya. Jika perintah ini diteruskan drop() maka itu akan menghapus semua kolom kecuali yang memiliki angka di dalamnya. Jadi ini adalah bagaimana kita bisa membuang baris string

Berikut adalah implementasi pada jupyter notebook silahkan lihat komentar dan penurunan harga dari penjelasan langkah demi langkah

Anda mungkin juga menyukai tutorial Python Panda berikut

  • Data Hilang di Panda dengan Python
  • Tutorial CSV Python Panda
  • Iterrow DataFrame Pandas
  • Kolom Hapus Panda
  • Tab silang di Python Panda
  • Groupby di Python Panda
  • Cara Mengonversi Pandas DataFrame ke Kamus

Dalam tutorial ini, kita telah belajar tentang drop row python panda. Juga, kami telah membahas topik-topik ini

  • python panda menjatuhkan baris berdasarkan indeks
  • python panda menjatuhkan baris berdasarkan kondisi
  • python panda menjatuhkan baris dengan nan di kolom tertentu
  • panda python menjatuhkan baris dengan nan
  • python panda menjatuhkan baris berdasarkan nilai kolom
  • python panda menjatuhkan baris yang berisi string

Bagaimana cara menghapus baris yang tidak diinginkan dengan python?

Bijay Kumar

Python adalah salah satu bahasa paling populer di Amerika Serikat. Saya telah bekerja dengan Python untuk waktu yang lama dan saya memiliki keahlian dalam bekerja dengan berbagai perpustakaan di Tkinter, Pandas, NumPy, Turtle, Django, Matplotlib, Tensorflow, Scipy, Scikit-Learn, dll… Saya memiliki pengalaman dalam bekerja dengan berbagai klien . Lihat profil saya

Bagaimana cara menghapus banyak baris dalam kumpulan data dengan Python?

Untuk menghapus baris dan kolom dari DataFrames, Panda menggunakan fungsi “jatuhkan” . Untuk menghapus kolom, atau beberapa kolom, gunakan nama kolom, dan tentukan "sumbu" sebagai 1. Alternatifnya, seperti pada contoh di bawah, parameter 'kolom' telah ditambahkan di Pandas yang menghilangkan kebutuhan akan 'sumbu'.

Bagaimana Anda menghapus 5 baris pertama dengan Python?

Hapus N Baris Pertama Pandas DataFrame Menggunakan tail() . tail(df. shape[0] -n) untuk menghapus n baris teratas/pertama dari panda DataFrame. Umumnya, DataFrame. fungsi tail() digunakan untuk menampilkan n baris terakhir dari DataFrame panda tetapi Anda dapat memberikan nilai negatif untuk melewati baris dari awal.

Bagaimana cara menjatuhkan baris di panda Python?

Pandas DataFrame drop() Metode . Dengan menentukan sumbu kolom ( axis='columns' ), ​​metode drop() menghapus kolom yang ditentukan. Dengan menentukan sumbu baris ( axis='index' ), metode drop() menghapus baris yang ditentukan .

Bagaimana Anda menjatuhkan semua nilai baris yang hilang dengan Python?

Menjatuhkan semua baris yang semua nilainya adalah nilai nol . pass the value 0 to the axis parameter and set the value how='all' .