Bagaimana cara menghapus semua tanda baca dari sebuah string dengan python?

Seringkali selama tugas analisis data, kami menemukan data teks yang perlu diproses agar informasi yang berguna dapat diperoleh dari data tersebut. Selama pemrosesan teks, kita mungkin harus mengekstrak atau menghapus teks tertentu dari data agar berguna atau kita mungkin juga perlu mengganti simbol dan istilah tertentu dengan teks lain untuk mengekstrak informasi yang berguna. Pada artikel ini, kita akan mempelajari tentang tanda baca dan akan melihat metode untuk menghapus tanda baca dari string python.

Apa itu tanda baca?

Ada beberapa simbol dalam tata bahasa Inggris yang meliputi koma, tanda hubung, tanda tanya, tanda hubung, tanda seru, titik dua, titik koma, tanda kurung, tanda kurung dll yang disebut sebagai tanda baca. Ini digunakan dalam bahasa Inggris untuk tujuan tata bahasa tetapi ketika kami melakukan pemrosesan teks dengan python kami biasanya harus menghilangkan tanda baca dari string kami. Sekarang kita akan melihat berbagai metode untuk menghapus tanda baca dari sebuah string dengan Python

Menghapus tanda baca dari string menggunakan for loop

Dalam metode ini, pertama kita akan membuat string python kosong yang akan berisi string keluaran. Kemudian kami hanya akan mengulangi setiap karakter string python dan memeriksa apakah itu tanda baca atau tidak. Jika karakter tersebut akan menjadi tanda baca, kami akan meninggalkannya. Kalau tidak, kami akan memasukkannya ke dalam string keluaran kami menggunakan penggabungan string

Bagaimana cara menghapus semua tanda baca dari sebuah string dengan python?

Sebagai Contoh, Dalam kode yang diberikan di bawah ini, kami memiliki setiap tanda baca yang disimpan dalam sebuah string bernama punctuation. Kami mengulangi melalui string input myString menggunakan for loop dan kemudian kami memeriksa apakah karakter tersebut ada dalam string tanda baca atau tidak. Jika tidak ada, karakter disertakan dalam string keluaran

The punctuation marks are:
!()-[]{};:'"\, <>./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
0


punctuation= '''!()-[]{};:'"\, <>./[email protected]#$%^&*_~'''
print("The punctuation marks are:")
print(punctuation)
myString= "Python.:F}or{Beg~inn;ers"
print("Input String is:")
print(myString)
newString=""
for x in myString:
    if x not in punctuation:
        newString=newString+x
print("Output String is:")
print(newString)
_

Keluaran

The punctuation marks are:
!()-[]{};:'"\, <>./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners

Hapus tanda baca dari string python menggunakan ekspresi reguler

Kami juga dapat menghapus tanda baca dari string di python menggunakan ekspresi reguler. Untuk ini kita akan menggunakan modul

The punctuation marks are:
!()-[]{};:'"\, <>./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
1 dengan python yang menyediakan fungsi untuk memproses string menggunakan ekspresi reguler

Dalam metode ini, kami akan mengganti setiap karakter yang bukan alfanumerik atau karakter spasi dengan string kosong menggunakan metode

The punctuation marks are:
!()-[]{};:'"\, <>./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
2  sehingga semua tanda baca akan dihapus

Sintaks untuk metode

The punctuation marks are:
!()-[]{};:'"\, <>./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
3 adalah
The punctuation marks are:
!()-[]{};:'"\, <>./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
4 di mana
The punctuation marks are:
!()-[]{};:'"\, <>./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
5 menunjukkan pola karakter yang akan diganti. Dalam kasus kami, kami akan memberikan pola yang menunjukkan karakter yang bukan karakter alfanumerik atau spasi.
The punctuation marks are:
!()-[]{};:'"\, <>./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
6 adalah pola terakhir dimana karakter dalam
The punctuation marks are:
!()-[]{};:'"\, <>./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
5 akan diganti. Dalam kasus kami
The punctuation marks are:
!()-[]{};:'"\, <>./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
6 akan menjadi string kosong karena kami hanya perlu menghapus tanda baca dari string python kami.
The punctuation marks are:
!()-[]{};:'"\, <>./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
_9 adalah string yang harus diproses untuk menghapus tanda baca

Contoh


import re
myString= "Python.:F}or{Beg~inn;ers"
print("Input String is:")
print(myString)
emptyString=""
newString=re.sub(r'[^\w\s]',emptyString,myString)
print("Output String is:")
print(newString)

Keluaran

Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners

Hapus tanda baca dari string python menggunakan metode replace()

Metode ganti string Python () mengambil pola awal dan pola akhir sebagai parameter ketika dipanggil pada string dan mengembalikan string yang dihasilkan di mana karakter dari pola awal diganti dengan karakter dalam pola akhir

Kita dapat menggunakan metode replace() untuk menghapus tanda baca dari string python dengan mengganti setiap tanda baca dengan string kosong. Kami akan mengulangi seluruh tanda baca satu per satu menggantinya dengan string kosong di string teks kami

Sintaks untuk metode


import re
myString= "Python.:F}or{Beg~inn;ers"
print("Input String is:")
print(myString)
emptyString=""
newString=re.sub(r'[^\w\s]',emptyString,myString)
print("Output String is:")
print(newString)
_0 adalah

import re
myString= "Python.:F}or{Beg~inn;ers"
print("Input String is:")
print(myString)
emptyString=""
newString=re.sub(r'[^\w\s]',emptyString,myString)
print("Output String is:")
print(newString)
1 di mana

import re
myString= "Python.:F}or{Beg~inn;ers"
print("Input String is:")
print(myString)
emptyString=""
newString=re.sub(r'[^\w\s]',emptyString,myString)
print("Output String is:")
print(newString)
2 adalah karakter yang akan diganti dengan karakter yang diberikan dalam parameter

import re
myString= "Python.:F}or{Beg~inn;ers"
print("Input String is:")
print(myString)
emptyString=""
newString=re.sub(r'[^\w\s]',emptyString,myString)
print("Output String is:")
print(newString)
3. Dalam kasus kita,

import re
myString= "Python.:F}or{Beg~inn;ers"
print("Input String is:")
print(myString)
emptyString=""
newString=re.sub(r'[^\w\s]',emptyString,myString)
print("Output String is:")
print(newString)
_2 akan berisi tanda baca dan

import re
myString= "Python.:F}or{Beg~inn;ers"
print("Input String is:")
print(myString)
emptyString=""
newString=re.sub(r'[^\w\s]',emptyString,myString)
print("Output String is:")
print(newString)
3 akan menjadi string kosong


punctuation= '''!()-[]{};:'"\, <>./[email protected]#$%^&*_~'''
myString= "Python.:F}or{Beg~inn;ers"
print("Input String is:")
print(myString)
emptyString=""
for x in punctuation:
    myString=myString.replace(x,emptyString)
print("Output String is:")
print(myString)

Keluaran

Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners

Hapus tanda baca dari string python menggunakan metode translate()

Metode


import re
myString= "Python.:F}or{Beg~inn;ers"
print("Input String is:")
print(myString)
emptyString=""
newString=re.sub(r'[^\w\s]',emptyString,myString)
print("Output String is:")
print(newString)
_6mengganti karakter yang ditentukan dalam string input dengan karakter baru sesuai dengan tabel terjemahan yang disediakan untuk fungsi sebagai parameter. Tabel terjemahan harus berisi pemetaan karakter mana yang harus diganti dengan karakter mana. Jika tabel tidak memiliki pemetaan untuk karakter apa pun, karakter tersebut tidak akan diganti

Sintaks untuk metode


import re
myString= "Python.:F}or{Beg~inn;ers"
print("Input String is:")
print(myString)
emptyString=""
newString=re.sub(r'[^\w\s]',emptyString,myString)
print("Output String is:")
print(newString)
_6 adalah translate(

import re
myString= "Python.:F}or{Beg~inn;ers"
print("Input String is:")
print(myString)
emptyString=""
newString=re.sub(r'[^\w\s]',emptyString,myString)
print("Output String is:")
print(newString)
8) di mana

import re
myString= "Python.:F}or{Beg~inn;ers"
print("Input String is:")
print(myString)
emptyString=""
newString=re.sub(r'[^\w\s]',emptyString,myString)
print("Output String is:")
print(newString)
8 akan menjadi kamus python yang berisi pemetaan karakter dalam string input ke karakter yang akan diganti

Untuk membuat tabel terjemahan, kita dapat menggunakan metode

Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
0. Metode ini mengambil karakter awal untuk diganti, karakter akhir dan karakter untuk dihapus dari string dalam bentuk string sebagai input opsional dan mengembalikan kamus python yang berfungsi sebagai tabel terjemahan

Sintaks untuk metode

Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
_0 adalah
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
2. Di sini
The punctuation marks are:
!()-[]{};:'"\, <>./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
5 akan menjadi string yang berisi semua karakter yang akan diganti.
The punctuation marks are:
!()-[]{};:'"\, <>./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
6 akan menjadi string yang berisi karakter dimana karakter dalam
The punctuation marks are:
!()-[]{};:'"\, <>./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
5 akan diganti. Di sini panjang
The punctuation marks are:
!()-[]{};:'"\, <>./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
_5 harus sama dengan panjang
The punctuation marks are:
!()-[]{};:'"\, <>./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
6.
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
8 adalah string yang berisi karakter yang harus dihapus dari input teks. Dalam kasus kita,
The punctuation marks are:
!()-[]{};:'"\, <>./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
5 dan
The punctuation marks are:
!()-[]{};:'"\, <>./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
6 akan menjadi string kosong sementara
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
8 akan menjadi string yang berisi tanda baca

Untuk membuat tabel terjemahan untuk menghapus tanda baca dari string python, kita dapat mengosongkan dua parameter pertama dari fungsi

Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
0 dan menyertakan tanda baca dalam daftar karakter yang akan dikecualikan. Dengan cara ini semua tanda baca akan dihapus dan string keluaran akan diperoleh

Contoh

punctuation= '''!()-[]{};:'"\, <>./[email protected]#$%^&*_~'''
myString= "Python.:F}or{Beg~inn;ers"
print("Input String is:")
print(myString)
emptyString=""
translationTable= str.maketrans("","",punctuation)
newString=myString.translate(translationTable)
print("Output String is:")
print(newString)

Keluaran

Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners

Kesimpulan

Pada artikel ini, kita telah melihat cara menghapus tanda baca dari string di python menggunakan for loop , ekspresi reguler, dan metode string bawaan seperti replace() dan translate(). Nantikan artikel yang lebih informatif

Terkait

Pelatihan Python yang Direkomendasikan

Kursus. Python 3 Untuk Pemula

Lebih dari 15 jam konten video dengan instruksi terpandu untuk pemula. Pelajari cara membuat aplikasi dunia nyata dan kuasai dasar-dasarnya

Bagaimana cara menghapus semua tanda baca dan karakter khusus di Python?

Salah satu metode termudah dan tercepat untuk menghapus tanda baca dan karakter khusus dari sebuah string adalah dengan menggunakan metode terjemahan (). The built-in translate () function is available in the string library of Python.

Bagaimana Anda menghapus semua tanda baca dan spasi dari sebuah string dengan Python?

Ilmu Data Praktis menggunakan Python . Kami akan memeriksa apakah setiap karakter adalah alfabet atau angka menggunakan isalnum (), jika tidak maka akan dihapus atau kita akan melanjutkan ke karakter berikutnya. using isalnum() method on each character of the string by iterating it using for loop. We will check if each character is either alphabet or number using isalnum(), if they are not then they will be removed else we will go on to next character.

Bagaimana cara menghapus tanda baca dari string Python menggunakan for loop?

Hapus Tanda Baca di Python di For Loop .
Langkah 1. Buat String Tanda Baca. Pertama, Anda membuat string tanda baca dengan tanda yang ingin Anda hapus. tanda baca = '''. ()-[].
Langkah 2. Ulangi Setiap Tanda Baca

Bagaimana cara menghapus semua tanda baca dari kolom dengan Python?

Cara Menghapus Tanda Baca Dari Panda .
str. mengganti()
regex. sub()
dan str. menerjemahkan()