Python membagi teks demi karakter

Dalam panduan untuk memisahkan string dengan Python ini, kita akan mengeksplorasi berbagai cara kita dapat menggunakan bahasa untuk memisahkan string dengan tepat. Saat kami memisahkan string antar karakter dengan Python, dimungkinkan untuk mengekstrak sebagian string dari keseluruhan (juga dikenal sebagai substring)

Mempelajari cara membagi string akan berguna untuk setiap programmer Python. Apakah Anda bermaksud menggunakan Python untuk pengembangan web, ilmu data, atau pemrosesan bahasa alami, pemisahan string akan menjadi operasi rutin

Kami akan mengikuti beberapa prosedur untuk mendapatkan substring dengan Python. Pertama, kita akan melihat notasi splice dan fungsi split(). Setelah itu, kita akan mempelajari teknik yang lebih canggih, seperti regex

Pisahkan String Antar Karakter dengan Notasi Slice

Dalam hal pemisahan string, notasi irisan adalah pilihan yang jelas bagi pengembang Python. Dengan notasi irisan, kita dapat menemukan subbagian dari sebuah string

Python membagi teks demi karakter

Contoh. Pisahkan string dengan notasi irisan

text = """BERNARDO
Well, good night.
If you do meet Horatio and Marcellus,
The rivals of my watch, bid them make haste."""

speaker = text[:8]

print(speaker)

Keluaran

BERNARDO
_

Pisahkan String berdasarkan Posisi Karakter

Untuk menggunakan metode ini, kita perlu mengetahui lokasi awal dan akhir dari substring yang ingin kita potong. Kita dapat menggunakan metode index() untuk menemukan indeks karakter dalam sebuah string

Contoh. Cara menemukan indeks karakter dalam string

sentence = "Jack and Jill went up the hill."

index1 = sentence.index("J",0)
print(index1)

index2 = sentence.index("J",1)
print(index2)

Keluaran

0
9

Panduan Cepat Menggunakan split()

Pustaka standar Python dilengkapi dengan fungsi untuk memisahkan string. fungsi split(). Fungsi ini dapat digunakan untuk memisahkan string antar karakter. Fungsi split() membutuhkan dua parameter. Yang pertama disebut pemisah dan menentukan karakter mana yang digunakan untuk memisahkan string

Fungsi split() mengembalikan daftar substring dari string asli. Dengan meneruskan nilai yang berbeda ke fungsi split() , kita dapat membagi string dengan berbagai cara

Memisahkan String dengan Fungsi split()

Kita dapat menentukan karakter untuk memisahkan string dengan menggunakan pemisah dalam fungsi split(). Secara default, split() akan menggunakan spasi putih sebagai pemisah, tetapi kita bebas memberikan karakter lain jika kita mau

Contoh. Memisahkan string dengan spasi putih

sentence = "The quick brown fox jumps over the lazy dog."

# split a string using whitespace
words = sentence.split()

print(words)
_

Keluaran

['The', 'quick', 'brown', 'fox', 'jumps', 'over', 'the', 'lazy', 'dog.']

Contoh. Memisahkan string yang dipisahkan dengan koma

rainbow = "red,orange,yellow,green,blue,indigo,violet"

# use a comma to separate the string
colors = rainbow.split(',')

print(colors)
_

Keluaran

['red', 'orange', 'yellow', 'green', 'blue', 'indigo', 'violet']

Gunakan split() dengan Banyak Argumen

Dengan menggunakan fungsi split(), kita juga dapat mengontrol berapa banyak baris teks yang akan dipisah. Fungsi ini membutuhkan parameter kedua. maxsplit. Variabel ini memberi tahu fungsi split() berapa banyak pemisahan yang harus dilakukan

Contoh. Memisahkan beberapa baris teks

text = """HORATIO
Before my God, I might not this believe
Without the sensible and true avouch
Of mine own eyes."""

lines = text.split(maxsplit=1)

print(lines)
_

Keluaran

['HORATIO', 'Before my God, I might not this believe\nWithout the sensible and true avouch\nOf mine own eyes.']
_

Karena kami menetapkan maxsplit ke nilai 1, teks dibagi menjadi dua substring

Cara Memisahkan String Antara Dua Karakter Identik

Jika kita memiliki teks yang dibagi oleh beberapa karakter yang identik, kita dapat menggunakan fungsi split() untuk memisahkan string antar karakter

Contoh. Menggunakan simbol untuk memisahkan string

BERNARDO
_0

Keluaran

BERNARDO
_1

Cara Menemukan Tali Antara Dua Simbol

Kita dapat menggabungkan fungsi index() dengan notasi slice untuk mengekstraksi substring dari string. Fungsi index() akan memberi kita lokasi awal dan akhir dari substring. Setelah kami mengetahui lokasi simbol ($ dalam hal ini), kami akan mengekstrak string menggunakan notasi irisan

Contoh. Mengekstrak substring dengan fungsi index()

BERNARDO
_2

Keluaran

BERNARDO
_3

Cara Menggunakan Ekspresi Reguler untuk Memisahkan String Antar Karakter

Regular Expression adalah cara mudah untuk mencari string atau teks untuk pola. Karena pola ekspresi reguler (regex) sangat serbaguna, mereka dapat digunakan untuk membuat pencarian yang sangat bertarget.  

Python hadir dengan pustaka ulang. Dengan regex, kita dapat mencari teks dengan sisir gigi halus, mencari kata, frasa, atau bahkan kata tertentu dengan panjang tertentu

Contoh. Menggunakan ekspresi reguler untuk mencari string

BERNARDO
_4

Keluaran

BERNARDO
_5

Contoh. Menggunakan regex untuk menemukan tanggal

BERNARDO
_6

Keluaran

BERNARDO
_7

Dalam contoh di atas, kami menggunakan metode search() untuk menemukan substring menggunakan pola ekspresi reguler. Metode ini memiliki dua argumen. Yang pertama adalah pola regex kita, dan yang kedua adalah string yang ingin kita cari

Ekspresi reguler menggunakan karakter dan angka khusus untuk membuat pencarian yang ditargetkan. Misalnya, contoh pertama kita menggunakan karakter khusus \w untuk mencari kata

Karakter Khusus untuk Ekspresi Reguler

  • /w – Mencari karakter alfanumerik (kata-kata)
  • / d – Mencari karakter digit (0-9)
  • / s - Cari karakter spasi putih

Contoh. Temukan apakah string dimulai dengan kata dengan regex

BERNARDO
_8

Keluaran

BENAR

Selanjutnya, kita dapat menggunakan regex untuk menemukan string antara dua karakter. Pada contoh berikutnya, kita akan menggunakan pola regex untuk menemukan string di antara tanda kurung siku

Contoh. Ekspresi reguler untuk menemukan semua karakter di antara dua karakter khusus

BERNARDO
_9

Keluaran

sentence = "Jack and Jill went up the hill."

index1 = sentence.index("J",0)
print(index1)

index2 = sentence.index("J",1)
print(index2)
0

Regex menyertakan banyak karakter meta. Mencakup semuanya berada di luar cakupan tutorial ini, tetapi di sini ada beberapa lagi dari contoh di atas

Lebih Banyak Metakarakter Regex

  • \  – Gunakan untuk keluar dari karakter khusus (misalnya, karakter [)
  • – Karakter wildcard (cocok dengan karakter apa pun kecuali karakter baris baru)
  • + – Mencocokkan beberapa kejadian
  • ?

Pisahkan String Menggunakan Objek Slice

Objek irisan Python digunakan untuk membagi urutan, seperti string atau daftar. Objek irisan memberi tahu Python cara mengiris urutan

Objek irisan mengambil tiga parameter. mulai, berhenti dan melangkah. Dua parameter pertama memberi tahu Python di mana harus memulai dan mengakhiri irisan, sedangkan parameter langkah menjelaskan kenaikan di antara setiap langkah

Dengan objek slice kita bisa mendapatkan substring antar karakter. Untuk membuat objek slice, gunakan fungsi slice(). Fungsi ini mengembalikan objek irisan baru yang dapat diterapkan ke string, atau urutan lainnya

Contoh. Menggunakan Objek Slice untuk mendapatkan substring

sentence = "Jack and Jill went up the hill."

index1 = sentence.index("J",0)
print(index1)

index2 = sentence.index("J",1)
print(index2)
1

Keluaran

sentence = "Jack and Jill went up the hill."

index1 = sentence.index("J",0)
print(index1)

index2 = sentence.index("J",1)
print(index2)
2

Ringkasan

Panduan ini mengeksplorasi beberapa teknik untuk memisahkan string antar karakter. Solusi termudah untuk tugas ini sering berupa notasi irisan, tetapi ini tidak selalu benar. Bergantung pada kebutuhan Anda, mungkin perlu menggunakan metode Python lain untuk mencapai tujuan Anda

Berikut ulasan singkat tentang topik yang kami bahas

  • Dengan fungsi split(), kita dapat membagi string menjadi substring.  
  • Jika Anda membutuhkan pencarian yang sangat bertarget, coba gunakan ekspresi reguler.  
  • Slice Objects adalah opsi lain untuk mengiris string
  • Notasi irisan adalah cara cepat untuk memisahkan string antar karakter

Anda dapat menganggap setiap opsi sebagai alat di kotak alat pengembang Python. Ingatlah untuk menggunakan alat yang sesuai untuk pekerjaan itu dan Anda akan berada di jalur yang benar

Pos terkait

Jika Anda menemukan panduan ini bermanfaat, dan ingin mempelajari lebih banyak pemrograman Python, lihat tautan ini dari Python untuk Pemula.  

  • Menggunakan Python tulis ke file untuk menyimpan dokumen teks
  • Cara menggabungkan string dengan Python dengan penggabungan string

Terkait

Pelatihan Python yang Direkomendasikan

Kursus. Python 3 Untuk Pemula

Lebih dari 15 jam konten video dengan instruksi terpandu untuk pemula. Pelajari cara membuat aplikasi dunia nyata dan kuasai dasar-dasarnya

Bagaimana Anda membagi string setelah karakter tertentu di Python?

Sintaksis Metode Python String split() .
Sintaksis. str. split(pemisah, maxsplit)
Parameter
Pengembalian. Mengembalikan daftar string setelah memutus string yang diberikan oleh pemisah yang ditentukan

Bagaimana Anda memisahkan string setelah koma dengan Python?

Pisahkan String Python dengan Koma . Ini mengembalikan daftar string yang terdapat di antara koma di string awal Anda. Variabel string my_st diberi nilai dengan koma (,) di antaranya. use a comma (,) as the separator to split a string in Python. It returns a list of strings contained between commas in your initial string. The string variable my_st was assigned values with commas (,) in between them.

Bagaimana Anda memisahkan string dengan karakter?

Pendekatan 1. .
Pertama, tentukan string
Selanjutnya, buat for-loop di mana variabel loop akan dimulai dari indeks 0 dan berakhir pada panjang string yang diberikan
Cetak karakter yang ada di setiap indeks untuk memisahkan masing-masing karakter
Untuk visualisasi yang lebih baik, pisahkan setiap karakter dengan spasi

Bagaimana Anda membagi string setelah?

Metode split() membagi string menjadi array substring . Metode split() mengembalikan array baru. Metode split() tidak mengubah string asli. Jika (" ") digunakan sebagai pemisah, string dipisahkan di antara kata-kata.