Cara menambahkan baris baru di xml menggunakan python

Extensible Markup Language, umumnya dikenal sebagai XML adalah bahasa yang dirancang khusus agar mudah diinterpretasikan oleh manusia dan komputer secara bersamaan. Bahasa mendefinisikan seperangkat aturan yang digunakan untuk menyandikan dokumen dalam format tertentu. Pada artikel ini, metode telah dijelaskan untuk membaca dan menulis file XML dengan python

Catatan. Secara umum, proses membaca data dari file XML dan menganalisis komponen logisnya disebut Parsing. Oleh karena itu, saat kita mengacu pada membaca file xml, kita mengacu pada parsing dokumen XML.  

Pada artikel ini, kita akan melihat dua pustaka yang dapat digunakan untuk tujuan parsing xml. Mereka

  • BeautifulSoup digunakan bersama parser lxml xml
  • Perpustakaan Elementtree.  

Menggunakan BeautifulSoup bersama dengan parser lxml

Untuk tujuan membaca dan menulis file xml kita akan menggunakan pustaka Python bernama BeautifulSoup. Untuk menginstal perpustakaan, ketikkan perintah berikut ke terminal.   

pip install beautifulsoup4

Beautiful Soup mendukung parser HTML yang termasuk dalam pustaka standar Python, tetapi juga mendukung sejumlah parser Python pihak ketiga. Salah satunya adalah parser lxml (digunakan untuk mem-parsing dokumen XML/HTML). lxml dapat diinstal dengan menjalankan perintah berikut di prosesor perintah sistem Operasi Anda.   

pip install lxml
_

Pertama kita akan belajar cara membaca dari file XML. Kami juga akan mengurai data yang tersimpan di dalamnya. Nanti kita akan belajar cara membuat file XML dan menulis data ke dalamnya.  

Membaca Data Dari File XML

Ada dua langkah yang diperlukan untuk mengurai file xml. -

  • Menemukan Tag
  • Mengekstrak dari tag

Contoh

File XML yang digunakan.  

Cara menambahkan baris baru di xml menggunakan python

Python3




from bs4import BeautifulSoup

 

 

# Reading the data inside the xml

# file to a variable under the name

# data

with

pip install lxml
0
pip install lxml
1
pip install lxml
2
pip install lxml
3
pip install lxml
4
pip install lxml
5

pip install lxml
6
pip install lxml
7
pip install lxml
8
pip install lxml
9

 

from_0

from_1

from2

from3

pip install lxml
8 from5from6from7

 

from_8

from_9

________67______0

pip install lxml
8 bs42bs43________66______7

 

bs45bs46

 

bs47

bs48

bs49

pip install lxml
8 import1import2import3import4import5import6import7

 

bs45import9

 

BeautifulSoup_0

BeautifulSoup_1

BeautifulSoup_2

BeautifulSoup3

pip install lxml
8 BeautifulSoup5BeautifulSoup6________66______7

 

bs45BeautifulSoup9

KELUARAN

Cara menambahkan baris baru di xml menggunakan python

Menulis file xml adalah proses primitif, alasannya adalah fakta bahwa file xml tidak dikodekan dengan cara khusus. Memodifikasi bagian dari dokumen xml mengharuskan seseorang untuk menguraikannya terlebih dahulu. Dalam kode di bawah ini kami akan memodifikasi beberapa bagian dari dokumen xml tersebut.  

Contoh.  

Python3




from bs4import BeautifulSoup

 

# Reading the data inside the xml4

with

pip install lxml
0
pip install lxml
1
pip install lxml
2
pip install lxml
3
pip install lxml
4
pip install lxml
5

pip install lxml
6
pip install lxml
7
pip install lxml
8
pip install lxml
9

 

# file to a variable under the name6

# file to a variable under the name7

# file to a variable under the name8

# file to a variable under the name9

pip install lxml
8 from5# data2from7

 

# data_4

# data_5

# data_6

# data7

# data8 # data9with0 with1import2________68______3import4import5import6________73______7

pip install lxml
6with9BeautifulSoup6
pip install lxml
01
pip install lxml
8
pip install lxml
03

 

 

pip install lxml
_04

pip install lxml
_05

bs45

pip install lxml
07

Keluaran

Cara menambahkan baris baru di xml menggunakan python

Menggunakan Elementree

Modul Elementree memberi kita banyak alat untuk memanipulasi file XML. Bagian terbaik tentang itu adalah penyertaannya dalam pustaka bawaan Python standar. Oleh karena itu, seseorang tidak perlu memasang modul eksternal apa pun untuk tujuan tersebut. Karena format xml menjadi format data hierarkis yang inheren, jauh lebih mudah untuk merepresentasikannya dengan pohon. Modul menyediakan ElementTree menyediakan metode untuk merepresentasikan seluruh dokumen XML sebagai pohon tunggal.  

Dalam contoh selanjutnya, kita akan melihat metode diskrit untuk membaca dan menulis data ke dan dari file XML.   

Membaca File XML

Untuk membaca file XML menggunakan ElementTree, pertama-tama kita mengimpor kelas ElementTree yang terdapat di dalam pustaka xml, dengan nama ET (common convention). Kemudian meneruskan nama file dari file xml ke ElementTree. parse() metode, untuk mengaktifkan penguraian file xml kami. Kemudian dapatkan root (tag induk) dari file xml kami menggunakan getroot(). Kemudian tampilkan (cetak) tag root dari file xml kami (cara non-eksplisit). Kemudian ditampilkan atribut sub-tag dari tag induk kita menggunakan root[0]. attrib. root[0] untuk tag pertama root induk dan attrib untuk mendapatkan atributnya. Kemudian kami menampilkan teks yang terlampir di dalam sub-tag ke-1 dari sub-tag ke-5 dari root tag

Contoh.   

Python3




pip install lxml
_08

pip install lxml
_09

import

pip install lxml
11

 

pip install lxml
_12

pip install lxml
_13

pip install lxml
_14

pip install lxml
15
pip install lxml
8
pip install lxml
17
pip install lxml
2from7

 

pip install lxml
_20

pip install lxml
_21

pip install lxml
22
pip install lxml
8
pip install lxml
24

 

pip install lxml
_25

pip install lxml
_26

pip install lxml
_27

bs45

pip install lxml
29

 

pip install lxml
_30

pip install lxml
_31

bs45

pip install lxml
33
pip install lxml
34
pip install lxml
35

 

pip install lxml
_36

pip install lxml
_37

pip install lxml
_38

bs45

pip install lxml
33
pip install lxml
41
pip install lxml
42
pip install lxml
34
pip install lxml
44

Keluaran

Cara menambahkan baris baru di xml menggunakan python

Sekarang, kita akan melihat beberapa metode yang dapat digunakan untuk menulis data pada dokumen xml. Dalam contoh ini kita akan membuat file xml dari awal.  

Untuk melakukan hal yang sama, pertama kita buat root (parent) tag dengan nama chess menggunakan perintah ET. Elemen('catur'). Semua tag akan berada di bawah tag ini, mis. e. setelah root tag ditentukan, sub-elemen lain dapat dibuat di bawahnya. Kemudian kami membuat subtag/subelemen bernama Opening di dalam tag catur menggunakan perintah ET. SubElemen(). Kemudian kami membuat dua subtag lagi yang berada di bawah tag Opening bernama E4 dan D4. Kemudian kami menambahkan atribut ke tag E4 dan D4 menggunakan set() yang merupakan metode yang ditemukan di dalam SubElement(), yang digunakan untuk mendefinisikan atribut ke tag. Kemudian kami menambahkan teks antara tag E4 dan D4 menggunakan teks atribut yang ditemukan di dalam fungsi SubElement. Pada akhirnya kami mengonversi tipe data dari konten yang kami buat dari 'xml. etree. ElementTree. Elemen 'ke objek byte, menggunakan perintah ET. tostring() (meskipun nama fungsinya adalah tostring() dalam implementasi tertentu, ia mengubah tipe data menjadi `bytes` daripada `str`). Terakhir, kami membuang data ke file bernama gameofsquares. xml yang dibuka dalam mode `wb` untuk memungkinkan penulisan data biner ke dalamnya. Pada akhirnya, kami menyimpan data ke file kami

Bagaimana cara menambahkan baris baru dalam XML?

Anda dapat menggunakan . or for carriage return (CR), and an XML parser will replace it with the respective character when handing off the parsed text to an application.

Bagaimana cara menggunakan n dalam XML?

string tipikal dengan escape sequence seperti '\n' tidak dapat digunakan, karena string ini tidak memiliki arti khusus dalam XML. Alih-alih Anda perlu menggunakan karakter heksadesimal yang lolos. . Sederhana, bukan?. Simple, isn't it?

Apa itu XML Etree ElementTree dengan Python?

Xml. etree. Modul ElementTree mengimplementasikan API yang sederhana dan efisien untuk mem-parsing dan membuat data XML . Berubah di versi 3. 3. Modul ini akan menggunakan implementasi cepat kapan pun tersedia.