Extensible Markup Language, umumnya dikenal sebagai XML adalah bahasa yang dirancang khusus agar mudah diinterpretasikan oleh manusia dan komputer secara bersamaan. Bahasa mendefinisikan seperangkat aturan yang digunakan untuk menyandikan dokumen dalam format tertentu. Pada artikel ini, metode telah dijelaskan untuk membaca dan menulis file XML dengan python Show Catatan. Secara umum, proses membaca data dari file XML dan menganalisis komponen logisnya disebut Parsing. Oleh karena itu, saat kita mengacu pada membaca file xml, kita mengacu pada parsing dokumen XML. Pada artikel ini, kita akan melihat dua pustaka yang dapat digunakan untuk tujuan parsing xml. Mereka
Menggunakan BeautifulSoup bersama dengan parser lxmlUntuk tujuan membaca dan menulis file xml kita akan menggunakan pustaka Python bernama BeautifulSoup. Untuk menginstal perpustakaan, ketikkan perintah berikut ke terminal. pip install beautifulsoup4 Beautiful Soup mendukung parser HTML yang termasuk dalam pustaka standar Python, tetapi juga mendukung sejumlah parser Python pihak ketiga. Salah satunya adalah parser lxml (digunakan untuk mem-parsing dokumen XML/HTML). lxml dapat diinstal dengan menjalankan perintah berikut di prosesor perintah sistem Operasi Anda. pip install lxml_ Pertama kita akan belajar cara membaca dari file XML. Kami juga akan mengurai data yang tersimpan di dalamnya. Nanti kita akan belajar cara membuat file XML dan menulis data ke dalamnya. Membaca Data Dari File XMLAda dua langkah yang diperlukan untuk mengurai file xml. -
Contoh File XML yang digunakan. Python3
pip install lxml0 pip install lxml1 pip install lxml2 pip install lxml3 pip install lxml4 pip install lxml5 pip install lxml6 pip install lxml7 pip install lxml8 pip install lxml9
pip install lxml8 from 5from 6from 7
________67______0 pip install lxml8 bs4 2bs4 3________66______7
pip install lxml8 import 1import 2import 3import 4import 5import 6import 7
pip install lxml8 BeautifulSoup 5BeautifulSoup 6________66______7
KELUARAN Menulis File XMLMenulis file xml adalah proses primitif, alasannya adalah fakta bahwa file xml tidak dikodekan dengan cara khusus. Memodifikasi bagian dari dokumen xml mengharuskan seseorang untuk menguraikannya terlebih dahulu. Dalam kode di bawah ini kami akan memodifikasi beberapa bagian dari dokumen xml tersebut. Contoh. Python3
pip install lxml0 pip install lxml1 pip install lxml2 pip install lxml3 pip install lxml4 pip install lxml5 pip install lxml6 pip install lxml7 pip install lxml8 pip install lxml9
pip install lxml8 from 5# data 2from 7
pip install lxml6 with 9BeautifulSoup 6pip install lxml01 pip install lxml8 pip install lxml03
pip install lxml_04 pip install lxml_05
pip install lxml07 Keluaran Menggunakan ElementreeModul Elementree memberi kita banyak alat untuk memanipulasi file XML. Bagian terbaik tentang itu adalah penyertaannya dalam pustaka bawaan Python standar. Oleh karena itu, seseorang tidak perlu memasang modul eksternal apa pun untuk tujuan tersebut. Karena format xml menjadi format data hierarkis yang inheren, jauh lebih mudah untuk merepresentasikannya dengan pohon. Modul menyediakan ElementTree menyediakan metode untuk merepresentasikan seluruh dokumen XML sebagai pohon tunggal. Dalam contoh selanjutnya, kita akan melihat metode diskrit untuk membaca dan menulis data ke dan dari file XML. Membaca File XMLUntuk membaca file XML menggunakan ElementTree, pertama-tama kita mengimpor kelas ElementTree yang terdapat di dalam pustaka xml, dengan nama ET (common convention). Kemudian meneruskan nama file dari file xml ke ElementTree. parse() metode, untuk mengaktifkan penguraian file xml kami. Kemudian dapatkan root (tag induk) dari file xml kami menggunakan getroot(). Kemudian tampilkan (cetak) tag root dari file xml kami (cara non-eksplisit). Kemudian ditampilkan atribut sub-tag dari tag induk kita menggunakan root[0]. attrib. root[0] untuk tag pertama root induk dan attrib untuk mendapatkan atributnya. Kemudian kami menampilkan teks yang terlampir di dalam sub-tag ke-1 dari sub-tag ke-5 dari root tag Contoh. Python3pip install lxml_08 pip install lxml_09
pip install lxml11
pip install lxml_12 pip install lxml_13 pip install lxml_14 pip install lxml15 pip install lxml8 pip install lxml17 pip install lxml2 from 7
pip install lxml_20 pip install lxml_21 pip install lxml22 pip install lxml8 pip install lxml24
pip install lxml_25 pip install lxml_26 pip install lxml_27
pip install lxml29
pip install lxml_30 pip install lxml_31
pip install lxml33 pip install lxml34 pip install lxml35
pip install lxml_36 pip install lxml_37 pip install lxml_38
pip install lxml33 pip install lxml41 pip install lxml42 pip install lxml34 pip install lxml44 Keluaran Menulis File XMLSekarang, kita akan melihat beberapa metode yang dapat digunakan untuk menulis data pada dokumen xml. Dalam contoh ini kita akan membuat file xml dari awal. Untuk melakukan hal yang sama, pertama kita buat root (parent) tag dengan nama chess menggunakan perintah ET. Elemen('catur'). Semua tag akan berada di bawah tag ini, mis. e. setelah root tag ditentukan, sub-elemen lain dapat dibuat di bawahnya. Kemudian kami membuat subtag/subelemen bernama Opening di dalam tag catur menggunakan perintah ET. SubElemen(). Kemudian kami membuat dua subtag lagi yang berada di bawah tag Opening bernama E4 dan D4. Kemudian kami menambahkan atribut ke tag E4 dan D4 menggunakan set() yang merupakan metode yang ditemukan di dalam SubElement(), yang digunakan untuk mendefinisikan atribut ke tag. Kemudian kami menambahkan teks antara tag E4 dan D4 menggunakan teks atribut yang ditemukan di dalam fungsi SubElement. Pada akhirnya kami mengonversi tipe data dari konten yang kami buat dari 'xml. etree. ElementTree. Elemen 'ke objek byte, menggunakan perintah ET. tostring() (meskipun nama fungsinya adalah tostring() dalam implementasi tertentu, ia mengubah tipe data menjadi `bytes` daripada `str`). Terakhir, kami membuang data ke file bernama gameofsquares. xml yang dibuka dalam mode `wb` untuk memungkinkan penulisan data biner ke dalamnya. Pada akhirnya, kami menyimpan data ke file kami Bagaimana cara menambahkan baris baru dalam XML?Anda dapat menggunakan
. or
for carriage return (CR), and an XML parser will replace it with the respective character when handing off the parsed text to an application.
Bagaimana cara menggunakan n dalam XML?string tipikal dengan escape sequence seperti '\n' tidak dapat digunakan, karena string ini tidak memiliki arti khusus dalam XML. Alih-alih Anda perlu menggunakan karakter heksadesimal yang lolos.
. Sederhana, bukan?. Simple, isn't it?
Apa itu XML Etree ElementTree dengan Python?Xml. etree. Modul ElementTree mengimplementasikan API yang sederhana dan efisien untuk mem-parsing dan membuat data XML . Berubah di versi 3. 3. Modul ini akan menggunakan implementasi cepat kapan pun tersedia. |