Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris. Pada bagian berikutnya, Anda dapat menemukan deskripsi konversi yang memanggil operasiAWS Glue API dengan Python. Untuk informasi selengkapnya, lihat Skrip ProgramAWS Glue ETL dengan Python di PanduanAWS Glue Pengembang. Langkah 1: Buat basis dataLangkah pertama adalah membuat database baru dalam KatalogAWS Glue Data dengan menggunakan AWSSDK API. Ketika Anda menentukan tabel di Katalog Data, Anda menambahkannya ke sebuah basis data. Sebuah database digunakan untuk mengatur tabel diAWS Glue. Contoh berikut menunjukkan
Jika Anda menggunakan Amazon Redshift, nama database dibentuk sebagai berikut.
Nama lengkap klaster Amazon Redshift untuk contoh ini adalah sebagai berikut.
Berikut ini adalah contoh nama basis data yang terbentuk dengan baik. Dalam hal ini 0.
Langkah 2: Buat koneksiBuat koneksi baru di Katalog Data dengan menggunakan AWSSDK API. Contoh berikut menunjukkan menggunakan 1metode Python API untukAWS Glue.
Parameter yang digunakan 1 adalah sebagai berikut:
Langkah 3: BuatAWS Glue crawlerSelanjutnya, Anda membuatAWS Glue crawler untuk mengisiAWS Glue katalog. Untuk informasi selengkapnya, lihat Membuat katalog tabel dengan crawler di PanduanAWS Glue Pengembang. Langkah pertama dalam menambahkan crawler adalah membuat database baru dalam Katalog Data dengan menggunakan AWSSDK API. Sebelum Anda mulai, pastikan untuk terlebih dahulu menghapus versi sebelumnya dengan menggunakan 4 operasi.Saat Anda membuat crawler, beberapa pertimbangan berlaku:
Contoh berikut menghapus crawler yang ada dan kemudian membuat yang baru dengan menggunakan Python API untukAWS Glue.
Membuat dan kemudian menjalankan sebuah crawler yang menghubungkan ke satu atau beberapa penyimpanan data, dan menulis tabel ke dalam Katalog Data. Anda dapat menjalankan crawler Anda sesuai jadwal, seperti yang ditunjukkan berikut.
Contoh ini menggunakan Amazon Redshift sebagai target. Jenis data Amazon Redshift dipetakan ke tipeAWS Glue data dengan cara berikut setelah crawler berjalan. Tipe data Amazon RedshiftAWS Gluetipe datasmallintsmallintbilangan bulatintbigintbigintdecimaldesimal (18,0)desimal (p, s)desimal (p, s)nyatadoublepresisi gandadoublebooleanbooleancharstringvarcharstringvarcharstringtanggaltanggaltimestamptimestampstemamptztimestamp |