Lihat jenis kolom data yang kami impor. first_name dan company adalah variabel karakter. Variabel yang tersisa adalah variabel numerik Show
ID int64 first_name object company object salary int64 Contoh 2. Baca file CSV dengan header di baris keduaMisalkan Anda memiliki nama kolom atau variabel di baris kedua. Untuk membaca file CSV semacam ini, Anda dapat mengirimkan perintah berikut.mydata = pd.read_csv("workingfile.csv", header = 1) import os os.getcwd()9 memberitahu python untuk memilih header dari baris kedua. Ini mengatur baris kedua sebagai tajuk. Itu bukan contoh yang realistis. Saya hanya menggunakannya untuk ilustrasi sehingga Anda mendapatkan ide bagaimana menyelesaikannya. Agar praktis, Anda dapat menambahkan nilai acak di baris pertama file CSV, lalu mengimpornya lagi. dt = {'ID': [11, 12, 13, 14, 15], 'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'], 'company': ['Aon', 'TCS', 'Google', 'RBS', '.'], 'salary': [74, 76, 96, 71, 78]} mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])0 Tentukan nama kolom Anda sendiri, bukan baris tajuk dari file CSV dt = {'ID': [11, 12, 13, 14, 15], 'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'], 'company': ['Aon', 'TCS', 'Google', 'RBS', '.'], 'salary': [74, 76, 96, 71, 78]} mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])1skiprows = 1 berarti kita mengabaikan baris pertama dan nama= opsi digunakan untuk menetapkan nama variabel secara manual. dt = {'ID': [11, 12, 13, 14, 15], 'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'], 'company': ['Aon', 'TCS', 'Google', 'RBS', '.'], 'salary': [74, 76, 96, 71, 78]} mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])2 Contoh 3. Lewati baris tetapi pertahankan tajukdt = {'ID': [11, 12, 13, 14, 15], 'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'], 'company': ['Aon', 'TCS', 'Google', 'RBS', '.'], 'salary': [74, 76, 96, 71, 78]} mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])3Dalam hal ini, kita melewatkan baris kedua dan ketiga saat mengimpor. Jangan lupa indeks dimulai dari 0 dengan python jadi 0 merujuk ke baris pertama dan 1 merujuk ke baris kedua dan 2 menyiratkan baris ketiga. dt = {'ID': [11, 12, 13, 14, 15], 'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'], 'company': ['Aon', 'TCS', 'Google', 'RBS', '.'], 'salary': [74, 76, 96, 71, 78]} mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])_4 Alih-alih [1,2] Anda juga dapat menulis os.chdir("C:\\Users\\DELL\\Documents\\")0. Keduanya berarti hal yang sama tetapi fungsi range() sangat berguna ketika Anda ingin melewatkan banyak baris sehingga menghemat waktu untuk menentukan posisi baris secara manual Rahasia tersembunyi dari opsi skiprows Ketika skiprows = 4, itu berarti melewatkan empat baris dari atas. skiprows=[1,2,3,4] berarti melompati baris dari urutan kedua hingga kelima. Itu karena ketika daftar ditentukan dalam opsi skiprows=, itu melompati baris pada posisi indeks. Ketika satu nilai bilangan bulat ditentukan dalam opsi, opsi tersebut akan dianggap melewatkan baris tersebut dari atas Contoh 4. Baca file CSV tanpa baris headerJika Anda menentukan "header = None", python akan menetapkan serangkaian angka mulai dari 0 hingga (jumlah kolom - 1) sebagai nama kolom. Dalam datafile ini, kami memiliki nama kolom di baris pertama.dt = {'ID': [11, 12, 13, 14, 15], 'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'], 'company': ['Aon', 'TCS', 'Google', 'RBS', '.'], 'salary': [74, 76, 96, 71, 78]} mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])5Lihat keluaran yang ditampilkan di bawah-Keluaran Tambahkan awalan ke nama kolom dt = {'ID': [11, 12, 13, 14, 15], 'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'], 'company': ['Aon', 'TCS', 'Google', 'RBS', '.'], 'salary': [74, 76, 96, 71, 78]} mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])6Dalam hal ini, kami menetapkan os.chdir("C:\\Users\\DELL\\Documents\\")1 sebagai awalan yang memberi tahu python untuk memasukkan kata kunci ini sebelum setiap nama kolom. dt = {'ID': [11, 12, 13, 14, 15], 'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'], 'company': ['Aon', 'TCS', 'Google', 'RBS', '.'], 'salary': [74, 76, 96, 71, 78]} mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])_7 Contoh 5. Tentukan nilai yang hilangOpsios.chdir("C:\\Users\\DELL\\Documents\\")2 digunakan untuk menetapkan beberapa nilai sebagai nilai kosong/hilang saat mengimpor file CSV. dt = {'ID': [11, 12, 13, 14, 15], 'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'], 'company': ['Aon', 'TCS', 'Google', 'RBS', '.'], 'salary': [74, 76, 96, 71, 78]} mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])8 dt = {'ID': [11, 12, 13, 14, 15], 'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'], 'company': ['Aon', 'TCS', 'Google', 'RBS', '.'], 'salary': [74, 76, 96, 71, 78]} mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])9 Contoh 6. Tetapkan Kolom IndeksID first_name company salary 0 11 David Aon 74 1 12 Jamie TCS 76 2 13 Steve Google 96 3 14 Stevart RBS 71 4 15 John . 780 ID first_name company salary 0 11 David Aon 74 1 12 Jamie TCS 76 2 13 Steve Google 96 3 14 Stevart RBS 71 4 15 John . 781Seperti yang Anda lihat pada output di atas, ID kolom telah ditetapkan sebagai kolom indeks Contoh 7. Baca File CSV dari URL EksternalAnda bisa langsung membaca data dari file CSV yang tersimpan di link web. Ini sangat berguna saat Anda perlu memuat kumpulan data yang tersedia untuk umum dari github, kaggle, dan situs web lainnya.ID first_name company salary 0 11 David Aon 74 1 12 Jamie TCS 76 2 13 Steve Google 96 3 14 Stevart RBS 71 4 15 John . 782DataFrame ini berisi 2311 baris dan 8 kolom. Menggunakan os.chdir("C:\\Users\\DELL\\Documents\\")_3, Anda dapat membuat ringkasan ini Contoh 8. Lewati 5 Baris Terakhir Saat Mengimpor CSVID first_name company salary 0 11 David Aon 74 1 12 Jamie TCS 76 2 13 Steve Google 96 3 14 Stevart RBS 71 4 15 John . 783Dalam kode di atas, kami mengecualikan 5 baris terbawah menggunakan parameter skip_footer= Contoh 9. Baca hanya 5 baris pertamaID first_name company salary 0 11 David Aon 74 1 12 Jamie TCS 76 2 13 Steve Google 96 3 14 Stevart RBS 71 4 15 John . 784Menggunakan opsi nrows=, Anda dapat memuat jumlah baris K teratas Contoh 10. Menafsirkan "," sebagai pemisah ribuanID first_name company salary 0 11 David Aon 74 1 12 Jamie TCS 76 2 13 Steve Google 96 3 14 Stevart RBS 71 4 15 John . 78_5 Contoh 11. Baca hanya kolom tertentuID first_name company salary 0 11 David Aon 74 1 12 Jamie TCS 76 2 13 Steve Google 96 3 14 Stevart RBS 71 4 15 John . 786Kode di atas hanya membaca kolom berdasarkan posisi indeks yaitu posisi kedua, keenam dan kedelapan Contoh 12. Baca beberapa baris dan kolomID first_name company salary 0 11 David Aon 74 1 12 Jamie TCS 76 2 13 Steve Google 96 3 14 Stevart RBS 71 4 15 John . 787Dalam perintah di atas, kami telah menggabungkan opsi usecols= dan nrows=. Ini hanya akan memilih 5 baris pertama dan kolom yang dipilih Contoh 13. Baca file dengan pembatas titik komaID first_name company salary 0 11 David Aon 74 1 12 Jamie TCS 76 2 13 Steve Google 96 3 14 Stevart RBS 71 4 15 John . 788Menggunakan parameter sep= dalam fungsi read_csv( ), Anda dapat mengimpor file dengan pembatas apa pun selain koma default. Dalam hal ini, kami menggunakan titik koma sebagai pemisah Contoh 14. Ubah jenis kolom saat mengimpor CSVMisalkan Anda ingin mengubah format kolom dari int64 ke float64 sambil memuat file CSV ke Python. Kita dapat menggunakan opsi dtype = untuk hal yang sama.ID first_name company salary 0 11 David Aon 74 1 12 Jamie TCS 76 2 13 Steve Google 96 3 14 Stevart RBS 71 4 15 John . 78_9 Contoh 15. Ukur waktu yang dibutuhkan untuk mengimpor file CSV besarDengan menggunakanos.chdir("C:\\Users\\DELL\\Documents\\")4, Anda dapat mencatat waktu yang dibutuhkan untuk Tokenisasi, konversi, dan pembersihan memori Parser. import os os.getcwd()0 Contoh 16. Cara membaca file CSV tanpa menggunakan paket PandasUntuk mengimpor file CSV dengan cara python murni, Anda dapat mengirimkan perintah berikut.import os os.getcwd()1Anda juga dapat mengunduh dan memuat file CSV dari URL atau halaman web eksternal. import os os.getcwd()2 Catatan Akhir Setelah menyelesaikan tutorial ini, saya harap Anda mendapatkan kepercayaan untuk mengimpor file CSV ke Python dengan cara membersihkan dan mengelola file. Anda juga dapat melihat tutorial ini yang menjelaskan cara mengimpor file dengan format berbeda ke Python. Setelah selesai, Anda harus mempelajari cara melakukan manipulasi data umum atau tugas perselisihan seperti memfilter, memilih dan mengganti nama kolom, mengidentifikasi dan menghapus duplikat dll pada bingkai data pandaPelajari Python. 50 Tutorial Python Teratas Sebarkan Firman Pos terkait Tentang Penulis Deepanshu mendirikan ListenData dengan tujuan sederhana - Membuat analitik mudah dipahami dan diikuti. Dia memiliki lebih dari 10 tahun pengalaman dalam ilmu data. Selama masa jabatannya, dia telah bekerja dengan klien global di berbagai domain seperti Perbankan, Asuransi, Ekuitas Swasta, Telekomunikasi dan Sumber Daya Manusia Bagaimana cara mendapatkan nilai kolom dari CSV dengan python?Untuk membaca file csv dengan python, kita menggunakan metode read_csv() yang disediakan dalam modul panda . Metode read_csv() mengambil nama file csv sebagai argumen inputnya. Setelah eksekusi, metode read_csv() mengembalikan kerangka data yang berisi data file csv.
Bagaimana cara membaca nama kolom dari file CSV dengan python?Artikel ini membahas berbagai cara untuk mendapatkan nama kolom dari file CSV menggunakan Python. . Buka file CSV menggunakan DictReader Ubah file ini menjadi daftar Ubah baris pertama daftar menjadi kamus Panggil metode keys() kamus dan ubah menjadi daftar Menampilkan daftar |