Python csv temukan nilai di kolom

Lihat jenis kolom data yang kami impor. first_name dan company adalah variabel karakter. Variabel yang tersisa adalah variabel numerik

ID             int64
first_name    object
company       object
salary         int64

Contoh 2. Baca file CSV dengan header di baris kedua

Misalkan Anda memiliki nama kolom atau variabel di baris kedua. Untuk membaca file CSV semacam ini, Anda dapat mengirimkan perintah berikut.
mydata = pd.read_csv("workingfile.csv", header = 1)
import os
os.getcwd()
9 memberitahu python untuk memilih header dari baris kedua. Ini mengatur baris kedua sebagai tajuk. Itu bukan contoh yang realistis. Saya hanya menggunakannya untuk ilustrasi sehingga Anda mendapatkan ide bagaimana menyelesaikannya. Agar praktis, Anda dapat menambahkan nilai acak di baris pertama file CSV, lalu mengimpornya lagi.
dt = {'ID': [11, 12, 13, 14, 15],
            'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'],
            'company': ['Aon', 'TCS', 'Google', 'RBS', '.'],
            'salary': [74, 76, 96, 71, 78]}
mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])
0

Tentukan nama kolom Anda sendiri, bukan baris tajuk dari file CSV

dt = {'ID': [11, 12, 13, 14, 15],
            'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'],
            'company': ['Aon', 'TCS', 'Google', 'RBS', '.'],
            'salary': [74, 76, 96, 71, 78]}
mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])
1skiprows = 1 berarti kita mengabaikan baris pertama dan nama= opsi digunakan untuk menetapkan nama variabel secara manual.
dt = {'ID': [11, 12, 13, 14, 15],
            'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'],
            'company': ['Aon', 'TCS', 'Google', 'RBS', '.'],
            'salary': [74, 76, 96, 71, 78]}
mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])
2

Contoh 3. Lewati baris tetapi pertahankan tajuk

dt = {'ID': [11, 12, 13, 14, 15],
            'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'],
            'company': ['Aon', 'TCS', 'Google', 'RBS', '.'],
            'salary': [74, 76, 96, 71, 78]}
mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])
3Dalam hal ini, kita melewatkan baris kedua dan ketiga saat mengimpor. Jangan lupa indeks dimulai dari 0 dengan python jadi 0 merujuk ke baris pertama dan 1 merujuk ke baris kedua dan 2 menyiratkan baris ketiga.
dt = {'ID': [11, 12, 13, 14, 15],
            'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'],
            'company': ['Aon', 'TCS', 'Google', 'RBS', '.'],
            'salary': [74, 76, 96, 71, 78]}
mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])
_4

Alih-alih [1,2] Anda juga dapat menulis

os.chdir("C:\\Users\\DELL\\Documents\\")
0. Keduanya berarti hal yang sama tetapi fungsi range() sangat berguna ketika Anda ingin melewatkan banyak baris sehingga menghemat waktu untuk menentukan posisi baris secara manual

Rahasia tersembunyi dari opsi skiprows

Ketika skiprows = 4, itu berarti melewatkan empat baris dari atas. skiprows=[1,2,3,4] berarti melompati baris dari urutan kedua hingga kelima. Itu karena ketika daftar ditentukan dalam opsi skiprows=, itu melompati baris pada posisi indeks. Ketika satu nilai bilangan bulat ditentukan dalam opsi, opsi tersebut akan dianggap melewatkan baris tersebut dari atas

Contoh 4. Baca file CSV tanpa baris header

Jika Anda menentukan "header = None", python akan menetapkan serangkaian angka mulai dari 0 hingga (jumlah kolom - 1) sebagai nama kolom. Dalam datafile ini, kami memiliki nama kolom di baris pertama.
dt = {'ID': [11, 12, 13, 14, 15],
            'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'],
            'company': ['Aon', 'TCS', 'Google', 'RBS', '.'],
            'salary': [74, 76, 96, 71, 78]}
mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])
5Lihat keluaran yang ditampilkan di bawah-
Python csv temukan nilai di kolom
Keluaran

Tambahkan awalan ke nama kolom

dt = {'ID': [11, 12, 13, 14, 15],
            'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'],
            'company': ['Aon', 'TCS', 'Google', 'RBS', '.'],
            'salary': [74, 76, 96, 71, 78]}
mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])
6Dalam hal ini, kami menetapkan
os.chdir("C:\\Users\\DELL\\Documents\\")
1 sebagai awalan yang memberi tahu python untuk memasukkan kata kunci ini sebelum setiap nama kolom.
dt = {'ID': [11, 12, 13, 14, 15],
            'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'],
            'company': ['Aon', 'TCS', 'Google', 'RBS', '.'],
            'salary': [74, 76, 96, 71, 78]}
mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])
_7

Contoh 5. Tentukan nilai yang hilang

Opsi
os.chdir("C:\\Users\\DELL\\Documents\\")
2 digunakan untuk menetapkan beberapa nilai sebagai nilai kosong/hilang saat mengimpor file CSV.
dt = {'ID': [11, 12, 13, 14, 15],
            'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'],
            'company': ['Aon', 'TCS', 'Google', 'RBS', '.'],
            'salary': [74, 76, 96, 71, 78]}
mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])
8
dt = {'ID': [11, 12, 13, 14, 15],
            'first_name': ['David', 'Jamie', 'Steve', 'Stevart', 'John'],
            'company': ['Aon', 'TCS', 'Google', 'RBS', '.'],
            'salary': [74, 76, 96, 71, 78]}
mydt = pd.DataFrame(dt, columns = ['ID', 'first_name', 'company', 'salary'])
9

Contoh 6. Tetapkan Kolom Indeks

  ID first_name company  salary
0  11      David     Aon      74
1  12      Jamie     TCS      76
2  13      Steve  Google      96
3  14    Stevart     RBS      71
4  15       John       .      78
0
  ID first_name company  salary
0  11      David     Aon      74
1  12      Jamie     TCS      76
2  13      Steve  Google      96
3  14    Stevart     RBS      71
4  15       John       .      78
1Seperti yang Anda lihat pada output di atas, ID kolom telah ditetapkan sebagai kolom indeks

Contoh 7. Baca File CSV dari URL Eksternal

Anda bisa langsung membaca data dari file CSV yang tersimpan di link web. Ini sangat berguna saat Anda perlu memuat kumpulan data yang tersedia untuk umum dari github, kaggle, dan situs web lainnya.
  ID first_name company  salary
0  11      David     Aon      74
1  12      Jamie     TCS      76
2  13      Steve  Google      96
3  14    Stevart     RBS      71
4  15       John       .      78
2DataFrame ini berisi 2311 baris dan 8 kolom. Menggunakan
os.chdir("C:\\Users\\DELL\\Documents\\")
_3, Anda dapat membuat ringkasan ini

Contoh 8. Lewati 5 Baris Terakhir Saat Mengimpor CSV

  ID first_name company  salary
0  11      David     Aon      74
1  12      Jamie     TCS      76
2  13      Steve  Google      96
3  14    Stevart     RBS      71
4  15       John       .      78
3Dalam kode di atas, kami mengecualikan 5 baris terbawah menggunakan parameter skip_footer=

Contoh 9. Baca hanya 5 baris pertama

  ID first_name company  salary
0  11      David     Aon      74
1  12      Jamie     TCS      76
2  13      Steve  Google      96
3  14    Stevart     RBS      71
4  15       John       .      78
4Menggunakan opsi nrows=, Anda dapat memuat jumlah baris K teratas

Contoh 10. Menafsirkan "," sebagai pemisah ribuan

  ID first_name company  salary
0  11      David     Aon      74
1  12      Jamie     TCS      76
2  13      Steve  Google      96
3  14    Stevart     RBS      71
4  15       John       .      78
_5

Contoh 11. Baca hanya kolom tertentu

  ID first_name company  salary
0  11      David     Aon      74
1  12      Jamie     TCS      76
2  13      Steve  Google      96
3  14    Stevart     RBS      71
4  15       John       .      78
6Kode di atas hanya membaca kolom berdasarkan posisi indeks yaitu posisi kedua, keenam dan kedelapan

Contoh 12. Baca beberapa baris dan kolom

  ID first_name company  salary
0  11      David     Aon      74
1  12      Jamie     TCS      76
2  13      Steve  Google      96
3  14    Stevart     RBS      71
4  15       John       .      78
7Dalam perintah di atas, kami telah menggabungkan opsi usecols= dan nrows=. Ini hanya akan memilih 5 baris pertama dan kolom yang dipilih

Contoh 13. Baca file dengan pembatas titik koma

  ID first_name company  salary
0  11      David     Aon      74
1  12      Jamie     TCS      76
2  13      Steve  Google      96
3  14    Stevart     RBS      71
4  15       John       .      78
8Menggunakan parameter sep= dalam fungsi read_csv( ), Anda dapat mengimpor file dengan pembatas apa pun selain koma default. Dalam hal ini, kami menggunakan titik koma sebagai pemisah

Contoh 14. Ubah jenis kolom saat mengimpor CSV

Misalkan Anda ingin mengubah format kolom dari int64 ke float64 sambil memuat file CSV ke Python. Kita dapat menggunakan opsi dtype = untuk hal yang sama.
  ID first_name company  salary
0  11      David     Aon      74
1  12      Jamie     TCS      76
2  13      Steve  Google      96
3  14    Stevart     RBS      71
4  15       John       .      78
_9

Contoh 15. Ukur waktu yang dibutuhkan untuk mengimpor file CSV besar

Dengan menggunakan
os.chdir("C:\\Users\\DELL\\Documents\\")
4, Anda dapat mencatat waktu yang dibutuhkan untuk Tokenisasi, konversi, dan pembersihan memori Parser.
import os
os.getcwd()
0

Contoh 16. Cara membaca file CSV tanpa menggunakan paket Pandas

Untuk mengimpor file CSV dengan cara python murni, Anda dapat mengirimkan perintah berikut.
import os
os.getcwd()
1Anda juga dapat mengunduh dan memuat file CSV dari URL atau halaman web eksternal.
import os
os.getcwd()
2

Catatan Akhir

Setelah menyelesaikan tutorial ini, saya harap Anda mendapatkan kepercayaan untuk mengimpor file CSV ke Python dengan cara membersihkan dan mengelola file. Anda juga dapat melihat tutorial ini yang menjelaskan cara mengimpor file dengan format berbeda ke Python. Setelah selesai, Anda harus mempelajari cara melakukan manipulasi data umum atau tugas perselisihan seperti memfilter, memilih dan mengganti nama kolom, mengidentifikasi dan menghapus duplikat dll pada bingkai data panda

Python csv temukan nilai di kolom

Pelajari Python. 50 Tutorial Python Teratas

Sebarkan Firman
Bagikan Bagikan Tweet Berlangganan

Pos terkait

Tentang Penulis

Python csv temukan nilai di kolom

Deepanshu mendirikan ListenData dengan tujuan sederhana - Membuat analitik mudah dipahami dan diikuti. Dia memiliki lebih dari 10 tahun pengalaman dalam ilmu data. Selama masa jabatannya, dia telah bekerja dengan klien global di berbagai domain seperti Perbankan, Asuransi, Ekuitas Swasta, Telekomunikasi dan Sumber Daya Manusia

Bagaimana cara mendapatkan nilai kolom dari CSV dengan python?

Untuk membaca file csv dengan python, kita menggunakan metode read_csv() yang disediakan dalam modul panda . Metode read_csv() mengambil nama file csv sebagai argumen inputnya. Setelah eksekusi, metode read_csv() mengembalikan kerangka data yang berisi data file csv.

Bagaimana cara membaca nama kolom dari file CSV dengan python?

Artikel ini membahas berbagai cara untuk mendapatkan nama kolom dari file CSV menggunakan Python. .
Buka file CSV menggunakan DictReader
Ubah file ini menjadi daftar
Ubah baris pertama daftar menjadi kamus
Panggil metode keys() kamus dan ubah menjadi daftar
Menampilkan daftar