Cara menggunakan python print columns

Tutorial ini adalah permulaan yang bisa kita pelajari apabila ingin mendalami tentang Data Science, terutama jika menggunakan python.

Langsung saja kita mulai.

  • Untuk tools (Text Editor) kita bebas dapat menggunakan apapun.
  • Pastikan kita telah membuat Virtual Environment untuk project kita.
  • Buat lah contoh seperti di bawah ini pada sebuah text editor dan simpan dengan ekstensi .csv

    id,name,salary,start_date,dept 1,Siti,623.3,2012-01-01,IT 2,Jono,515.2,2013-09-23,Operations 3,Harto,611,2014-11-15,IT 4,Sumarni,729,2014-05-11,HR 5,Ningsih,843.25,2015-03-27,Finance 6,Juminten,578,2013-05-21,IT 7,Jarwo,632.8,2013-07-30,Operations 8,Parmin,722.5,2014-06-17,Finance

  • Pastikan juga kita telah menguasai beberapa dasar python seperti import pandas as pd import numpy as np namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv') print(namaFile)7 dan import pandas as pd import numpy as np namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv') print(namaFile)8 dan sebagainya.

Ready? good.

kita akan membuat file dengan nama import pandas as pd import numpy as np namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv') print(namaFile)9 dengan source code sebagai berikut:

import pandas as pd import numpy as np namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv') print(namaFile)

Pada contoh di atas kita mengimport package yang bernama id name salary start_date dept 0 1 Siti 623.30 2012-01-01 IT 1 2 Jono 515.20 2013-09-23 Operations 2 3 Harto 611.00 2014-11-15 IT 3 4 Sumarni 729.00 2014-05-11 HR 4 5 Ningsih 843.25 2015-03-27 Finance 5 6 Juminten 578.00 2013-05-21 IT 6 7 Jarwo 632.80 2013-07-30 Operations 7 8 Parmin 722.50 2014-06-17 Finance0 dan id name salary start_date dept 0 1 Siti 623.30 2012-01-01 IT 1 2 Jono 515.20 2013-09-23 Operations 2 3 Harto 611.00 2014-11-15 IT 3 4 Sumarni 729.00 2014-05-11 HR 4 5 Ningsih 843.25 2015-03-27 Finance 5 6 Juminten 578.00 2013-05-21 IT 6 7 Jarwo 632.80 2013-07-30 Operations 7 8 Parmin 722.50 2014-06-17 Finance1.

Dan pada line berikutnya kita membuat sebuah variable id name salary start_date dept 0 1 Siti 623.30 2012-01-01 IT 1 2 Jono 515.20 2013-09-23 Operations 2 3 Harto 611.00 2014-11-15 IT 3 4 Sumarni 729.00 2014-05-11 HR 4 5 Ningsih 843.25 2015-03-27 Finance 5 6 Juminten 578.00 2013-05-21 IT 6 7 Jarwo 632.80 2013-07-30 Operations 7 8 Parmin 722.50 2014-06-17 Finance2, kemudian memanggilnya menggunakan perintah id name salary start_date dept 0 1 Siti 623.30 2012-01-01 IT 1 2 Jono 515.20 2013-09-23 Operations 2 3 Harto 611.00 2014-11-15 IT 3 4 Sumarni 729.00 2014-05-11 HR 4 5 Ningsih 843.25 2015-03-27 Finance 5 6 Juminten 578.00 2013-05-21 IT 6 7 Jarwo 632.80 2013-07-30 Operations 7 8 Parmin 722.50 2014-06-17 Finance3, adalah perintah default dari id name salary start_date dept 0 1 Siti 623.30 2012-01-01 IT 1 2 Jono 515.20 2013-09-23 Operations 2 3 Harto 611.00 2014-11-15 IT 3 4 Sumarni 729.00 2014-05-11 HR 4 5 Ningsih 843.25 2015-03-27 Finance 5 6 Juminten 578.00 2013-05-21 IT 6 7 Jarwo 632.80 2013-07-30 Operations 7 8 Parmin 722.50 2014-06-17 Finance1 itu sendiri untuk memanggil sebuah file dengan ekstensi .csv. Selanjutnya kita memanggilkan dengan metode id name salary start_date dept 0 1 Siti 623.30 2012-01-01 IT 1 2 Jono 515.20 2013-09-23 Operations 2 3 Harto 611.00 2014-11-15 IT 3 4 Sumarni 729.00 2014-05-11 HR 4 5 Ningsih 843.25 2015-03-27 Finance 5 6 Juminten 578.00 2013-05-21 IT 6 7 Jarwo 632.80 2013-07-30 Operations 7 8 Parmin 722.50 2014-06-17 Finance5 untuk menghasilkan output ketika kita melakukan execute.

Dan hasilnya apabila di eksesuki adalah sebagai berikut:

id name salary start_date dept 0 1 Siti 623.30 2012-01-01 IT 1 2 Jono 515.20 2013-09-23 Operations 2 3 Harto 611.00 2014-11-15 IT 3 4 Sumarni 729.00 2014-05-11 HR 4 5 Ningsih 843.25 2015-03-27 Finance 5 6 Juminten 578.00 2013-05-21 IT 6 7 Jarwo 632.80 2013-07-30 Operations 7 8 Parmin 722.50 2014-06-17 Finance

See? we did it!.

Read Specific rows

Setelah kita berhasil mengeluarkan output seperti di atas, mari kita membuat sebuah output dengan hasil yang lebih spesifik dengan metode seperti berikut:

# tambahkan line code di bawah ini pada file ds.py print(namaFile[:1])

lalu kita print ulang dan lihat hasilnya:

id name salary start_date dept 0 1 Siti 623.30 2012-01-01 IT 1 2 Jono 515.20 2013-09-23 Operations 2 3 Harto 611.00 2014-11-15 IT 3 4 Sumarni 729.00 2014-05-11 HR 4 5 Ningsih 843.25 2015-03-27 Finance 5 6 Juminten 578.00 2013-05-21 IT 6 7 Jarwo 632.80 2013-07-30 Operations 7 8 Parmin 722.50 2014-06-17 Finance # membaca specific rows id name salary start_date dept 0 1 Rick 623.3 2012-01-01 IT

Pada table di atas kita memerintahkan pandas untuk mengeluarkan output 1 nama, dan hasil tersebut akan diambil dari urutan pertama / paling atas yaitu Rick.

Dan dikarenakan metode yang kita gunakan adalah import pandas as pd import numpy as np namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv') print(namaFile)7, maka apabila kita ingin memunculkan nama lainnya secara berurutan dapat menggunakan metode seperti:

# tambahkan line code di bawah ini pada file ds.py print(namaFile[:3])

Perintah di atas adalah kita ingin melihat hasil yang berurutan dimulai dari paling atas hingga row ketiga. Dan apabila di execute maka akan muncul:

id name salary start_date dept 0 1 Siti 623.30 2012-01-01 IT 1 2 Jono 515.20 2013-09-23 Operations 2 3 Harto 611.00 2014-11-15 IT 3 4 Sumarni 729.00 2014-05-11 HR 4 5 Ningsih 843.25 2015-03-27 Finance 5 6 Juminten 578.00 2013-05-21 IT 6 7 Jarwo 632.80 2013-07-30 Operations 7 8 Parmin 722.50 2014-06-17 Finance # membaca spesific rows id name salary start_date dept 0 1 Rick 623.3 2012-01-01 IT 1 2 Dick 515.2 2013-09-23 Operations 2 3 John 611.0 2014-11-15 IT

Apabila kita ingin membaca rows berdasarkan nama divisi / department maupun nama, gunakanlah perintah di bawah ini:

# kita akan mencoba membaca nama department pada csv file tersebut. print(namaFile['dept'])

Pada baris perintah di atas kita menggunakan method import pandas as pd import numpy as np namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv') print(namaFile)7 dan sebuah id name salary start_date dept 0 1 Siti 623.30 2012-01-01 IT 1 2 Jono 515.20 2013-09-23 Operations 2 3 Harto 611.00 2014-11-15 IT 3 4 Sumarni 729.00 2014-05-11 HR 4 5 Ningsih 843.25 2015-03-27 Finance 5 6 Juminten 578.00 2013-05-21 IT 6 7 Jarwo 632.80 2013-07-30 Operations 7 8 Parmin 722.50 2014-06-17 Finance8 pada file tersebut.

Output:

id name salary start_date dept 0 1 Siti 623.30 2012-01-01 IT 1 2 Jono 515.20 2013-09-23 Operations 2 3 Harto 611.00 2014-11-15 IT 3 4 Sumarni 729.00 2014-05-11 HR 4 5 Ningsih 843.25 2015-03-27 Finance 5 6 Juminten 578.00 2013-05-21 IT 6 7 Jarwo 632.80 2013-07-30 Operations 7 8 Parmin 722.50 2014-06-17 Finance # menbaca spesific rows berdasarkan 'value' 0 IT 1 Operations 2 IT 3 HR 4 Finance 5 IT 6 Operations 7 Finance Name: dept, dtype: object

Maka hanya nama department lah yang akan muncul.

Read Specific Columns

Setelah rows, mari kita coba untuk membaca spesifik kolom yang ada pada file tersebut dengan menggunakan method:

print (namaFile.loc[:,['name', 'salary']])

Pada baris di atas kita menggunakan id name salary start_date dept 0 1 Siti 623.30 2012-01-01 IT 1 2 Jono 515.20 2013-09-23 Operations 2 3 Harto 611.00 2014-11-15 IT 3 4 Sumarni 729.00 2014-05-11 HR 4 5 Ningsih 843.25 2015-03-27 Finance 5 6 Juminten 578.00 2013-05-21 IT 6 7 Jarwo 632.80 2013-07-30 Operations 7 8 Parmin 722.50 2014-06-17 Finance9 untuk mencari column yang lebih spesifik. Sedangkan # tambahkan line code di bawah ini pada file ds.py print(namaFile[:1])0 adalah perintah untuk mencari dari awal hingga akhir file tersebut berada.

Dan output yang akan dihasilkan:

import pandas as pd import numpy as np namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv') print(namaFile)0

Kita berhasil membaca dua columns tersebut. Lalu bagaimana jika kita ingin membaca spesifik columns dan rows?

Read Specific Columns and Rows

Untuk membaca column dan rows yang lebih spesifik kita dapat menggunakan id name salary start_date dept 0 1 Siti 623.30 2012-01-01 IT 1 2 Jono 515.20 2013-09-23 Operations 2 3 Harto 611.00 2014-11-15 IT 3 4 Sumarni 729.00 2014-05-11 HR 4 5 Ningsih 843.25 2015-03-27 Finance 5 6 Juminten 578.00 2013-05-21 IT 6 7 Jarwo 632.80 2013-07-30 Operations 7 8 Parmin 722.50 2014-06-17 Finance9 dan import pandas as pd import numpy as np namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv') print(namaFile)7 seperti di bawah ini:

import pandas as pd import numpy as np namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv') print(namaFile)1

Pada table di atas kita menggunakan metode # tambahkan line code di bawah ini pada file ds.py print(namaFile[:1])3 untuk mencari nama dan salary pegawai berdasarkan rows # tambahkan line code di bawah ini pada file ds.py print(namaFile[:1])4 dan columns # tambahkan line code di bawah ini pada file ds.py print(namaFile[:1])5 dan # tambahkan line code di bawah ini pada file ds.py print(namaFile[:1])6.

Output:

import pandas as pd import numpy as np namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv') print(namaFile)2

See? kita berhasil membaca rows dan column yang lebih spesifik.

Read Specific Columns for a Range of Rows

Seperti halnya list yang telah kita pelajari kemarin, kita pun dapat membaca spesific columns pada range tertentu dengan menggunakan:

import pandas as pd import numpy as np namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv') print(namaFile)3

Pada baris tersebut kita ingin membaca dua column dan rows pada index ke-2 hingga 6 yang ada pada id name salary start_date dept 0 1 Siti 623.30 2012-01-01 IT 1 2 Jono 515.20 2013-09-23 Operations 2 3 Harto 611.00 2014-11-15 IT 3 4 Sumarni 729.00 2014-05-11 HR 4 5 Ningsih 843.25 2015-03-27 Finance 5 6 Juminten 578.00 2013-05-21 IT 6 7 Jarwo 632.80 2013-07-30 Operations 7 8 Parmin 722.50 2014-06-17 Finance2 dengan method # tambahkan line code di bawah ini pada file ds.py print(namaFile[:1])8.

import pandas as pd import numpy as np namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv') print(namaFile)4

Conclusion

Pada dasarnya, metode-metode di atas adalah adalah metode dasar pada python import pandas as pd import numpy as np namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv') print(namaFile)7 seperti yang pernah kita pelajari sebelumnya. hanya saja cara penggunaannya yang berbeda dan sedikit tricky.

Karena perintah list dasar pun dapat kita gunakan, seperti:

import pandas as pd import numpy as np namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv') print(namaFile)5

Pada baris di atas kita ingin mencoba membalikkan / reverse method pada id name salary start_date dept 0 1 Siti 623.30 2012-01-01 IT 1 2 Jono 515.20 2013-09-23 Operations 2 3 Harto 611.00 2014-11-15 IT 3 4 Sumarni 729.00 2014-05-11 HR 4 5 Ningsih 843.25 2015-03-27 Finance 5 6 Juminten 578.00 2013-05-21 IT 6 7 Jarwo 632.80 2013-07-30 Operations 7 8 Parmin 722.50 2014-06-17 Finance # membaca specific rows id name salary start_date dept 0 1 Rick 623.3 2012-01-01 IT0 file yang kita miliki.

Output:

import pandas as pd import numpy as np namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv') print(namaFile)6

That’s it!, Thanks for reading guys 😁.

Terima kasih sudah mau belajar bersama, apabila ada yang kurang jelas maupun keliru silahkan tinggalkan jejak di bawah ya guys, supaya nanti diperbaiki lagi.

3 function apa yang digunakan untuk melihat jumlah baris dan kolom dari suatu data frame?

Fungsi count() akan menampilkan nama kolom dan jumlah baris/record. Seperti yang ditampilkan, semua kolom memiliki jumlah record yang sama, yaitu 34. Ini juga berarti bahwa tidak ada nilai null di semua kolom.

Apa kegunaan Panda's?

Nah dalam hal ini Library Pandas berarti sebuah library open source yang ada pada bahasa pemrograman Python yang sering digunakan untuk memproses data, mulai pembersihan data, manipulasi data, hingga melakukan analisis data.

Apa itu Dataframe pada python?

Data frame merupakan tabel/data tabular dengan array dua dimensi yaitu baris dan kolom. Struktur data ini merupakan cara paling standar untuk menyimpan data. Setiap kolom pada data frame merupakan objek dari Series, dan baris terdiri dari elemen yang ada pada Series.

Untuk mengecek apakah sebuah Dataframe mengandung nilai NaN perintah yang digunakan adalah?

isna() digunakan untuk mengecek apakah ada nilai NaN pada dataframe. Function ini akan mengembalikan nilai Boolean, True atau False, untuk tiap elemen di dataframe. Kita juga dapat menambahkan function any() untuk mengecek nilai NaN berdasarkan kolom.

Postingan terbaru

LIHAT SEMUA