Cara menggunakan python print columns

Tutorial ini adalah permulaan yang bisa kita pelajari apabila ingin mendalami tentang Data Science, terutama jika menggunakan python.

Langsung saja kita mulai.

  • Untuk tools (Text Editor) kita bebas dapat menggunakan apapun.
  • Pastikan kita telah membuat Virtual Environment untuk project kita.
  • Buat lah contoh seperti di bawah ini pada sebuah text editor dan simpan dengan ekstensi .csv

    id,name,salary,start_date,dept
    1,Siti,623.3,2012-01-01,IT
    2,Jono,515.2,2013-09-23,Operations
    3,Harto,611,2014-11-15,IT
    4,Sumarni,729,2014-05-11,HR
    5,Ningsih,843.25,2015-03-27,Finance
    6,Juminten,578,2013-05-21,IT
    7,Jarwo,632.8,2013-07-30,Operations
    8,Parmin,722.5,2014-06-17,Finance

  • Pastikan juga kita telah menguasai beberapa dasar python seperti
    import pandas as pd
    import numpy as np
    
    namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv')
    print(namaFile)
    7 dan
    import pandas as pd
    import numpy as np
    
    namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv')
    print(namaFile)
    8 dan sebagainya.

Ready? good.

kita akan membuat file dengan nama

import pandas as pd
import numpy as np

namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv')
print(namaFile)
9 dengan source code sebagai berikut:

import pandas as pd
import numpy as np

namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv')
print(namaFile)

Pada contoh di atas kita mengimport package yang bernama

   id      name  salary  start_date        dept
0   1      Siti  623.30  2012-01-01          IT
1   2      Jono  515.20  2013-09-23  Operations
2   3     Harto  611.00  2014-11-15          IT
3   4   Sumarni  729.00  2014-05-11          HR
4   5   Ningsih  843.25  2015-03-27     Finance
5   6  Juminten  578.00  2013-05-21          IT
6   7     Jarwo  632.80  2013-07-30  Operations
7   8    Parmin  722.50  2014-06-17     Finance
0 dan
   id      name  salary  start_date        dept
0   1      Siti  623.30  2012-01-01          IT
1   2      Jono  515.20  2013-09-23  Operations
2   3     Harto  611.00  2014-11-15          IT
3   4   Sumarni  729.00  2014-05-11          HR
4   5   Ningsih  843.25  2015-03-27     Finance
5   6  Juminten  578.00  2013-05-21          IT
6   7     Jarwo  632.80  2013-07-30  Operations
7   8    Parmin  722.50  2014-06-17     Finance
1.

Dan pada line berikutnya kita membuat sebuah variable

   id      name  salary  start_date        dept
0   1      Siti  623.30  2012-01-01          IT
1   2      Jono  515.20  2013-09-23  Operations
2   3     Harto  611.00  2014-11-15          IT
3   4   Sumarni  729.00  2014-05-11          HR
4   5   Ningsih  843.25  2015-03-27     Finance
5   6  Juminten  578.00  2013-05-21          IT
6   7     Jarwo  632.80  2013-07-30  Operations
7   8    Parmin  722.50  2014-06-17     Finance
2, kemudian memanggilnya menggunakan perintah
   id      name  salary  start_date        dept
0   1      Siti  623.30  2012-01-01          IT
1   2      Jono  515.20  2013-09-23  Operations
2   3     Harto  611.00  2014-11-15          IT
3   4   Sumarni  729.00  2014-05-11          HR
4   5   Ningsih  843.25  2015-03-27     Finance
5   6  Juminten  578.00  2013-05-21          IT
6   7     Jarwo  632.80  2013-07-30  Operations
7   8    Parmin  722.50  2014-06-17     Finance
3, adalah perintah default dari
   id      name  salary  start_date        dept
0   1      Siti  623.30  2012-01-01          IT
1   2      Jono  515.20  2013-09-23  Operations
2   3     Harto  611.00  2014-11-15          IT
3   4   Sumarni  729.00  2014-05-11          HR
4   5   Ningsih  843.25  2015-03-27     Finance
5   6  Juminten  578.00  2013-05-21          IT
6   7     Jarwo  632.80  2013-07-30  Operations
7   8    Parmin  722.50  2014-06-17     Finance
1 itu sendiri untuk memanggil sebuah file dengan ekstensi .csv. Selanjutnya kita memanggilkan dengan metode
   id      name  salary  start_date        dept
0   1      Siti  623.30  2012-01-01          IT
1   2      Jono  515.20  2013-09-23  Operations
2   3     Harto  611.00  2014-11-15          IT
3   4   Sumarni  729.00  2014-05-11          HR
4   5   Ningsih  843.25  2015-03-27     Finance
5   6  Juminten  578.00  2013-05-21          IT
6   7     Jarwo  632.80  2013-07-30  Operations
7   8    Parmin  722.50  2014-06-17     Finance
5 untuk menghasilkan output ketika kita melakukan execute.

Dan hasilnya apabila di eksesuki adalah sebagai berikut:

   id      name  salary  start_date        dept
0   1      Siti  623.30  2012-01-01          IT
1   2      Jono  515.20  2013-09-23  Operations
2   3     Harto  611.00  2014-11-15          IT
3   4   Sumarni  729.00  2014-05-11          HR
4   5   Ningsih  843.25  2015-03-27     Finance
5   6  Juminten  578.00  2013-05-21          IT
6   7     Jarwo  632.80  2013-07-30  Operations
7   8    Parmin  722.50  2014-06-17     Finance

See? we did it!.

Read Specific rows

Setelah kita berhasil mengeluarkan output seperti di atas, mari kita membuat sebuah output dengan hasil yang lebih spesifik dengan metode seperti berikut:

# tambahkan line code di bawah ini pada file ds.py
print(namaFile[:1])

lalu kita print ulang dan lihat hasilnya:

   id      name  salary  start_date        dept
0   1      Siti  623.30  2012-01-01          IT
1   2      Jono  515.20  2013-09-23  Operations
2   3     Harto  611.00  2014-11-15          IT
3   4   Sumarni  729.00  2014-05-11          HR
4   5   Ningsih  843.25  2015-03-27     Finance
5   6  Juminten  578.00  2013-05-21          IT
6   7     Jarwo  632.80  2013-07-30  Operations
7   8    Parmin  722.50  2014-06-17     Finance


# membaca specific rows
   id  name  salary  start_date dept
0   1  Rick   623.3  2012-01-01   IT

Pada table di atas kita memerintahkan pandas untuk mengeluarkan output 1 nama, dan hasil tersebut akan diambil dari urutan pertama / paling atas yaitu Rick.

Dan dikarenakan metode yang kita gunakan adalah

import pandas as pd
import numpy as np

namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv')
print(namaFile)
7, maka apabila kita ingin memunculkan nama lainnya secara berurutan dapat menggunakan metode seperti:

# tambahkan line code di bawah ini pada file ds.py
print(namaFile[:3])

Perintah di atas adalah kita ingin melihat hasil yang berurutan dimulai dari paling atas hingga row ketiga. Dan apabila di execute maka akan muncul:

   id      name  salary  start_date        dept
0   1      Siti  623.30  2012-01-01          IT
1   2      Jono  515.20  2013-09-23  Operations
2   3     Harto  611.00  2014-11-15          IT
3   4   Sumarni  729.00  2014-05-11          HR
4   5   Ningsih  843.25  2015-03-27     Finance
5   6  Juminten  578.00  2013-05-21          IT
6   7     Jarwo  632.80  2013-07-30  Operations
7   8    Parmin  722.50  2014-06-17     Finance


# membaca spesific rows
   id  name  salary  start_date        dept
0   1  Rick   623.3  2012-01-01          IT
1   2  Dick   515.2  2013-09-23  Operations
2   3  John   611.0  2014-11-15          IT

Apabila kita ingin membaca rows berdasarkan nama divisi / department maupun nama, gunakanlah perintah di bawah ini:

# kita akan mencoba membaca nama department pada csv file tersebut.
print(namaFile['dept'])

Pada baris perintah di atas kita menggunakan method

import pandas as pd
import numpy as np

namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv')
print(namaFile)
7 dan sebuah
   id      name  salary  start_date        dept
0   1      Siti  623.30  2012-01-01          IT
1   2      Jono  515.20  2013-09-23  Operations
2   3     Harto  611.00  2014-11-15          IT
3   4   Sumarni  729.00  2014-05-11          HR
4   5   Ningsih  843.25  2015-03-27     Finance
5   6  Juminten  578.00  2013-05-21          IT
6   7     Jarwo  632.80  2013-07-30  Operations
7   8    Parmin  722.50  2014-06-17     Finance
8 pada file tersebut.

Output:

   id      name  salary  start_date        dept
0   1      Siti  623.30  2012-01-01          IT
1   2      Jono  515.20  2013-09-23  Operations
2   3     Harto  611.00  2014-11-15          IT
3   4   Sumarni  729.00  2014-05-11          HR
4   5   Ningsih  843.25  2015-03-27     Finance
5   6  Juminten  578.00  2013-05-21          IT
6   7     Jarwo  632.80  2013-07-30  Operations
7   8    Parmin  722.50  2014-06-17     Finance

# menbaca spesific rows berdasarkan 'value'
 0            IT
1    Operations
2            IT
3            HR
4       Finance
5            IT
6    Operations
7       Finance
Name: dept, dtype: object

Maka hanya nama department lah yang akan muncul.

Read Specific Columns

Setelah rows, mari kita coba untuk membaca spesifik kolom yang ada pada file tersebut dengan menggunakan method:

print (namaFile.loc[:,['name', 'salary']])

Pada baris di atas kita menggunakan

   id      name  salary  start_date        dept
0   1      Siti  623.30  2012-01-01          IT
1   2      Jono  515.20  2013-09-23  Operations
2   3     Harto  611.00  2014-11-15          IT
3   4   Sumarni  729.00  2014-05-11          HR
4   5   Ningsih  843.25  2015-03-27     Finance
5   6  Juminten  578.00  2013-05-21          IT
6   7     Jarwo  632.80  2013-07-30  Operations
7   8    Parmin  722.50  2014-06-17     Finance
9 untuk mencari column yang lebih spesifik. Sedangkan
# tambahkan line code di bawah ini pada file ds.py
print(namaFile[:1])
0 adalah perintah untuk mencari dari awal hingga akhir file tersebut berada.

Dan output yang akan dihasilkan:

import pandas as pd
import numpy as np

namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv')
print(namaFile)
0

Kita berhasil membaca dua columns tersebut. Lalu bagaimana jika kita ingin membaca spesifik columns dan rows?

Read Specific Columns and Rows

Untuk membaca column dan rows yang lebih spesifik kita dapat menggunakan

   id      name  salary  start_date        dept
0   1      Siti  623.30  2012-01-01          IT
1   2      Jono  515.20  2013-09-23  Operations
2   3     Harto  611.00  2014-11-15          IT
3   4   Sumarni  729.00  2014-05-11          HR
4   5   Ningsih  843.25  2015-03-27     Finance
5   6  Juminten  578.00  2013-05-21          IT
6   7     Jarwo  632.80  2013-07-30  Operations
7   8    Parmin  722.50  2014-06-17     Finance
9 dan
import pandas as pd
import numpy as np

namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv')
print(namaFile)
7 seperti di bawah ini:

import pandas as pd
import numpy as np

namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv')
print(namaFile)
1

Pada table di atas kita menggunakan metode

# tambahkan line code di bawah ini pada file ds.py
print(namaFile[:1])
3 untuk mencari nama dan salary pegawai berdasarkan rows
# tambahkan line code di bawah ini pada file ds.py
print(namaFile[:1])
4 dan columns
# tambahkan line code di bawah ini pada file ds.py
print(namaFile[:1])
5 dan
# tambahkan line code di bawah ini pada file ds.py
print(namaFile[:1])
6.

Output:

import pandas as pd
import numpy as np

namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv')
print(namaFile)
2

See? kita berhasil membaca rows dan column yang lebih spesifik.

Read Specific Columns for a Range of Rows

Seperti halnya list yang telah kita pelajari kemarin, kita pun dapat membaca spesific columns pada range tertentu dengan menggunakan:

import pandas as pd
import numpy as np

namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv')
print(namaFile)
3

Pada baris tersebut kita ingin membaca dua column dan rows pada index ke-2 hingga 6 yang ada pada

   id      name  salary  start_date        dept
0   1      Siti  623.30  2012-01-01          IT
1   2      Jono  515.20  2013-09-23  Operations
2   3     Harto  611.00  2014-11-15          IT
3   4   Sumarni  729.00  2014-05-11          HR
4   5   Ningsih  843.25  2015-03-27     Finance
5   6  Juminten  578.00  2013-05-21          IT
6   7     Jarwo  632.80  2013-07-30  Operations
7   8    Parmin  722.50  2014-06-17     Finance
2 dengan method
# tambahkan line code di bawah ini pada file ds.py
print(namaFile[:1])
8.

import pandas as pd
import numpy as np

namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv')
print(namaFile)
4

Conclusion

Pada dasarnya, metode-metode di atas adalah adalah metode dasar pada python

import pandas as pd
import numpy as np

namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv')
print(namaFile)
7 seperti yang pernah kita pelajari sebelumnya. hanya saja cara penggunaannya yang berbeda dan sedikit tricky.

Karena perintah list dasar pun dapat kita gunakan, seperti:

import pandas as pd
import numpy as np

namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv')
print(namaFile)
5

Pada baris di atas kita ingin mencoba membalikkan / reverse method pada

   id      name  salary  start_date        dept
0   1      Siti  623.30  2012-01-01          IT
1   2      Jono  515.20  2013-09-23  Operations
2   3     Harto  611.00  2014-11-15          IT
3   4   Sumarni  729.00  2014-05-11          HR
4   5   Ningsih  843.25  2015-03-27     Finance
5   6  Juminten  578.00  2013-05-21          IT
6   7     Jarwo  632.80  2013-07-30  Operations
7   8    Parmin  722.50  2014-06-17     Finance


# membaca specific rows
   id  name  salary  start_date dept
0   1  Rick   623.3  2012-01-01   IT
0 file yang kita miliki.

Output:

import pandas as pd
import numpy as np

namaFile = pd.read_csv('/home/path/menuju/file/kita/sourcefile.csv')
print(namaFile)
6

That’s it!, Thanks for reading guys 😁.

Terima kasih sudah mau belajar bersama, apabila ada yang kurang jelas maupun keliru silahkan tinggalkan jejak di bawah ya guys, supaya nanti diperbaiki lagi.

3 function apa yang digunakan untuk melihat jumlah baris dan kolom dari suatu data frame?

Fungsi count() akan menampilkan nama kolom dan jumlah baris/record. Seperti yang ditampilkan, semua kolom memiliki jumlah record yang sama, yaitu 34. Ini juga berarti bahwa tidak ada nilai null di semua kolom.

Apa kegunaan Panda's?

Nah dalam hal ini Library Pandas berarti sebuah library open source yang ada pada bahasa pemrograman Python yang sering digunakan untuk memproses data, mulai pembersihan data, manipulasi data, hingga melakukan analisis data.

Apa itu Dataframe pada python?

Data frame merupakan tabel/data tabular dengan array dua dimensi yaitu baris dan kolom. Struktur data ini merupakan cara paling standar untuk menyimpan data. Setiap kolom pada data frame merupakan objek dari Series, dan baris terdiri dari elemen yang ada pada Series.

Untuk mengecek apakah sebuah Dataframe mengandung nilai NaN perintah yang digunakan adalah?

isna() digunakan untuk mengecek apakah ada nilai NaN pada dataframe. Function ini akan mengembalikan nilai Boolean, True atau False, untuk tiap elemen di dataframe. Kita juga dapat menambahkan function any() untuk mengecek nilai NaN berdasarkan kolom.