Cara menggunakan DATAFRAME.INDEX pada Python

Halo pembaca setia Codekey! Selamat datang di tutorial ke 15 bahasa pemrograman python yang akan membahas manipulasi data dengan menggunakan python pandas dataframe. Pandas dataframe adalah salah satu alat manipulasi data yang biasa digunakan dalam bahasa pemrograman python. Agar dapat memahami dan mengikuti materi kali ini jangan lewatkan tutorial-tutorial sebelumnya. Jika sudah, yuk simak penjelasan lengkapnya!

Pandas Data Frames pada Bahasa Pemrograman Python

Cara menggunakan DATAFRAME.INDEX pada Python

Dalam bahasa pemrograman python Pandas adalah packages pada python yang berfungsi untuk manipulasi data tingkat tinggi, dikembangkan oleh Wes McKinney. python pandas dibangun di atas paket Numpy dan struktur data kuncinya disebut dengan DataFrame. DataFrames memungkinkan Anda untuk menyimpan dan memanipulasi data tabular dalam baris observasi dan kolom variabel.

Ada beberapa cara untuk membuat Pandas DataFrame. Salah satu caranya adalah dengan menggunakan kamus. Contohnya dapat Anda lihat pada contoh di bawah ini:

dict = {"Negara": ["Brazil", "Russia", "India", "China", "South Africa"],
       "Ibukota": ["Brasilia", "Moscow", "New Dehli", "Beijing", "Pretoria"],
       "Luas": [8.516, 17.10, 3.286, 9.597, 1.221],
       "Populasi": [200.4, 143.5, 1252, 1357, 52.98] }

import pandas as pd
daftar = pd.DataFrame(dict)
print(daftar)

Seperti yang Anda lihat pada contoh di atas, dengan daftar Pandas DataFrame baru , Panda telah menetapkan kunci untuk setiap negara sebagai nilai numerik 0 hingga 4. Jika Anda ingin memiliki nilai indeks yang berbeda, misalnya, kode negara dua huruf, Anda juga dapat melakukannya dengan mudah dengan cara seperti sintaks di bawah ini:

# membuat index terbaru didalam index
daftar.index = ["BR", "RU", "IN", "CH", "SA"]

# Mencetak daftar dengan Penambahan index terbaru
print(daftar)

Selain cara di atas, Anda juga dapat membuatnya dengan cara berbeda. Cara lain untuk membuat DataFrame adalah dengan mengimpor file csv menggunakan Pandas. Sekarang, csv cars.csv disimpan dan dapat diimpor menggunakan pd.read_csv seperti sintaks di bawah ini:

# Import pandas as pd
import pandas as pd

# Import the cars.csv data: cars
cars = pd.read_csv('cars.csv')

# Print out cars
print(cars)

Cara Mengindeks Pandas dataFrames

Ada beberapa cara yang dapat Anda lakukan untuk mengindeks Pandas DataFrame. Salah satu cara termudah untuk melakukannya adalah dengan menggunakan notasi kurung siku.

Pada contoh di bawah ini, Anda dapat menggunakan tanda kurung siku untuk memilih satu kolom cars DataFrame. Anda dapat menggunakan braket tunggal atau braket ganda. Braket tunggal akan mengeluarkan Seri Pandas, sedangkan braket ganda akan mengeluarkan Pandas DataFrame. Perhatikan sintaks di bawah ini:

Artikel Terkait  Tutorial Python 16 : Mengenal Python Generators

# import packages pandas dan dokumen dengan nama cars
import pandas as pd
cars = pd.read_csv('cars.csv', index_col = 0)

# mencetak kolom country pada pandas series 
print(cars['cars_per_cap'])

# mencetak kolom country menggunakan pandas dataframe
print(cars[['cars_per_cap']])

# mencetak dataframe country dan kolom drives_right
print(cars[['cars_per_cap', 'country']])

Tanda kurung siku juga dapat digunakan untuk mengakses observasi (baris) dari DataFrame. Sebagai contoh dapat Anda lihat pada sintaks berikut:

# Import data cars
import pandas as pd
cars = pd.read_csv('cars.csv', index_col = 0)

# mencetak 4 observations pertama dalam data
print(cars[0:4])

# mencetal 5 dan 6 observations
print(cars[5:6])

Anda juga dapat menggunakan loc dan iloc untuk melakukan hampir semua operasi pemilihan data. Loc berbasis label, yang berarti Anda harus menentukan baris dan kolom berdasarkan label baris dan kolomnya. Iloc adalah berbasis indeks integer, jadi Anda harus menentukan baris dan kolom dengan indeks integernya seperti yang Anda lakukan pada latihan sebelumnya. Coba Anda perhatikan sintaks di bawah ini:

# mencetak data cars
import pandas as pd
cars = pd.read_csv('cars.csv', index_col = 0)

# mencetak observations pada jepang
print(cars.iloc[2])

# mencetak observations pada Australia dan mesir
print(cars.loc[['AUS', 'EG']]

Nah itulah tutorial bahasa pemrograman python ke 15 khusus untuk Anda. Pada tutorial ini Anda telah mempelajari cara melakukan manipulasi data dengan python pandas dataframe. Tutorial ini akan memudahkan Anda dalam menyimpan dan memanipulasi data, baik tabular maupun baris dan kolom observasi.

Data structure also contains labeled axes (rows and columns). Arithmetic operations align on both row and column labels. Can be thought of as a dict-like container for Series objects. The primary pandas data structure.

Parametersdatandarray (structured or homogeneous), Iterable, dict, or DataFrame

Dict can contain Series, arrays, constants, dataclass or list-like objects. If data is a dict, column order follows insertion-order. If a dict contains Series which have an index defined, it is aligned by its index.

Changed in version 0.25.0: If data is a list of dicts, column order follows insertion-order.

indexIndex or array-like

Index to use for resulting frame. Will default to RangeIndex if no indexing information part of input data and no index provided.

columnsIndex or array-like

Column labels to use for resulting frame when data does not have them, defaulting to RangeIndex(0, 1, 2, …, n). If data contains column labels, will perform column selection instead.

dtypedtype, default None

Data type to force. Only a single dtype is allowed. If None, infer.

copybool or None, default None

Copy data from inputs. For dict data, the default of None behaves like copy=True. For DataFrame or 2d ndarray input, the default of None behaves like copy=False. If data is a dict containing one or more Series (possibly of different dtypes), copy=False will ensure that these inputs are not copied.

Apa itu Dataframe pada Python?

Data frame merupakan tabel/data tabular dengan array dua dimensi yaitu baris dan kolom. Struktur data ini merupakan cara paling standar untuk menyimpan data. Setiap kolom pada data frame merupakan objek dari Series, dan baris terdiri dari elemen yang ada pada Series.

Apa itu ILOC pada Python?

Iloc merupakan kependekan dari index location. Sama seperti loc, digunakan untuk menyeleksi data pada lokasi tertentu saja.

Apa kegunaan info () yang merupakan built in function milik sebuah Pandas Dataframe?

info() digunakan untuk menampilkan informasi detail tentang dataframe, seperti jumlah baris data, nama-nama kolom berserta jumlah data dan tipe datanya, dan sebagainya.

Apa kegunaan dari Pandas?

Nah dalam hal ini Library Pandas berarti sebuah library open source yang ada pada bahasa pemrograman Python yang sering digunakan untuk memproses data, mulai pembersihan data, manipulasi data, hingga melakukan analisis data.