Cara menggunakan SIERIES pada Python

If nothing else is specified, the values are labeled with their index number. First value has index 0, second value has index 1 etc.

This label can be used to access a specified value.

Create Labels

With the index argument, you can name your own labels.

Example

Create your own labels:

import pandas as pd

a = [1, 7, 2]

myvar = pd.Series(a, index = ["x", "y", "z"])

print(myvar)

Try it Yourself »

When you have created labels, you can access an item by referring to the label.



Key/Value Objects as Series

You can also use a key/value object, like a dictionary, when creating a Series.

Example

Create a simple Pandas Series from a dictionary:

import pandas as pd

calories = {"day1": 420, "day2": 380, "day3": 390}

myvar = pd.Series(calories)

print(myvar)

Try it Yourself »

Note: The keys of the dictionary become the labels.

To select only some of the items in the dictionary, use the index argument and specify only the items you want to include in the Series.

Seorang data scientist sangat perlu menguasai beberapa skil untuk menyelesaikan proses analisah data secara efektif dan efisien. untuk itu kita memerlukan tool dengan fungsi masing-masing. Salah satu tools yang paling sering digunakan oleh data scientist adalah Pandas. Dalam bahasa pemrograman Python, Pandas adalah alat yang sangat berguna sebagai library yang mengatur tata letak sehingga mudah dicari secara intuitif.

Pandas adalah paket pada python open source yang paling sering dipakai untuk menganalisis data serta membangun sebuat machine learning. pandas dibuat berdasarkan satu package lain bernama numpy yang mendukung suatu arrays multidimensi. Sebagai salah satu paket kode python, Pandas juga dapat digunakan secara optimal dengan modul data science yang lain dalam python.

Awalnya, Pandas dikembangkan oleh Wes McKinney pada 2008 saat ia bekerja di AQR Capital Management. McKinney kemudian meyakinkan AQR untuk memperbolehkan pandas menjadi suatu open source. Library pandas juga berkembang dengan pesat hingga saat ini. Pengguna pandas dalam python sendiri sering kali muncul pada domain akademis hingga komersial, termasuk keuangan. Neurosciences, ekonomi, statistik, periklanan, analisis web dan lain sebagainya.

Cara kerja suatu pandas sangat menarik. Data berupa CSV,TSV,atau SQL diubah menjadi obyek python dengan rows dan column yang disebut sebagai data frame.Objek ini terlihat sangat mirip dengan tabel yang terdapat pada software stastistika seperti excel atau SPSS. Data yang sudah diolah akan sangat mudah dianalisis karena berbentuk suatu library.

Pandas umumnya memiliki dua struktur data yang berguna untuk memanipulasi data. Struktur tersebut adalah Series dan DataFrame. Pandas series merupakan suatu array satu dimensi yang dapat memegang data dari berbagai tipe, mulai dari integer, string, hingga python objek. Pandas series pada dasarnya sangat mirip dengan kolom pada sheet dalam excel. Untuk membuat pandas series biasanya pengguna akan memuat dataset dari storage yang sudah dibuat sebelumnya baik berupa database SQL,CSV, atau bahkan excel.

Pandas DataFrame sedikit berbeda karena merupakan struktur dua dimensi. Oleh karena itu data yang diproses akan disusun dalam bentuk tabel dengan rows dan column, Umumnya DataFrame terdiri atas tiga komponen penting: data, rows, dan column. Untuk membuat data frame biasanya pengguna akan membuat dataset dari storage yang sudah dibuat sebelumnya baik berupa database SQL,CSV, atau bahkan Excel.

Keunggulan Library Pandas


Seperti yang sudah dijelaskan sebelumnya, Pandas menjadi salah satu library yang paling sering dipakai oleh data scientist. Hal ini karena pandas dapat digunakan bersama dengan library lain dalam data science. Karena dibuat menggunakan Numpy artinya ada banyak struktur library yang digunakan di pandas. Selainitu data yang diproduksi oleh pandas sering kali digunakan sebagai input plotting functions untuk matplotlib, analisis statistik di Scipy serta algoritma machine learning dalam Sckit-learn.

Program library pandas sendiri dapat dijalankan menggunakan berbagai text editor, namun sangat disarankan untuk menggunakan jupyter notebook. hal ini disebabkan karena kemampuan jupyter untuk meng execute kode dari satu cell tertentu tanpa perlu dijalankan file secara keseluruhan, Selain itu jupyter juga menyediakan cara mudah untuk memvisualisasikan data frames dan plot yang dibuat oleh pandas.

Pandas Bisa Digunakan Untuk Apa Saja?


Ada banyak kegunaan pandas terutama dalam bidang data analysis yang membuntuhkan task repetitif dan memakan banyak waktu. Fungsi library Pandas antra lain:

1. Data Cleansing
2. Data fill
3. Normalisasi data
4. Visualisasi data
5. Penggabungan dan penyatuan data
6. Analisis statistik
7. Inspeksi data
8. Memuat dan menyimpan data

selain fungsi yang disebutkan diatas, Pandas juga memungkinkan penggunanya untuk membuat dataframe sekaligus melakukan analisis serta manipulasi dan penyimpan database. Pandas juga dapat dimanfaatkan untuk membersihkan dataset pada machine learning.

Tutorial Menginstall Pandas.


1. Menginstall Pandas

Pandas secara default tidak tersedia pada modul standar disaat pertama kali instalasi python dan kita diharuskan untuk melakukan instalasi dahulu sebelum menggunakan. Untuk dapat menginstall pandas,kita bisa menjalankan perintah dengan menggunakan pip ataupun bisa menggunakan Anaconda.

Dengan menggunakan pip:

pip install pandas

Dengan menggunakan library Anaconda,kita bisa menginstallnya dengan perintah berikutnya,

conda install pandas

jika sudah berhasil melakukan instalasi pandas,kita dapat menggunakannya untuk melakukan manipulasi data dengan cara modul import tersebut pada projek yang akan kita buat.

import pandas as pd
import numpy as np

2. Import Dataset ke Pandas Dataframe

Hal yang pertama perlu kita kuasai tentunta adalah bagaimana mengimport dataset ke dalam pandas dataframe. Seringkali dataset untuk data science project hadir dalam format.csv. cara mengimportnya sebagai berikut.

Apa perbedaan Series dengan DataFrame?

Series diibaratkan sebagai array satu dimensi sama halnya dengan numpy array, hanya bedanya mempunyai index dan kita dapat mengontrol index dari setiap elemen tersebut. Sedangkan data frame merupakan array dua dimensi dengan baris dan kolom.

Apa itu series pandas?

Struktur tersebut adalah Series dan DataFrame. Pandas Series merupakan array satu dimensi yang dapat memegang data dari berbagai tipe, mulai dari integer, string, hingga Python object. Pandas Series pada dasarnya sangat mirip dengan kolom pada Sheet dalam Excel.

Apa kegunaan Panda's?

Nah dalam hal ini Library Pandas berarti sebuah library open source yang ada pada bahasa pemrograman Python yang sering digunakan untuk memproses data, mulai pembersihan data, manipulasi data, hingga melakukan analisis data.

Apa itu data frame dalam Python?

Dataframe merupakan tabel atau data tabular dengan array dua dimensi yaitu baris dan kolom. Struktur data ini merupakan cara paling standar untuk menyimpan data. Setiap kolom pada dataframe merupakan objek dari Series, dan baris terdiri dari elemen yang ada pada Series.