Di Indonesia pun profesi ini sedang berkembang dengan cepat. Mengapa? Data science dapat membantu perusahaan menggali bermacam informasi, seperti perilaku konsumen, identifikasi selera pasar, efektifitas proses produksi, prediksi keuntungan perusahaan, dan masih banyak lagi, yang dapat digunakan untuk pengambilan keputusan yang lebih baik. Show Untuk itu, penting bagi kamu yang ingin meningkatkan keahlian atau bahkan berganti profesi untuk mempelajari Data Science. Apa yang Akan Dipelajari di Program Ini?Modul Analisis dan Visualisasi Data dengan Python ini adalah modul pembelajaran untuk Data Analyst bagi mereka yang berasal dari IT Track. Tujuan pembelajaran modul ini adalah sebagai berikut. Kali ini kita akan memvisualisasikan data dengan menggunakan Python. Sebelum itu perlu diketahui fungsi-fungsi pada library yang digunakan
Mari kita mulai, Buka lebar kerja Python, saya disini memakai Python versi 3.7.2 disarankan untuk tidak menggunakan versi terbaru. Import library yang sudah disebutkan diawal tadi kedalam lembar kerja, dengan menggunakan perintah: >>> import numpy as np Dibeberapa kasus, import Matplotlib sering terjadi error, jika tidak bisa install terlebih dahulu Matplotlib. jika ingin install Matplotlib untuk Python 3 lewat APT package manager, kamu membutuhkan package sudo apt-get install python3-matplotlib 2:sudo apt-get install python3-matplotlib jika ingin menggunakan install melalui Pip untuk Python 3, kamu perlu menggunakan sudo apt-get install python3-matplotlib 3:sudo pip3 install matplotlib Jika masih belum bisa, bisa install melalui salah satu perintah ini, python -mpip install -U pippython -mpip install -U matplotlib Kalau masih belum bisa juga, buka file directory C, dan ketikkan pip install matplotlib Box PlotBuat terlebih dahulu data pada lembar kerja Python Akomodasi = (20, 116, 61, 58, 64,9 ) Maka akan terlihat seperti berikut Sekarang setelah memiliki data untuk dikerjakan, Anda dapat menerapkan sudo apt-get install python3-matplotlib 4 untuk mendapatkan boxplot:fig, ax = plt.subplots()
Maka Box Plot yang terbentuk seperti gambar dibawah ini
Histogram sangat berguna ketika memiliki angka unik atau angka yang besar dalam dataset. Histogram membagi nilai dari dataset yang diurutkan ke dalam interval. Copy koding berikut kedalam Python >>> hist, bin_edges = np.histogram(Kamar, bins=10)
fig, ax = plt.subplots() Pie Charts Pie chart mewakili data dengan jumlah kecil dan memberikan frekuensi yang relatif. Pie chart tidak bisa digunakan jika data bejenis nominal. Akomodasi, Kamar, Bed= 359, 28585, 43315 Didapatkan pie chart seperti berikut, X-Y Plots atau Scatter Plot mewakili pasangan data dari dua set data. Sumbu x horisontal menunjukkan nilai dari himpunan x, sedangkan sumbu y vertikal menunjukkan nilai yang sesuai dari himpunan y. Anda dapat menyertakan garis regresi dan koefisien korelasi. Copy kodingan berikut kedalam Python: sudo apt-get install python3-matplotlib 0sudo pip3 install matplotlib 6 mengembalikan beberapa nilai. Anda membutuhkan sudo pip3 install matplotlib 7 dansudo pip3 install matplotlib 8 dari garis regresi, serta koefisien korelasisudo pip3 install matplotlib 9. Kemudian Anda bisa memasukkanpython -mpip install -U pippython -mpip install -U matplotlib0 untuk mendapatkan plot x-y : sudo apt-get install python3-matplotlib 1Hasilnya akan berbentuk seperti ini, Kotak merah merupakan (x-y) dan garis biru merupakan garis regresi. Dari plot dapat dilihat bahwa titik-titik mengikuti dan mendekati garis linear sehingga dapat disimpulkan bahwa data berasumsi berdistribusi normal. Namun dalam statistika diperlukan pengujian lebih lanjut untuk mendapatkan data berdistribusi normal atau tidak. Uji yang biasanya digunakan adalah uji Kolmogorov-Smirnov dan uji Shapiro-Wilk untuk memastikan model. Sekian hasil paparan materi yang dapat disampaikanTerima Kasih, Tamara Shafira Referensi: [1] Mirko Stojiljkovic, Python Statistics Fundamentals: How to Describe Your Data, https://realpython.com/python-statistics/ Apa yang dimaksud dengan visualisasi data?Menurut Tableau, visualisasi data atau data visualization adalah tampilan berupa grafis atau visual dari informasi dan data. Dengan kata lain, data visualization mengubah kumpulan data menjadi hal lebih sederhana untuk ditampilkan.
Apa yang termasuk visualisasi data?Dilansir dari SAS, visualisasi data adalah penyajian data dalam format grafis atau gambar. Dengan kata lain, ini adalah proses mengubah data hasil analisis menjadi gambaran visual berupa bagan, peta, grafik, dan banyak lainnya.
Apa kegunaan dari visualisasi data?Berikut adalah beberapa manfaat dari visualisasi data: Membantu untuk memahami cerita atau masalah dengan lebih baik. Menunjukkan insight yang bisa saja terlewatkan jika data ditampilkan dengan laporan tradisional. Membantu eksekutif bisnis untuk mengambil keputusan berdasarkan data, akurat, dan tepat.
|