Cara menggunakan KNN pada Python

Question

Beberapa istilah terkadang membuat rancu seperti data mining, machine learning, dan deep learning. Wajar saja karena ketiganya masih dalam induk yang sama, yaitu data mining yang bermain dengan data yang akan dilatih/ditraining. Deep learning merupakan machine learning yang mengkhususkan diri dengan satu metode yaitu jaringan syaraf tiruan (neural network). Machine learning merupakan salah satu metode dalam data mining yang mengkhususkan diri dengan beragam metode untuk melatih data sehingga mampu digunakan sebagai mesin inferensi/prediksi maupun klasterisasi. Salah satu metode klasik yang mudah dimengerti adalah KNN. Metode ini berprinsip, suatu data akan menjadi anggota data lain jika di sekelilingnya kebanyakan anggota data tersebut.

Table of Contents Show

Data Bunga Iris
Langkah-langkah Melakukan Klasifikasi kNN dengan Python
1) Impor Data
2) Pisahkan Data Menjadi Data Pelatihan dan Pengujian
3) Proses Pelatihan Data dengan Klasifikasi kNN
4) Melihat Skor Akurasi Model Klasifikasi Klasifikasi kNN
5) Contoh cara membuat prediksi
Langkah langkah metode KNN?
Algoritma KNN digunakan untuk apa?
Apa itu klasifikasi KNN?
Apa itu nilai k pada KNN?

Scikit Learn

Para pengembang dan peneliti dengan menggunakan bahasa Python bersama-sama membuat library untuk pengguna machine learning. Library tersebut dibuat dengan format kelas yang berisi metode/fungsi seperti fitting, predicting, dan juga alat untuk mengukur akurasi. Kode sumber dapat diakses dengan mudah sehingga memudahkan Anda yang mendapat tugas memodifikasi metode.

Untuk praktek menerapkan KNN dengan library dari Scikit Learn, Google Colab merupakan pilihan yang praktis karena hanya bermodalkan browser dengan koneksi internet saja. Berikut kode yang terdiri dari impor library, ambil data, training data dan validasi. Terakhir menggunakan fungsi prediksi pada library untuk memprediksi kelas suatu data. Untuk pemula ada baiknya Anda ketik sendiri untuk melatih keterampilan serta alur logika memrogram.

#Impor pustaka
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score
from sklearn.metrics import classification_report
#Mengambil data dari file csv
datasiswa=pd.read_csv('beasiswa.csv')
df=pd.DataFrame(datasiswa,columns=['Mahasiswa','IPK','Tingkat Kemiskinan (TM)','Beasiswa/Tidak'])
X=np.asarray(datasiswa)
x_train=X[:,1:3]
y_train=X[:,3:4]
#Memanggil KNN
knn=KNeighborsClassifier(n_neighbors=6,
weights='uniform',
algorithm='auto',
metric='euclidean')
#Fit model dengan data latih dan target/label
knn.fit(x_train,y_train)
#Mengambil data dari file csv
datavalidasi=pd.read_csv('validasibeasiswa.csv')
df2=pd.DataFrame(datasiswa,columns=['Mahasiswa','IPK','Tingkat Kemiskinan (TM)','Beasiswa/Tidak'])
X2=np.asarray(datavalidasi)
x_val=X2[:,1:3]
y_val=X2[:,3:4]
#Prediksi
y_pred=knn.predict(x_val)
print((y_val).T)
print(y_pred)
print(classification_report(y_val,y_pred))
#Menyiapkan sebuah data uji/testing
uji=np.asarray([[2.5,4.0]])
y_pred=knn.predict(uji)
print(y_pred)

Data yang dibutuhkan dua buah yaitu data beasiswa dan data validasi beasiswa dalam format CSV. Bagaimana cara unggah data tersebut ke Google Colab serta penerapannya silahkan lihat video Youtube saya berikut ini. Semoga bermanfaat.

Klasifikasi adalah cara untuk mengelompokkan objek berdasarkan karakteristik tertentu. Dalam bahasa pemrograman Python, algoritma klasifikasi dapat dilakukan dengan beberapa cara. Salah satu algoritma klasifikasi adalah k Terdekat Tetangga (kNN), di mana pengelompokannya didasarkan pada kedekatan antar objek. Model pembelajaran mesin klasifikasi kNN dengan Python dapat digunakan untuk memprediksi suatu objek.

Bagaimana cara melakukan klasifikasi kNN dengan Python? Bagaimana cara membuat prediksi sesuai dengan algoritma klasifikasi kNN? Sahabat idschool bisa mengetahui jawabannya melalui ulasan di bawah ini.

Daftar isi

Data Bunga Iris

Langkah-langkah Melakukan Klasifikasi kNN dengan Python

Proses klasifikasi kNN dengan Python untuk dataset iris pada halaman ini menggunakan Buku Catatan Jupiter dalam sistem anakonda. Perpustakaan yang digunakan untuk melakukan klasifikasi kNN untuk dataset bunga iris adalah belajar sandiwara.

Langkah-langkah mengerjakan klasifikasi kNN dengan Python antara lain: impor data, membagi data menjadi data latih dan uji, proses klasifikasi kNN, dan melihat akurasi skor. Selain itu, prediksi data baru juga akan dibuat untuk melihat bagaimana klasifikasi kNN bekerja dengan Python.

1) Impor Data

Langkah pertama adalah mempersiapkan data yang akan diolah menjadi Buku Catatan Jupiter. Cara pengambilan data dapat dilakukan dengan dua cara yaitu menggunakan pembacaan file dengan panda atau impor langsung dari perpustakaan sandiwara-belajar.

Membaca file dengan panda berguna ketika data yang akan digunakan tidak ada di perpustakaan. Biasanya data yang dipanggil dengan pandas memiliki format csv dengan perintah pd.read_csv(iris_dataset). Harap dicatat bahwa file data harus berada di folder yang sama dengan lembar kerja Buku Catatan Jupiter.

Untuk beberapa kumpulan data sampel seperti kumpulan data iris, sudah ada di perpustakaan sandiwara-belajar sehingga dapat diperoleh langsung melalui proses impor. Untuk memanggil iris dataset dari sckit lear library, Anda dapat menulis perintah berikut.

Proses Klasifikasi kNN dengan Python 73

Jika proses impor data berhasil makan tidak ada tanda kesalahan. Jika proses import data tidak berhasil maka akan muncul tampilan kesalahan yang dapat disebabkan oleh beberapa kemungkinan.

Bentuk error tersebut biasanya berupa penamaan yang tidak sesuai dengan library, seperti: ModuleNotFoundError: Tidak ada modul bernama ‘sklearn.dataset’. Atau error juga ada salah ketik di nama like NameError: nama ‘load’ tidak ditentukan.

Proses Klasifikasi kNN dengan Python 74

Proses Klasifikasi kNN dengan Python 75

2) Pisahkan Data Menjadi Data Pelatihan dan Pengujian

Dataset iris perlu dibelah dua menjadi data pelatihan dan data pengujian. Metode ini dilakukan untuk mengetahui seberapa akurat model yang akan dibuat dengan dataset tersebut.

Perpustakaan sandiwara-belajar memiliki perintah yang secara otomatis akan membagi data menjadi dua bagian. Bagian pertama adalah data latih dengan total 3/4 bagian, sedangkan data pengujian adalah 1/4 bagian. Jadi untuk jumlah data sebesar 150 akan dibagi menjadi 112 untuk data latih dan 38 untuk data uji.

Perintah untuk melakukan membelah data dengan perpustakaan sandiwara-belajar Ini dilakukan dengan menulis dan mengeksekusi kode berikut pada: Buku Catatan Jupiter.

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(iris_dataset[‘data’], iris_dataset[‘target’], random_state = 0)

Proses Klasifikasi kNN dengan Python 76

Data latih akan digunakan dan dipelajari dalam model pembelajaran mesin klasifikasi kNN. Sedangkan data pengujian tidak digunakan dalam pembelajaran dan akan berguna untuk melihat seberapa akurat model yang dihasilkan.

Baca Juga : Metode Penelitian Kualitatif

3) Proses Pelatihan Data dengan Klasifikasi kNN

Proses klasifikasi kNN pada library skit learn terdapat pada class yang perlu dipanggil terlebih dahulu. Perintah untuk memanggil kelas dilakukan dengan menulis kode: from sklearn.neighbors import KNeighborsClassifier di Buku Catatan Jupiter.

Setelah itu juga perlu ditentukan berapa banyak tetangga yang digunakan sebagai acuan klasifikasi. Kode perintah untuk menambahkan deskripsi banyak tetangga sebagai referensi adalah KNeigborsClassifier(n_neighbors = x). Dimana x adalah bilangan yang menyatakan banyaknya tetangga yang direferensikan.

Data pelatihan akan dipelajari oleh pembelajaran mesin klasifikasi kNN dengan Python melalui bagian perintah fit(X_train, y_train). Jika data pelatihan berhasil diproses, maka akan menampilkan output dengan informasi berikut.

Proses Klasifikasi kNN dengan Python 77

4) Melihat Skor Akurasi Model Klasifikasi Klasifikasi kNN

Dapat diketahui keakuratan data latih pada dataset bunga iris dengan metode klasifikasi kNN. Nilai skor akurasi dapat diketahui dengan menggunakan data tes yang diperoleh pada saat melakukan tes membelah data.

Sebelumnya, data pengujian di bagian split memiliki nama X_test dan y_test. Jadi kode perintah untuk mengetahui keakuratan model adalah knn.score(X_test, y_test).

Proses Klasifikasi kNN dengan Python 78

Keakuratan model yang diperoleh adalah 0,936842… yang berarti akurasi model klasifikasi kNN adalah 97%. Hasil skor tersebut menunjukkan seberapa besar persentase akurasi model untuk memprediksi data baru. Skor 97% merupakan persentase yang besar untuk membuat kesimpulan bahwa prediksi yang dibuat adalah benar.

5) Contoh cara membuat prediksi

Misalnya, mengingat ukuran panjang sepal, lebar sepal, panjang kelopakdan lebar kelopak dari iris berturut-turut adalah 5,4; 3.7; 1.5; dan 0.2. Keempat ukuran tersebut perlu dimasukkan ke dalam variabel dengan tipe data berupa array menggunakan numpy. Prediksi dilakukan dengan kode perintah knn.predict(nama_variabel) seperti yang dilakukan dengan cara berikut.

Proses Klasifikasi kNN dengan Python 79

Berdasarkan model klasifikasi kNN dengan Python yang telah dibuat, dapat diketahui bahwa jenis spesies yang cocok untuk iris adalah iris setosa. Begitulah proses yang dilakukan dalam klasifikasi kNN dengan Python. Terima kasih telah mengunjungi idschool(dot)net, semoga bermanfaat!

Langkah langkah metode KNN?

Adapun alur cara kerja algoritma KNN adalah sebagai berikut:.

Langkah-1: Pilih nilai banyaknya tetangga K..

Langkah-2: Hitung jarak dari jumlah tetangga K (bisa menggunakan salah satu metrik jarak, misalnya Euclidean distance).

Langkah-3: Ambil tetangga terdekat K sesuai jarak yang dihitung..

Algoritma KNN digunakan untuk apa?

Alasan untuk mengapa memakai Metode KNN ini, karena memiliki keunggulan dapat mengklasifikasikan data calon pegawai yang tidak diketahui dengan adanya data latih dan data uji. KNN dapat menprosedur yang berbasis matematis untuk mengevaluasi nilai kriteria-kriteria tersebut menjadi sebuah keterangan klasifikasi.

Apa itu klasifikasi KNN?

KNN merupakan algoritma klasifikasi yang paling sederhana dalam mengklasifikasikan sebuah gambar kedalam sebuah label. Metode ini mudah dipahami dibandingkan metode lain karena mengklasifikasikan berdasarkan jarak terdekat dengan objek lain (tetangga).

Apa itu nilai k pada KNN?

Tingkat akurasi suatu jenis kerusakan jalan dengan metode KNN sangat dipengaruhi oleh besaran nilai k. Nilai k menyatakan berapa banyak jumlah neighbor atau data yang terdekat dengan suatu objek. Jumlah neighbor yang berbeda tentu akan mempengaruhi hasil klasifikasi terhadap satu objek. Berdasarkan atas hal tersebut, ...

kode python