Klasifikasi adalah suatu cara yang dilakukan untuk mengelompokkan obyek berdasarkan suatu karakteristik tertentu. Dalam bahasa pemorgraman Python, algoritma klasifikasi dapat dilakukan dengan beberapa cara. Salah satu algoritma klasifikasi adalah k Nearest Neighbors (kNN), di mana pengelompokan didasarkan kedekatan antar obyek. Model hasil mesin pembelajaran klasifikasi kNN dengan Python dapat digunakan untuk melakukan prediksi suatu obyek. Show
Bagaimana cara melakukan klasifikasi kNN dengan Python? Bagaimana cara melakukan predisi yang sesuai dengan algoritma klasifikasi kNN? Sobat idschool dapat mencari tahu jawabannya melalui ulasan di bawah. Table of ContentsData Bunga IrisBagaimana proses klasifikasi kNN dengan Python pada halaman ini akan ditunjukkan melalui sebuah contoh. Data yang digunakan dalam contoh merupakan dataset bunga iris. Dataset bunga iris paling sering dijadikan sebagai contoh untuk latihan pengolahan data, termasuk klasifikasi kNN. Di mana dataset bunga iris dapat dapat diperoleh dengan cara mengunduh melalui UCI atau Kaggle. Atau, dataset bunga iris juga terdapat dalam library scikit-learn yang dapat langsung dipanggil melalui Jupyter Notebook ketika komputer sudah terinstal Anaconda. Sebelum ke bahasan bagaimana proses klasifikasi kNN dengan Python menggunakan dataset bunga iris, sebaiknya perlu mengetahui bagaimana isi atau bentuk dataset tersebut. Data bunga iris adalah dataset berupa 150 ukuran-ukuran yang meliputi sepal length (panjang mahkota/daun bunga), sepal width (lebar mahkota/daun bunga), petal length (panjang kelopak), dan petal width (lebar kelopak). Semua ukuran dalam dataset bunga iris dinyatakan dalam sentimeter (cm). Klasifikasi kNN untuk dataset bunga iris akan mengelompokkan jenis bunga dalam tiga spesies yaitu iris setosa, iris versicolour, dan iris virginica. sumber gambar: datacampKeterangan mengenai ketiga jenis spesies bunga iris tersebut terdapat dalam deskripsi data. Cara menampilkan deskripsi data dapat dilakukan melalui perintah Untuk kumpulan data ukuran bunga terdapat pada Empat kolom berturut-turut merupakan ukuran untuk sepal length, sepal width, petal length, dan petal width. Sementara data 150 baris memuat ukuran bunga yang terbagi sama untuk spesies iris setosa, versicolor, dan virginica. Sehingga setiap spesies bunga iris terdiri dari 50 kumpulan data. Baca Juga: Proses Pengerjaan Analisis Regresi Linear Sederhana Secara Manual (Tanpa Software) Langkah-Langkah yang Dikerjakan Klasifikasi kNN dengan PythonProses klasifikasi kNN dengan Python untuk dataset bunga iris di halaman ini menggunakan Jupyter Notebook dalam sistem Anaconda. Library yang digunakan untuk melakukan klasifikasi kNN untuk dataset bunga iris dalah scikit learn. Langkah pengerjaan klasifikasi kNN dengan Python meliputi import data, membagi data menjadi data latih dan tes, proses klasifikasi kNN, dan melihat akurasi skor. Selain itu juga akan dilakukan prediksi data baru untuk melihat bagaimana hasil kerja klasifikasi kNN dengan Python. 1) Import DataLangkah pertama adalah menyiapkan data yang akan diolah ke dalam Jupyter Notebook. Cara mengambil data dapat dilakukan melalui dua cara yaitu menggunakan pembacaan file dengan pandas atau import langsung dari library scikit-learn. Pembacaan file dengan pandas berguna saat data yang akan digunakan tidak berada dalam library. Biasanya data yang dipanggil dengan pandas memiliki format csv dengan perintah Untuk beberapa dataset contoh seperti iris dataset sudah terdapat dalam library scikit-learn sehingga dapat langsung diperoleh melalui proses import. Untuk memanggil dataset bunga iris dari library scikit learn dapat dilakukan dengan menuliskan perintah berikut. Jika proses import data berhasil makan tidak muncul tanda error. Jika proses import data tidak berhasil maka akan muncul error yang dapat disebabkan oleh beberapa kemungkinan. Bentuk kesalahan biasanya ada penamaan yang tidak sesuai dengan library seperti ModuleNotFoundError: No module named ‘sklearn.dataset’. Atau keselahan juga terdapat salah ketik nama seperti NameError: name ‘load’ is not defined. 2) Membagi Data Menjadi Data Training dan TestingDataset bunga iris perlu dibagi dua menjadi data training dan data testing. Cara ini dilakukan untuk mengetahui seberapa akurat model yang nantinya dibuat dengan dataset tersebut. Library scikit-learn memiliki perintah yang secara otomatis akan membagi data menjadi dua bagian. Bagian pertama adalah data training dengan jumlah sebanyak 3/4 bagian, sementara data testing sebanyak 1/4 bagian. Sehingga untuk banya data sama dengan 150 akan dibagi menjadi 112 untuk data training dan 38 untuk data testing. Perintah untuk melakukan split data dengan library scikit-learn dilakukan dengan menuliskan dan mengeksekusi kode berikut pada Jupyter Notebook.
Data training akan digunakan dan dipelajari dalam model mesin pembelajaran klasifikasi kNN. Sementara data testing tidak digunakan dalam pembelajaran dan akan berguna untuk melihat seberapa akurat model yang dihasilkan. Baca Juga: Metode Penelitian Kualitatif 3) Proses Latih Data dengan Klasifikasi kNNProses klasifikasi kNN pada library scikit learn terdapat dalam sebuah kelas yang perlu dipanggil terlebuh dahulu. Perintah pemanggilan kelas dilakukan dengan menuliskan kode: Setelah itu perlu juga untuk menentukan berapa banyak jumlah tetangga yang digunakan sebagai acuan klasifikasi. Kode perintah untuk menambahkan keterangan banyak tetangga sebagai acuan adalah Data training akan dipelajari oleh machine learning klasifikasi kNN dengan Python melalui bagian perintah 4) Melihat Skor Akurasi Model Klasifikasi kNNSeberapa besar keakuratan data latih pada dataset bunga iris dengan motode klasifikasi kNN dapat dicari tahu. Nilai skor keakuratan dapat diketahui menggunakan data test yang diperoleh pada waktu melakukan split data. Sebelumnya data testing pada bagian split memiliki nama X_test dan y_test. Sehingga kode perintah untuk mengetahui besar akurasi model adalah Hasil akurasi model yang didapat adalah 0,936842… yang artinya akurasi model klasifikasi kNN adalah 97%. Hasil skor tersebut menunjukkan seberapa besar persentase keakuratan model untuk memprediksi data baru. Nilai skor 97% merupakan persentase yang besar untuk membuat kesimpulan bahwa prediksi yang dilakukan bernilai benar. 5) Contoh Cara Melakukan PrediksiSebagai contoh, diketahui ukuran sepal length, sepal width, petal length, dan petal width dari sebuah bunga iris berturut-turut adalah 5,4; 3,7; 1,5; dan 0,2. Empat ukuran tersebut perlu diimput dalam sebuah variabel dengan tipe data berupa array menggunakan numpy. Prediksi dilakukan dengan kode perintah Berdasarkan model klasifikasi kNN dengan Python yang telah dibuat dapat diketahui bahwa jenis spesies yang sesuai untuk bunga iris tersebut adalah iris setosa. Demikianlah tadi bagaimana proses yang dilakukan dalam klasifikasi kNN dengan Python. Terima kasih sudah mengunjungi idschool(dot)net, semoga bermanfaat! Langkah kCara Kerja Algoritma K-Nearest Neighbor. Langkah-1: Pilih nilai banyaknya tetangga K.. Langkah-2: Hitung jarak dari jumlah tetangga K (bisa menggunakan salah satu metrik jarak, misalnya Euclidean distance). Langkah-3: Ambil tetangga terdekat K sesuai jarak yang dihitung.. Apa kegunaan kAlgoritma Nearest Neighbor Retrieval (K-Nearest Neighbor atau K-NN) adalah sebuah algoritma untuk melakukan klasifikasi terhadap objek dengan data pembe- lajaran yang jaraknya paling dekat dengan objek tersebut.
Termasuk jenis metode apakah algoritma KKNN merupakan algoritma klasifikasi yang paling sederhana dalam mengklasifikasikan sebuah gambar kedalam sebuah label. Metode ini mudah dipahami dibandingkan metode lain karena mengklasifikasikan berdasarkan jarak terdekat dengan objek lain (tetangga).
Metode KNN merupakan metode klasifikasi dimana pada intinya metode ini adalah?Metode yang digunakan yaitu algoritma K-Nearest Neighbor (KNN), dimana merupakan sebuah metode untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut.
|