Implementasi Seleksi Fitur Binary Particle Swarm Optimization pada Algoritma K-NN untuk Klasifikasi Kanker Payudara
Abstract
Kanker Payudara adalah jenis kanker paling umum yang sering menyerang kalangan wanita di seluruh dunia. Diagnosa awal yang akurat dalam mendeteksi kanker payudara memainkan peran penting dalam pengobatan pasien karena semakin cepat kanker di diagnosa semakin cepat juga pengobatan dapat diberikan. Untuk menghasilkan diagnosa yang akurat terhadap pasien kanker payudara maka dilakukan penelitian dengan tujuan mendapatkan model klasifikasi yang dapat memberikan klasifikasi yang akurat terhadap penyakit kanker payudara. Algoritma klasifikasi yang sering digunakan dan cukup terkenal adalah K-Nearest Neighbor (K-NN). Algoritma K-NN melakukan klasifikasi menggunakan konsep tetangga terdekat berdasarkan pada data terdahulu, akan tetapi algoritma K-NN lemah terhadap data dengan jumlah fitur yang besar. Maka dari itu, untuk kasus dataset dengan banyak fitur dapat dilakukan seleksi fitur terlebih dahulu untuk meningkatkan performa klasifikasi K-NN. Salah satu yang sering digunakan untuk seleksi fitur adalah algoritma Binary Particle Swarm Optimization (BPSO). Pada penelitian ini akan dibuat 2 model klasifikasi K-NN yaitu model klasifikasi K-NN saja tanpa seleksi fitur dan model klasifikasi K-NN dengan seleksi fitur Binary Particle Swarm Optimization, Kemudian dilakukan perbandingan hasil akurasi yang didapat. Dataset yang akan digunakan adalah Breast Cancer Wincosin (Diagnostic) dari UCI Machine Learning Repository yang memiliki 569 data dan 30 fitur. Hasil penelitian menunjukan model K-NN+BPSO menghasilkan akurasi sebesar 95,32% dan model K-NN menghasilkan akurasi sebesar 94,15%. Berdasarkan akurasi yang didapatkan algoritma K-NN dengan seleksi fitur menghasilkan akurasi yang lebih baik daripada algoritma K-NN tanpa seleksi fitur sebesar 1,17%. Algoritma Binary PSO juga berhasil mereduksi fitur dari 30 fitur menjadi 5 fitur dengan tidak mengurangi akurasi dari model klasifikasi. Sehingga dapat disimpulkan bahwa pada kasus klasifikasi kanker payudara dengan dataset Breast Cancer Wincosin (Diagnostic) algoritma K-NN dapat dikombinasikan dengan seleksi fitur Binary PSO untuk membuat model klasifikasi yang memberikan performa cukup baik.
Keywords
Full Text:
PDFReferences
H. Harafani and H. A. Al-Kautsar, “Meningkatkan Kinerja K-Nn Untuk Klasifikasi Kanker Payudara Dengan Forward Selection,” Jurnal Pendidikan Teknologi dan Kejuruan, vol. 18, no. 1, p. 99, 2021, doi: 10.23887/jptk-undiksha.v18i1.29905.
O. I. Obaid, M. A. Mohammed, M. K. A. Ghani, S. A. Mostafa, and F. T. Al-Dhief, “Evaluating the Performance of Machine Learning Techniques in the Classification of Wisconsin Breast Cancer,” Article in International Journal of Engineering and Technology, vol. 7, no. 4, pp. 160–166, 2018, doi: 10.14419/ijet.v7i4.36.23737.
A. B. Hassanat, M. A. Abbadi, G. A. Altarawneh, and A. A. Alhasanat, “Solving the Problem of the K Parameter in the KNN Classifier Using an Ensemble Learning Approach,” vol. 12, no. 8, pp. 33–39, 2014, [Online]. Available: http://arxiv.org/abs/1409.0919
W. Yunus, “Algoritma K-Nearest Neighbor Berbasis Particle Swarm Optimization Untuk Prediksi Penyakit Ginjal Kronik,” Jurnal Teknik Elektro CosPhi, vol. 2, no. 2, pp. 51–55, 2018.
N. Kouiroukidis and G. Evangelidis, “The effects of dimensionality curse in high dimensional knn search,” Proceedings - 2011 Panhellenic Conference on Informatics, PCI 2011, pp. 41–45, 2011, doi: 10.1109/PCI.2011.45.
X. Zhang, Z. Shi, X. Liu, and X. Li, “A Hybrid Feature Selection Algorithm For Classification Unbalanced Data Processsing,” 2018 IEEE International Conference on Smart Internet of Things (SmartIoT), pp. 269–275, 2018, doi: 10.1109/smartiot.2018.00055.
B. H. Nguyen, B. Xue, and M. Zhang, “A survey on swarm intelligence approaches to feature selection in data mining,” Swarm and Evolutionary Computation, vol. 54, no. April 2019, p. 100663, 2020, doi: 10.1016/j.swevo.2020.100663.
H. Gohzali, S. Megawan, and J. Onggo, “Rekomendasi Buku Menggunakan K-Nearest Neighbor (KNN) dan Binary Particle Swarm Optimization (BPSO),” Jurnal SIFO Mikroskil (JSM) STMIK MIkroskil, vol. 20, no. 1, pp. 1–5, 2019, [Online]. Available: https://www.ranks.nl/stopwords.
T. A. Khan, K. Zain-Ul-Abideen, and S. H. Ling, “A modified particle swarm optimization algorithm used for feature selection of UCI biomedical data sets,” 60th International Scientific Conference on Information Technology and Management Science of Riga Technical University, ITMS 2019 - Proceedings, pp. 1–4, 2019, doi: 10.1109/ITMS47855.2019.8940760.
H. Lubis, P. Sirait, and A. Halim, “KNN Method on Credit Risk Classification With Binary Particle Swarm Optimization Based Feature Selection,” Jurnal INFOKUM, vol. 9, no. 2, pp. 211–218, 2021.
B. Ji, X. Lu, G. Sun, W. Zhang, J. Li, and Y. Xiao, “Bio-Inspired Feature Selection: An Improved Binary Particle Swarm Optimization Approach,” IEEE Access, vol. 8, pp. 85989–86002, 2020, doi: 10.1109/ACCESS.2020.2992752.
W. Han, P. Yang, H. Ren, and J. Sun, “Comparison study of several kinds of inertia weights for PSO,” Proceedings of the 2010 IEEE International Conference on Progress in Informatics and Computing, PIC 2010, vol. 1, no. 09, pp. 280–284, 2010, doi: 10.1109/PIC.2010.5687447.
A. Johar, D. Yanosma, and K. Anggriani, “Implementasi Metode K-Nearest Neighbor (Knn) Dan Simple Additive Weighting (Saw) Dalam Pengambilan Keputusan Seleksi Penerimaan Anggota Paskibraka,” Pseudocode, vol. 3, no. 2, pp. 98–112, 2017, doi: 10.33369/pseudocode.3.2.98-112.
S. H. A. Aini, Y. A. Sari, and A. Arwan, “Seleksi Fitur Information Gain untuk Klasifikasi Penyakit Jantung Menggunakan Kombinasi Metode K-Nearest Neighbor dan Naïve Bayes,” Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, vol. 2, no. 9, pp. 2546–2554, 2018.
M. Sokolova and G. Lapalme, “A systematic analysis of performance measures for classification tasks,” Information Processing and Management, vol. 45, no. 4, pp. 427–437, 2009, doi: 10.1016/j.ipm.2009.03.002.
DOI: https://doi.org/10.26418/justin.v11i1.53608
Refbacks
- There are currently no refbacks.
Copyright (c) 2023 JUSTIN (Jurnal Sistem dan Teknologi Informasi)
View My Stats
All article in Justin is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License