Implementasi Distance Weighted K-Nearest Neighbor Untuk Klasifikasi Spam & Non-Spam Pada Komentar Instagram
Abstract
Instagram (IG) menjadi salah satu sosial media yang sering dipakai untuk membagikan momen dari para penggunanya. Banyak pula public figure, termasuk artis yang menggunakan sosial media ini sebagai media berbagi mereka. Namun, popularitas dari artis tersebut membuat beberapa kalangan mengirimkan komentar spam, sehingga membuat komentar itu menjadi membingungkan saat dibaca. Tujuan penelitian ini adalah mengimplementasikan dan mengetahui akurasi algoritma DWKNN untuk deteksi komentar spam pada IG. Metode DWKNN digunakan sebagai perbaikan dari metode KNN melalui pelatihan sistem dengan data latih acak. Setelah proses pelatihan, dilakukan pengujian berdasarkan data uji dan latih dengan parameter nilai k dan persentase fitur yang akan digunakan untuk menguji dan membandingkan metode KNN maupun DWKNN berdasarkan hasil klasifikasinya. Kontribusi penelitian ini menunjukkan bahwa akurasi metode DWKNN lebih baik daripada KNN, perbedaan nilai k ini tidak memiliki dampak yang terlalu berarti dalam klasifikasi komentar spam, dan seleksi fitur (Features Selection) memiliki hasil success rate yang baik pada penggunaan FS antara 80% - 100%. Akurasi optimal dari KNN adalah 82.36% sedangkan menggunakan DWKNN mencapai 91.08% pada FS 80%.
Keywords
Full Text:
PDFReferences
T. Clarke, “22+ Instagram Stats That Marketers Can’t Ignore This Year,” 5 March 2019. [Online]. Available: https://blog.hootsuite.com/instagram-statistics/.
J. Hartmann, J. Huppertz, C. Schamp and M. Heitmann, “Comparing automated text classification methods,” International Journal of Research in Marketing, vol. 36, no. 1, pp. 20-36, 2019.
A. R. C and Y. Lukito, “Deteksi Komentar Spam Bahasa Indonesia Pada Instagram Menggunakan Naive Bayes,” Ultimatics, vol. IX, no. 1, 2017.
A. R. Chrismanto and Y. Lukito, “Identifikasi Komentar Spam Pada Instagram,” Lontar Komputer, vol. 8, no. 3, pp. 219-231, 2018.
S. Dhawana and Simran, “An enhanced mechanism of spam and category detection using Neuro-SVM,” Procedia Computer Science, vol. 132, no. 2018, pp. 429-436, 2018.
A. R. Chrismanto and Y. Lukito, “KLASIFIKASI KOMENTAR SPAM PADA INSTAGRAM BERBAHASA INDONESIA MENGGUNAKAN K-NN,” SNATIK 2017, 23 Desember 2017.
H. Faris, A. a. M.Al-Zoubia, A. A. Heidari, I. Aljarah, M. Mafarja, M. A.Hassonah and H. Fujita, “An intelligent system for spam detection and identification of the most relevant features based on evolutionary Random Weight Networks,” Information Fusion, vol. 48, no. 1, pp. 67-83, 2019.
W. Zhang and H.-M. Sun, “Instagram Spam Detection,” 2017 IEEE 22nd Pacific Rim International Symposium on Dependable Computing, pp. 227-228, 22-25 January 2017.
S. Jiang, G. Pang, M. Wu and L. Kuang, “An improved K-nearest-neighbor algorithm for text categorization,” Expert Systems with Applications, vol. 39, no. 1, pp. 1503-1509, 2012.
S. Sun and R. Huang, “An adaptive k-nearest neighbor algorithm,” Seventh International Conference on Fuzzy Systems and Knowledge Discovery, 10-11 August 2010.
J. Wu, Z. Cai and Z. Gao, “Dynamic K-Nearest-Neighbor with Distance and attribute weighted for classification,” International Conference on Electronics and Information Engineering, 1-3 August 2010.
G. Salton and C. Buckley, “Term-weighting approaches in automatic text retrieval,” Information Processing & Management, vol. 24, no. 5, pp. 513-523, 1988.
S. A. Dudani, “The Distance-Weighted k-Nearest-Neighbor Rule,” IEEE Transactions on Systems, Man, and Cybernetics, Vols. SMC-6, no. 4, pp. 325 - 327, 1976.
A. R. Chrismanto, W. S. Raharjo and Y. Lukito, “Design and Development of REST-based Instagram Spam Detector for Indonesian Language,” 2018 International Seminar on Application for Technology of Information and Communication (iSemantic), 21-22 September 2018.
J. Gou, L. Du, Y. Zhang and T. Xiong, “A New Distance-weighted k -nearest Neighbor Classifier,” Journal of Information and Computational Science, vol. 9, no. 6, 2011.
Suyanto, Data Mining Untuk Klasifikasi dan Klasterisasi Data, Bandung: Informatika, 2017.
M. J. Zaki and J. Wagner Meira, Data mining and analysis: fundamental concepts and algorithms, Cambridge University Press, 2014.
A. R. Chrismanto, W. S. Raharjo and Y. Lukito, “Firefox Extension untuk Klasifikasi Komentar Spam pada Instagram Berbasis REST Services,” Jurnal Edukasi dan Penelitian Informatika, vol. 5, no. 2, pp. 146-156, 2019.
DOI: http://dx.doi.org/10.26418/jp.v6i2.39996
Refbacks
- There are currently no refbacks.