Penerapan Seleksi Fitur Particle Swarm Optimization pada Klasifikasi Teks (Studi Kasus: Komentar Cyberbullying Instagram)

Nadya Lestari, Tursina Tursina, Enda Esyudha Pratama

Abstract


Dunia saat ini sedang berada di era Big Data, dimana sejumlah besar data berdimensi tinggi tersebar di berbagai domain, seperti media sosial, layanan kesehatan, bio-informatika, dan pendidikan online. Big Data adalah salah satu teknik pembelajaran mesin dan menjadi alat penting yang populer dalam bisnis, sehingga pengelolaan Big Data yang efektif menjadi hal yang sangat penting. Salah satu topik yang menarik untuk diteliti dalam kajian Big Data khususnya text mining ialah cyberbullying Instagram. Beberapa teknik yang dapat digunakan untuk memecahkan masalah text mining yaitu, clustering, klasifikasi, outlier, asosiasi, dan masih banyak lagi. Klasifikasi merupakan bentuk dasar dari analisis data yang banyak diterapkan diberbagai bidang. Penelitian ini membangun model klasifikasi menggunakan algoritma Logistic Regression dengan penambahan proses seleksi fitur menggunakan algoritma Particle Swarm Optimization sebagai tahapan yang berada sebelum proses pelatihan model regresi untuk mengklasifikasi komentar cyberbullying Instagram. Seleksi fitur dilakukan untuk mempertahankan kinerja model klasifikasi dengan menggunakan jumlah fitur pelatihan yang lebih sedikit. Hasil penelitian menunjukkan bahwa penambahan seleksi fitur dapat mereduksi fitur kata sebanyak 40% yang diikuti penurunan akurasi, presisi, dan AUC masing-masing sebesar  1,25%, 4,25%, 1,09% serta peningkatan nilai recall dan f1-score secara berurut sebesar 5,36% dan 0,57%. Penambahan Particle Swarm Optimization sebagai seleksi fitur pada kasus  disimpulkan efektif mempertahankan kinerja pembelajaran model dilihat dari nilai AUC yang tetap berada pada kategori Good Classification saat dilatih dengan fitur kata yang lebih sedikit.


Keywords


Seleksi Fitur; Particle Swarm Optimization; Klasifikasi Teks; Logistic Regression; Cyberbullying

Full Text:

PDF

References


D. Fadma Ristianti, “Komparasi Algoritma Klasifikasi pada Data Mining,” Proc. 1 st STEEEM, vol. 1, no. 1, pp. 148–156, 2019.

A. Sarwani, R. Sianturi, A. Ayu Kustianti, A. Putri Siswadi, D. Nurmalita, and E. Puspitasari, “Teknologi Informasi Efektif Mendeteksi Cyberbullying,” J. Heal. Educ. Sci. Technol., vol. 5, no. 2, pp. 151–164, Aug. 2022, doi: 10.25139/htc.v5i2.4673.

F. Reviantika, Y. Azhar, G. I. Marthasari, Wicaksono, and Triyono, “Analisis Klasifikasi SMS Spam Menggunakan Logistic Regression,” J. Sist. Cerdas, vol. 4, no. 2, pp. 37–43, 2021, [Online]. Available: https://www.cnbcindonesia.com

A. Muneer and S. M. Fati, “A comparative analysis of machine learning techniques for cyberbullying detection on twitter,” Futur. Internet, vol. 12, no. 11, pp. 1–21, 2020, doi: 10.3390/fi12110187.

M. R. Nurhusen, J. Indra, and ..., “Analisis Sentimen Pengguna Twitter Terhadap Kenaikan Harga Bahan Bakar Minyak (BBM) Menggunakan Metode Logistic Regression,” J. Media …, vol. 7, pp. 276–282, 2023, doi: 10.30865/mib.v7i1.5491.

A. S. Hutagalung, A. B. P. Negara, and E. E. Pratama, “Aplikasi Pendeteksi Cyberbullying Terhadap Komentar Postingan Media Sosial Instagram dengan Metode Naïve Bayes Classifier Berbasis Website,” J. Sist. dan Teknol. Inf., vol. 9, no. 3, p. 364, 2021, doi: 10.26418/justin.v9i3.44843.

S. Aisyah, “Implementasi Sentiment Analysis Cyberbullying pada Instagram dengan Algoritma Logistic Regression,” 2020.

D. Fortuna, I. D. Sulvianti, and G. A. Dito, “Penerapan Binary Particle Swarm Optimization Support Vector Machine untuk Klasifikasi Komentar Cyberbullying di Instagram,” Xplore J. Stat., vol. 11, no. 1, pp. 59–69, Jan. 2022, doi: 10.29244/xplore.v11i1.859.

G. G. S. Putra, W. Swastika, and P. L. T. Irawan, “Perbandingan Particle Swarm Optimization dengan Genetic Algorithm dalam Feature Selection untuk Analisis Sentimen pada Permendikbudristek PPKS-LPT,” JEPIN (Jurnal Edukasi dan Penelit. Inform., vol. 8, no. 3, pp. 412–421, 2022.

F. Septianingrum, A. Susilo, and Y. Irawan, “Metode Seleksi Fitur Untuk Klasifikasi Sentimen Menggunakan Algoritma Naive Bayes : Sebuah Literature Review,” vol. 5, pp. 799–805, 2021, doi: 10.30865/mib.v5i3.2983.

J. Kennedy and R. Eberhart, “Particle Swarm Optimization PAPER - IGNORE FROM REFS,” ICNN’95-international Conf. neural networks, pp. 1942–1948, 1995.

A. S. H. Basari, B. Hussin, I. G. P. Ananta, and J. Zeniarja, “Opinion mining of movie review using hybrid method of Support Vector Machine and Particle Swarm Optimization,” in Procedia Engineering, 2013, vol. 53, pp. 453–462. doi: 10.1016/j.proeng.2013.02.059.

L. Efrizoni, S. Defit, M. Tajuddin, and A. Anggrawan, “Komparasi Ekstraksi Fitur dalam Klasifikasi Teks Multilabel Menggunakan Algoritma Machine Learning,” MATRIK J. Manajemen, Tek. Inform. dan Rekayasa Komput., vol. 21, no. 3, pp. 653–666, 2022, doi: 10.30812/matrik.v21i3.1851.

K. A. Hanafiah, Rancangan percobaan : teori dan aplikasi / Kemas Ali Hanafiah. Jakarta: Rajawali Press, 2010.

A. Taufik, “Optimasi Particle Swarm Optimization Sebagai Seleksi Fitur Pada Analisis Sentimen Review Hotel Berbahasa Indonesia Menggunakan Algoritma Naïve Bayes,” J. Tek. Komput., vol. III, no. 2, 2017, [Online]. Available: http://www.tripadvisor.com

M. Dash ’ and H. Liu, “Feature Selection for Classification,” 1997. [Online]. Available: www.elsevier.comAocate/ida

I. Guyon and A. Elisseeff, “An introduction to variable and feature selection,” JMLR 3, pp. 1157–1182, 2003.

Guruprasad, “Catatan tentang Sensitivitas, Spesifisitas, Presisi, Recall dan skor F1.,” Analitis Vidhya, 2019. https://medium.com/analytics-vidhya/notes-on-sensitivity-specificity-precision-recall-and-f1-score-e34204d0bb9b

R. Susetyoko, Wiratmoko Yuwono, and Elly Purwantini, “Model Klasifikasi Pada Seleksi Mahasiswa Baru Penerima KIP Kuliah Menggunakan Regresi Logistik Biner,” J. Inform. Polinema, vol. 8, no. 4, pp. 31–40, 2022, doi: 10.33795/jip.v8i4.914.




DOI: http://dx.doi.org/10.26418/jp.v9i2.68320

Refbacks

  • There are currently no refbacks.