Pengaruh Stemming Terhadap Performa Klasifikasi Sentimen Masyarakat Tentang Kebijakan New Normal

Rama Ulgasesa, Arif Bijaksana Putra Negara, Tursina Tursina

Abstract


Banyaknya pengguna twitter dapat dimanfaatkan untuk mengetahui sentimen masyarakat tentang kebijakan dan penanganan yang dilakukan oleh pemerintah terhadap Covid-19, salah satunya kebijakan mengenai adaptasi kebiasaan baru atau new normal. Untuk melakukan hal itu, bisa digunakan salah satu fungsi dari text mining, yaitu klasifikasi text. Sebelum model klasifikasi text dibuat, text akan melalui tahapan preprocessing. Setiap tahapan memiliki pengaruh terhadap hasil evaluasi klasifikasi text yang akan dilakukan. Tujuan dari penelitian ini adalah mengetahui perbandingan performa klasifikasi menggunakan proses stemming dan tanpa stemming pada dataset melalui tahapan preprocessing dan algoritma klasifikasi yang performanya paling baik jika pada preprocessing dilakukan stemming. Metode klasifikasi menggunakan metode Naive Bayes dan Logistic Regression. Hasil percobaan menunjukan pengaruh model klasifikasi Naive Bayes dan Logistic Regression terhadap penggunaan tahapan stemming pada preprocessing dengan akurasi sebesar 74,11% dan 73,57%, sedangkan tanpa melakukan stemming mendapatkan akurasi masing -masing sebesar 78,47% dan 76,29% . Dari hasil pengujian model, dapat dilihat bahwa tanpa tahapan stemming pada preprocessing memiliki tingkat akurasi yang lebih unggul pada masing-masing model sebesar 4,36% dan 2,72% dibandingkan dengan penerapan tahapan stemming pada preprocessing. Hasil tersebut menunjukan bahwa penggunaan tahapan stemming dapat menurunkan akurasi klasifikasi. Algoritma klasifikasi yang tidak banyak pengaruhnya jika pada preprocessing dilakukan stemming adalah Logistic Regression karena tingkat penurunan akurasi lebih tipis dari algoritma Naïve Bayes.

Keywords


Stemming; Preprocessing; Klasifikasi Teks; Machine Learning; Naïve Bayes; Logistic Regression

Full Text:

PDF

References


M. S. Abdurrahman, “Tantangan penetrasi internet Indonesia pada 2020,” Mar. 09, 2020.

L. N. Pradany and C. Fatichah, “ANALISA SENTIMEN KEBIJAKAN PEMERINTAH PADA KONTEN TWITTER BERBAHASA INDONESIA MENGGUNAKAN SVM DAN K-MEDOID CLUSTERING,” SCAN - J. Teknol. Inf. dan Komun., vol. XI, pp. 59–66, 2016.

F. Nurhuda, S. Widya Sihwi, and A. Doewes, “Analisis Sentimen Masyarakat terhadap Calon Presiden Indonesia 2014 berdasarkan Opini dari Twitter Menggunakan Metode Naive Bayes Classifier,” J. Teknol. Inf. ITSmart, vol. 2, no. 2, p. 35, 2016, doi: 10.20961/its.v2i2.630.

S. N. J. Fitriyyah, N. Safriadi, and E. E. Pratama, “Analisis Sentimen Calon Presiden Indonesia 2019 dari Media Sosial Twitter Menggunakan Metode Naive Bayes,” J. Edukasi dan Penelit. Inform., vol. 5, no. 3, p. 279, 2019, doi: 10.26418/jp.v5i3.34368.

L. D. Mahbubah and E. Zuliarso, “Analisa Sentimen Twitter Pada Pilpres 2019 Menggunakan,” Sintak, pp. 194–195, 2019, [Online]. Available: https://www.unisbank.ac.id/ojs/index.php/sintak/article/view/7585.

D. T. Larose, Data Mining Methods and Models. Hoboken, New Jersey: John Wiley & Sons, Inc., 2006.

R. Mccue, “A Comparison of the Accuracy of Support Vector Machine and Nave Bayes Algorithms In Spam Classification,” p. 17, 2009, [Online]. Available: https://classes.soe.ucsc.edu/cmps242/Fall09/proj/RitaMcCueReport.pdf.

G. A. Buntoro, “Analisis Sentimen Calon Gubernur DKI Jakarta 2017 Di Twitter,” INTEGER J. Inf. Technol., vol. 2, no. 1, pp. 32–41, 2017, [Online]. Available: https://t.co/jrvaMsgBdH.

S. Akhmad, P. P. Adikara, and R. C. Wihandika, “Analisis Sentimen Kebijakan Pemindahan Ibukota Republik Indonesia dengan Menggunakan Algoritme Term-Based Random Sampling dan Metode Klasifikasi Naïve Bayes,” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 3, no. 10, pp. 10086–10094, 2019.

S. Mujilahwati, “Pre-Processing Text Mining Pada Data Twitter,” Semin. Nas. Teknol. Inf. dan Komun., vol. 2016, no. Sentika, pp. 2089–9815, 2016.

M. Kannan, S., Gurusamy, V., Vijayarani, S., Ilamathi, J. & Nithya, “Preprocessing Techniques for Text Mining Preprocessing Techniques for Text Mining,” Int. J. Comput. Sci. Commun. Networks, vol. 5, no. October 2014, pp. 7–16, 2015.

J. Asian, H. E. Williams, and S. M. M. Tahaghoghi, “Stemming Indonesian,” Conf. Res. Pract. Inf. Technol. Ser., vol. 38, no. September 2018, pp. 307–314, 2005, doi: 10.1145/1316457.1316459.

I. M. A. Agastya, “Pengaruh Stemmer Bahasa Indonesia Terhadap Peforma Analisis Sentimen Terjemahan Ulasan Film,” J. Tekno Kompak, vol. 12, no. 1, p. 18, 2018, doi: 10.33365/jtk.v12i1.70.

L. F. Narulita, “Pengaruh Proses Stemming Pada Kinerja Analisa Sentimen Pada Review Buku,” J. Has. Penelit. LPPM Untag Surabaya, vol. 3, no. Januari, pp. 55–59, 2018.

J. Atwan, M. Wedyan, Q. Bsoul, A. Hamadeen, R. Alturki, and M. Ikram, “The Effect of using Light Stemming for Arabic Text Classification,” Int. J. Adv. Comput. Sci. Appl., vol. 12, no. 5, pp. 768–773, 2021, doi: 10.14569/IJACSA.2021.0120589.

M. S. Saputri, R. Mahendra, and M. Adriani, “Emotion Classification on Indonesian Twitter Dataset,” Proc. 2018 Int. Conf. Asian Lang. Process. IALP 2018, no. November, pp. 90–95, 2019, doi: 10.1109/IALP.2018.8629262.

S. Juniarsih, E. F. Ripanti, and E. E. Pratama, “Implementasi Naive Bayes Classifier pada Opinion Mining Berdasarkan Tweets Masyarakat Terkait Kinerja Presiden dalam Aspek Ekonomi,” J. Sist. dan Teknol. Inf., vol. 8, no. 3, p. 239, 2020, doi: 10.26418/justin.v8i3.39118.

P. L. J. Akadol, “Formalization Dictionary,” 2017. https://github.com/panggi/pujangga/blob/master/resource/formalization/formalizationDict.txt.

E. Sutoyo and M. A. Fadlurrahman, “Penerapan SMOTE untuk Mengatasi Imbalance Class dalam Klasifikasi Television Advertisement Performance Rating Menggunakan Artificial Neural Network,” J. Edukasi dan Penelit. Inform., vol. 6, no. 3, p. 379, 2020, doi: 10.26418/jp.v6i3.42896.

S. Mutmainah, “Penanganan Imbalance Data Pada Klasifikasi Kemungkinan Penyakit Stroke,” J. SNATi, vol. 1, pp. 10–16, 2021, [Online]. Available: https://library.uii.ac.id/osr.

S. Defiyanti and D. L. Crispina Pardede, “Perbandingan kinerja algoritma id3 dan c4.5 dalam klasifikasi spam-mail,” ReCALL, 2008.




DOI: http://dx.doi.org/10.26418/justin.v10i3.53880

Refbacks

  • There are currently no refbacks.


Copyright (c) 2022 JUSTIN (Jurnal Sistem dan Teknologi Informasi)

ara komputer
View My Stats

Creative Commons License
All article in Justin is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License