Perbandingan Klasifikasi dengan Pendekatan Pembelajaran Mesin untuk Mengidentifikasi Tweet Hoaks di Media Sosial Twitter

Shanto Moyrano Tambunan, Yessica Nataliani, Elizabeth Sri Lestari

Abstract


Perkembangan teknologi tidak luput dari dampak negatif, salah satunya hoaks. Twitter menjadi salah satu media sosial yang paling aktif digunakan sebagai pertukaran informasi, komunikasi, dan hiburan. Oleh karena itu pengguna Twitter dapat menyebarkan berita atau hoaks dengan mudah. Penelitian ini bertujuan mengidentifikasi tweet yang berisi informasi hoaks maupun valid menggunakan pembelajaran mesin. Algoritma yang digunakan adalah Stochastic Gradient Descent, Naïve Bayes, Random Forest, dan Rocchio. Keempat algoritma tersebut dibandingkan untuk kemudian dicari hasil terbaik dalam mengidentifikasi dan memverifikasi tweet di Twitter yang berisi hoaks atau informasi valid secara otomatis. Kata kunci yang digunakan adalah Corona, Mutasi Corona, PSBB, Dana Bansos, Dana Otsus, Utang Pemerintah, dan Sekolah Tatap Muka sebanyak 898 tweet. Data dikelompokkan berdasarkan kelas hoaks dan valid lalu diolah menjadi dataset dengan melewati tahap pra-proses hingga pembobotan kata dengan TF-IDF. Hasil pengujian menunjukkan algoritma Stochastic Gradient Descent merupakan algoritma terbaik dengan hasil akurasi rata-rata sebesar 84.92%. Pengujian lanjutan dilakukan dengan menghitung nilai presisi, recall, dan F-1. Hasil presisi terbaik sebesar 82.95% pada algoritma Naïve Bayes, sedangkan hasil recall dan F-1 terbaik didapat dari algoritma Stochastic Gradient Descent sebesar 85.05% dan 82.42%.


Keywords


Klasifikasi; Hoaks; Tweet; Pembelajaran Mesin; Random Forest; Naïve Bayes; Stochastic Gradient Descent; Rocchio

Full Text:

PDF

References


J. Hutahaean, Konsep Sistem Informasi, 1st ed. Yogyakarta: Deepublish, 2014.

Asosiasi Penyelenggara Jasa Internet Indonesia (APJII), “Laporan Survei Internet APJII 2019 - 2020 [Q2],” 2020. https://www.apjii.or.id/survei.

Masyarakat Telematika Indonesia (Mastel), “Hasil Survey Wabah Hoax Nasional 2019,” 2019. https://mastel.id/hasil-survey-wabah-hoax-nasional-2019/.

A. B. Prasetijo, R. R. Isnanto, D. Eridani, Y. A. A. Soetrisno, M. Arfan, and A. Sofwan, “Hoax detection system on Indonesian news sites based on text classification using SVM and SGD,” Proc. - 2017 4th Int. Conf. Inf. Technol. Comput. Electr. Eng. ICITACEE 2017, vol. 2018-Janua, pp. 45–49, 2017, doi: 10.1109/ICITACEE.2017.8257673.

J. C. W. Pantouw, “Perbandingan klasifikasi rocchio dan multinomial naïve bayes pada analisis sentimen data twitter bahasa indonesia,” Dep. Ilmu Komput. Fak. Mat. Dan Ilmu Pengetah. Alam Inst. Pertan. Bogor 2017, 2017.

M. D. Nugraha, J. A. Utama, and S. Sulistiani, “Implementasi Metode Random Forest Dalam Memprediksi Peristiwa Flare,” Pros. Semin. Nas. Fis., pp. 258–263, 2018.

A. Afriza and J. Adisantoso, “Metode Klasifikasi Rocchio untuk Analisis Hoax Rocchio Classification Method for Hoax Analysis,” J. Ilmu Komput. Agri-Informatika, vol. 5, pp. 1–10, 2018, [Online]. Available: http://journal.ipb.ac.id/index.php/jika.

E. Rasywir and A. Purwarianti, “Eksperimen pada Sistem Klasifikasi Berita Hoax Berbahasa Indonesia Berbasis Pembelajaran Mesin,” J. Cybermatika, vol. 3, no. 2, pp. 1–8, 2015, [Online]. Available: https://www.mendeley.com/import/.

T. Trisna Astono Putri, H. S. Warra, I. Yanti Sitepu, and M. Sihombing, “Analysis and Detection of Hoax Contents in Indonesian News Based on Machine Learning,” J. Informatics Pelita Nusant., vol. 4, no. 1, pp. 19–26, 2019, [Online]. Available: http://e-jurnal.pelitanusantara.ac.id/index.php/JIPN/article/view/489/291.

B. Irena and Erwin Budi Setiawan, “Fake News (Hoax) Identification on Social Media Twitter using Decision Tree C4.5 Method,” J. RESTI (Rekayasa Sist. dan Teknol. Informasi), vol. 4, no. 4, pp. 711–716, 2020, doi: 10.29207/resti.v4i4.2125.

H. Mustofa and A. A. Mahfudh, “Klasifikasi Berita Hoax Dengan Menggunakan Metode Naive Bayes,” Walisongo J. Inf. Technol., vol. 1, no. 1, p. 1, 2019, doi: 10.21580/wjit.2019.1.1.3915.

C. Juditha, “Hoax Communication Interactivity in Social Media and Anticipation (Interaksi Komunikasi Hoax di Media Sosial serta Antisipasinya),” J. Pekommas, vol. 3, no. 1, p. 31, 2018, doi: 10.30818/jpkm.2018.2030104.

B. Liu, Sentiment Analysis and Opinion Mining, no. April. 2012.

B. Kurniawan, M. A. Fauzi, and A. W. Widodo, “Klasifikasi Berita Twitter Menggunakan Metode Improved Naïve Bayes,” J. Pengemb. Teknol. Inf. dan Ilmu Komput. Univ. Brawijaya, vol. 1, no. 10, pp. 1193–1200, 2017.

R. Umar, I. Riadi, and P. Purwono, “Klasifikasi Kinerja Programmer pada Aktivitas Media Sosial dengan Metode Stochastic Gradient Descent,” JOINTECS (Journal Inf. Technol. Comput. Sci., vol. 5, no. 2, p. 55, 2020, doi: 10.31328/jointecs.v5i2.1324.

F. R. Lumbanraja, J. I. Komputer, and F. U. Lampung, “Sistem Pencarian Data Teks dengan Menggunakan Metode Klasifikasi Rocchio ( Studi Kasus : Dokumen Teks Skripsi ),” 2013.

R. R. Muzad Aad Miqdad, “Korpus Berita Daring Bahasa Indonesia Dengan Depth First Focused Crawling,” Sentrinov (Seminar Nas. Terap. Ris. Inov., vol. 2, no. 1, pp. 11–20, 2016.

F. N. Rozi and D. H. Sulistyawati, “Klasifikasi Berita Hoax Pilpres Menggunakan Metode Modified K-Nearest Neighbor Dan Pembobotan Menggunakan Tf-Idf,” Konvergensi, vol. 15, no. 1, 2019, doi: 10.30996/konv.v15i1.2828.

D. Maulina and R. Sagara, “Klasifikasi Artikel Hoax Menggunakan Support Vector Machine Linear Dengan Pembobotan Term Frequency-Inverse Document Frequency,” J. Mantik Penusa, vol. 2, no. 1, pp. 35–40, 2018.

C. A. Ul Hassan, M. S. Khan, and M. A. Shah, “Comparison of machine learning algorithms in data classification,” ICAC 2018 - 2018 24th IEEE Int. Conf. Autom. Comput. Improv. Product. through Autom. Comput., no. September, pp. 1–6, 2018, doi: 10.23919/IConAC.2018.8748995.

A. A. Puspitasari, E. Santoso, and Indriati, “Klasifikasi Dokumen Tumbuhan Obat Menggunakan Metode Improved k-Nearest Neighbor,” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 2, no. 2, pp. 486–492, 2018.




DOI: http://dx.doi.org/10.26418/jp.v7i2.47232

Refbacks

  • There are currently no refbacks.