Perbandingan Algoritma Klasifikasi dalam Pendeteksian Hoax pada Media Sosial

Antonius Yonathan, Herry Sujaini, Enda Esyudha Pratama

Abstract


Pada media sosial, hoax atau berita palsu sering beredar. Pendeteksian hoax secara otomatis memerlukan program ataupun aplikasi yang mengimplementasikan algoritma klasifikasi untuk dapat membedakan konten hoax dengan konten fakta. Pada penelitian ini, lima algoritma klasifikasi, yaitu Multilayer Perceptron, Naïve Bayes, Support Vector Machine, Decision Tree, dan Random Forest dibandingkan kemampuannya dalam mengklasifikasikan data teks Tweet dari media sosial Twitter untuk mengetahui algoritma manakah yang paling akurat dalam mengklasifikasikan data tersebut. Pengujian yang dilakukan adalah pengujian, precision, recall, f1-score dan accuracy. Menurut hasil pengujian rata-rata nilai precision, algoritma Random Forest mendapat nilai tertinggi yaitu 0,8221, sedangkan Support Vector Machine terendah pada 0,7802. Untuk rata-rata nilai recall, Support Vector Machine mendapat nilai tertinggi dengan skor 1,000 sedangkan Multilayer Perceptron terendah dengan skor 0,7990. Untuk F1-Score, rata-rata nilai tertinggi terdapat pada algoritma Naive Bayes, yaitu 0,8742, sementara rata-rata nilai terendah terdapat pada algoritma Multilayer Perceptron dengan nilai 0,7989. Pada rata-rata nilai accuracy, nilai tertinggi berada pada algoritma Naive Bayes dengan nilai 0,7933 dan nilai terendah berada pada algoritma Multilayer Perceptron dengan nilai 0,7033.


Keywords


Klasifikasi; Hoax; Pembelajaran Mesin; Penggalian Teks

Full Text:

PDF

References


Alpaydin, Ethem. Introduction to Machine Learning. MIT Press, Massachusets, 2010.

Allen, David M. 1974. The Relationship between Variable Selection and Data Agumentation and a Method for Prediction.

Beazley, David. Python Essential Reference, New Riders, San Francisco, 2002.

Bishop, C. M. 2002. Pattern Recognition and Machine Learning.

Hastie, Trevor, Tibshirani, Robert & Friedman, Jerome. 2008. The Elements of Statistical Learning: Data Mining, Inference, and Prediction (Second ed.). New York: Springer

Himma-Kadakas, Marju. 2017. Alternative Facts and Fake News Entering Journalistic Content Production Cycle". Cosmopolitan Civil Societies: An Interdisciplinary Journal.

Ho, Tin Kam. 1995. Random Decision Forests. Proceedings of the 3rd International Conference on Document Analysis and Recognition, Montreal

Jogiyanto, H. M. 2005. Analisis dan Desain Sistem Informasi. Yogyakarta, Andi Offset.

Manning, C. D., Schütze, Hinrich & Raghavan, Prabhakar. 2009. An Introduction to Information Retrieval. Cambridge Univeristy Press, Cambridge.

Mitchell. 1997. Machine Learning. McGraw Hill.

Rokach, Lior, Maimon, O. 2008. Data Mining with Decision Trees: Theory and Applications. World Scientific Pub Co Inc.

Rozi, I. F. 2012. Implementasi Opinion Mining (Analisis Sentimen) untuk Ekstraksi Data Opini Publik Pada Perguruan Tinggi. Jurnal Teknik Elektro Universitas Brawijaya.

Rumelhart, David E., Geoffrey E. Hinton, dan R. J. Williams. 1986. Learning Internal Representations by Error Propagation.

Russell, Stuart dan Norvig, Peter. 2003. Artificial Intelligence: A Modern Approach (2nd ed.). Prentice Hall.

Suyanto, M. 2004. Analisa dan Desain Aplikasi Multimedia Untuk Pemasaran. Yogyakarta, Andi.




DOI: https://doi.org/10.26418/jari.v1i1.53126

Refbacks

  • There are currently no refbacks.


Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.


View My Stats

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.