Perbandingan Algoritma Klasifikasi terhadap Emosi Tweet Berbahasa Indonesia

Arif Bijaksana Putra Negara, Hafiz Muhardi, Fahmi Sajid

Abstract


Twitter merupakan jejaring sosial dimana tempat orang-orang mengutarakan ekspresi dan emosi dirinya dalam bentuk tulisan. Mengidentifikasi emosi di Twitter tidak bisa menggunakan teknik text processing yang sederhana, karena kalimat pada Twitter yang singkat dan tata bahasa yang tidak teratur. Tujuan penelitian ini adalah untuk mengetahui algoritma yang mempunyai kinerja paling baik dalam menentukan klasifikasi emosi tweet pengguna Twitter Indonesia. Algoritma yang digunakan pada penelitian ini adalah Logistic Regression dan K-Nearest Neighbor. Dan juga pada penelitian ini melihat pengaruh TF-IDF dan Tuning Hyperparameter pada kedua algoritma. Hasil evaluasi menunjukkan bahwa performa model menggunakan algoritma logistic regression dengan feature extraction TF-IDF dan Tuning Hyperparameter memberikan perfoma model paling baik dengan nilai accuracy dan f1-score masing-masing sebesar 65% dan 66%. Model tersebut digunakan sebagai model prediksi machine learning untuk mengklasifikasikan dan mengelompokkan emosi-emosi pada aplikasi generik yang dibangun pada penelitian ini.


Keywords


Machine Learning; Text Mining; Emotion Classification; K-Nearest Neighbors; Logistic Regression

Full Text:

PDF

References


Phuvipadawat, S. and Murata, T. Breaking news detection and tracking in Twitter. Proceedings - 2010 IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology - Workshops, WI-IAT:120–123.

Hirat, R. 2015. A Survey On Emotion Detection Techniques using Text in Blogposts. International Bulletin of Mathematical Research. 2(1):180-187

P. R. Shaver, U. Murdaya, and R. C. Fraley, “Structure of the Indonesian Emotion Lexicon,” Asian Journal of Social Psychology, vol. 4, no. 3, pp. 201–224, 2001.

The. J. E., A. F. Wicaksono, and M. Adriani. 2015. A two-stage emotion detection on indonesian tweets. In Advanced Computer Science and Information Systems (ICACSIS). Pages 143–146.

Saputri, Mei Silviana, Rahmad Mahendra, and Mirna Adriani. 2019. “Emotion Classification on Indonesian Twitter Dataset.” Proceedings of the 2018 International Conference on Asian Language Processing, IALP 2018 (January 2019):90–95.

Alm, Cecilia Ovesdotter, Dan Roth, and Richard Sproat. 2005. “Emotions from Text: Machine Learning for Text-Based Emotion Prediction.” HLT/EMNLP 2005 - Human Language Technology Conference and Conference on Empirical Methods in Natural Language Processing, Proceedings of the Conference (October):579–86.

Pranckevičius, Tomas, and Virginijus Marcinkevičius. 2017. “Comparison of Naive Bayes, Random Forest, Decision Tree, Support Vector Machines, and Logistic Regression Classifiers for Text Reviews Classification.” Baltic Journal of Modern Computing 5(2):221–32.

Azam, Muhammad, Tanvir Ahmed, Fahad Sabah, and Muhammad Iftikhar Hussain. 2018. “Feature extraction Based Text Classification Using K-Nearest Neighbor Algorithm.” IJCSNS International Journal of Computer Science and Network Security 18(12):95–101.

Pinto, Joylin Priya, and Vijaya Murari. 2008. “Real Time Sentiment Analysis of Political Twitter Data Using Machine Learning Approach.” International Research Journal of Engineering and Technology 4124.

D Trier, AK Jain, dan T Taxt. 1996. Feature extraction methods for character recognition—a survey. Pattern Recogn. 29(4), 641–662.

Muslim, AA. 2016. Rancang Bangun Aplikasi Berbasis Web untuk Analisis Sentimen pada Mikroblog Twitter dengan Metode Naive Bayes. Electronic Theses Universitas Islam Negeri Maulana Malik Ibrahim.

Riyanto, A. 2016. Text Summarization dengan Metode K-Means Pada Artikel Berita Berbahasa Indonesia. Digital Library UNIKOM.

Rachimawan, Achmad Fachrudin. 2016. “ADS Filtering Menggunakan Jaringansyaraf Tiruan Perceptron, Naïve Bayes Classifier Dan Regresi Logistik.” 5(1):98.

Saputra, Rizal Amegia. 2014. “Komparasi Algoritma Klasifikasi Data Mining Untuk Memprediksi Penyakit Tuberculosis ( Tb ): Studi Kasus Puskesmas Karawang.” Seminar Nasional Inovasi Dan Tren (SNIT) (April):1–8.

Intansari, Ida Ayu Sevita, Santi Wulan Purnami, and Sri Pingit Wulandari. 2012. “Klasifikasi Pasien Hasil Pap Smear Test Sebagai Pendeteksi Awal Upaya Penanganan Dini Pada Penyakit Kanker Serviks Di RS. ‘X’ Surabaya Dengan Metode Bagging Logistic Regression.” Jurnal Sains Dan Seni ITS 1(1):D277–82.

Rahmadianto, Rizky, Edy Mulyanto, and T. Sutojo. 2019. “Implementasi Pengolahan Citra Dan Klasifikasi K-Nearest Neighbor Untuk Mendeteksi Kualitas Telur Ayam.” Jurnal VOI (Voice Of Informatics) 8(1):45–54.

Abdurrahman, Muhammad Hanif, Efri Suhartono, and Eka Wulandari. 2019. “Deteksi Kualitas Kemurnian Susu Sapi Melalui Pengolahan Citra Digital Menggunakan Metode Scale Invariant Feature Transform ( Sift ) Dan Klasifikasi K-Nearest Neighbor ( Knn ) Quality Detection of Cow ’ S Milk Purity Using Digital Image Processing Method O.” 6(2):3845–52.

Sreemathy. J., dan Balamurungan. P. S., 2012. An efficient text classification using KNN and naïve bayesian. International Journal on Computer Science and Engineering (IJCSE), vol. 4, no. 3, pp. 392-396.




DOI: https://doi.org/10.26418/jp.v7i2.48198

Refbacks

  • There are currently no refbacks.