Perbandingan Algoritma Logistic Regression dan Random Foret (Studi Kasus : Klasifikasi Emosi Tweet)
Abstract
Media sosial telah menjadi tempat dimana setiap orang dapat mengungkapan perasan dan pikirannya tanpa batasan. Salah satu media sosial yang paling banyak digunakan adalah Twitter. Twitter memiliki 238 juta pengguna aktif dan memberi pengguna akses untuk mencari informasi melalui Tweet tertentu. Sehingga Twitter dapat dijadikan sebagai sumber informasi untuk menganalisis emosi seseorang berdasarkan tulisan/Tweet yang dibuatnya. Dalam menganalisis emosi sebuah Tweet, diperlukan suatu metode untuk mengklasifikasikan Tweet ke dalam kelas emosi yang tepat. Klasifikasi emosi Tweet bertujuan untuk mengelompokkan Tweet ke dalam kelas emosi yang telah ditentukan sebelumnya seperti kemarahan, kegembiraan, ketakutan, cinta, dan kesedihan. Algoritma yang digunakan untuk membangun model machine learning untuk klasifikasi emosi yaitu Logistic Regression dan Random Forest. Tujuan dari penelitian ini adalah untuk mengetahui algoritma klasifikasi Multinomial Naive Bayes dan Decision Tree mana yang lebih baik dengan membandingkan hasil nilai accuracy dari algoritma klasifikasi tersebut. Penelitian ini juga menerapkan metode SMOTE. Hasil penelitian menunjukkan bahwa model klasifikasi Logistic Regresion memiliki nilai accuracy tertinggi sebesar 78.22%. Sedangkan model klasifikasi Random Forest memiliki nilai accuracy tertinggi sebesar 72.41%.
Keywords
Full Text:
PDFReferences
E. H. Radja and E. P. Citra, “Analisis Self-Disclosure Pada Fenomena Hyperhonest Di Media Sosial,” Pustaka Komun., vol. 3, no. 2, pp. 222–224, 2020, [Online]. Available: http://journal.moestopo.ac.id/index.php/pustakom
D. R. Febryanti, Z. K. Mahmud, S. V. Putri, F. M. Ovalia, and Y. Sekarwangi, “Tipologi Hate Speech di Twitter Terkait Kebijakan Pemerintah Selama Pandemi COVID-19,” J. Komun. Glob., vol. 11, no. 2, pp. 274–299, 2022, doi: 10.24815/jkg.v11i2.26733.
I. Santoso, S. Tinggi, I. Komputer, C. Karya, and U. T. Muhammadiyah, “ANALISIS SENTIMEN PADA TWITTER TERHADAP GAGALNYA PELAKSANAAN PIALA DUNIA DI INDONESIA,” vol. 7, no. 2, 2023.
P. B. N. Setio, D. R. S. Saputro, and Bowo Winarno, “Klasifikasi Dengan Pohon Keputusan Berbasis Algoritme C4.5,” Prism. Pros. Semin. Nas. Mat., vol. 3, pp. 64–71, 2020.
A. C. Müller and S. Guido, “Introduction to Machine Learning with Python A GUIDE FOR DATA SCIENTISTS Introduction to Machine Learning with Python.”
O. M. Aborisade and M. Anwar, “Classification for authorship of tweets by comparing Logistic Regression and naive bayes classifiers,” Proc. - 2018 IEEE 19th Int. Conf. Inf. Reuse Integr. Data Sci. IRI 2018, pp. 269–276, 2018, doi: 10.1109/IRI.2018.00049.
A. Poornima and K. S. Priya, “A Comparative Sentiment Analysis of Sentence Embedding Using Machine Learning Techniques,” 2020 6th Int. Conf. Adv. Comput. Commun. Syst. ICACCS 2020, pp. 493–496, 2020, doi: 10.1109/ICACCS48705.2020.9074312.
M. Haidermota, “Classifying Twitter User As a Bot or Not and Comparing Different Classification Algorithms.,” Int. J. Adv. Res. Comput. Sci., vol. 9, no. 3, pp. 29–33, 2018, doi: 10.26483/ijarcs.v9i3.5949.
S. Sudianto, P. Wahyuningtias, H. W. Utami, U. A. Raihan, and H. N. Hanifah, “Comparison Of Random Forest And Support Vector Machine Methods On Twitter Sentiment Analysis ( Case Study : Internet Selebgram Rachel Vennya Escape From Quarantine ) Perbandingan Metode Random Forest Dan Support Vector Machine Pada Analisis Sentimen Twitt,” Jutif, vol. 3, no. 1, pp. 141–145, 2022.
S. Sofyan and A. Prasetyo, “Penerapan Synthetic Minority Oversampling Technique (SMOTE) Terhadap Data Tidak Seimbang Pada Tingkat Pendapatan Pekerja Informal Di Provinsi D.I. Yogyakarta Tahun 2019,” Semin. Nas. Off. Stat., vol. 2021, no. 1, pp. 868–877, 2021, doi: 10.34123/semnasoffstat.v2021i1.1081.
F. D. Ananda and Y. Pristyanto, “Analisis Sentimen Pengguna Twitter Terhadap Layanan Internet Provider Menggunakan Algoritma Support Vector Machine,” MATRIK J. Manajemen, Tek. Inform. dan Rekayasa Komput., vol. 20, no. 2, pp. 407–416, 2021, doi: 10.30812/matrik.v20i2.1130.
L. M. Siniwi, A. Prahutama, and A. R. Hakim, “QUERY EXPANSION RANKING PADA ANALISIS SENTIMEN MENGGUNAKAN KLASIFIKASI MULTINOMIAL NAÏVE BAYES (Studi Kasus : Ulasan Aplikasi Shopee pada Hari Belanja Online Nasional 2020),” J. Gaussian, vol. 10, no. 3, pp. 377–387, 2021, doi: 10.14710/j.gauss.v10i3.32795.
S. Manikandan, “Frequency distribution,” J. Pharmacol. Pharmacother., vol. 2, no. 1, pp. 54–56, 2011, doi: 10.4103/0976-500X.77120.
C. H. Yutika, A. Adiwijaya, and S. Al Faraby, “Analisis Sentimen Berbasis Aspek pada Review Female Daily Menggunakan TF-IDF dan Naïve Bayes,” J. Media Inform. Budidarma, vol. 5, no. 2, p. 422, 2021, doi: 10.30865/mib.v5i2.2845.
S. Vluymans, “Learning from imbalanced data,” Stud. Comput. Intell., vol. 807, no. 9, pp. 81–110, 2019, doi: 10.1007/978-3-030-04663-7_4.
M. Nawawi and R. Marliansyah, “Klasifikasi Tingkat Popularitas Siswa Berdasarkan Aktifitas Komunikasi Siswa Menggunakan Smartphone dengan Teknik Logistic Regression,” Annu. Res. Semin. …, vol. 4, no. 1, pp. 978–979, 2019, [Online]. Available: http://seminar.ilkom.unsri.ac.id/index.php/ars/article/view/2082
A. Primajaya and B. N. Sari, “Random Forest Algorithm for Prediction of Precipitation,” Indones. J. Artif. Intell. Data Min., vol. 1, no. 1, p. 27, 2018, doi: 10.24014/ijaidm.v1i1.4903.
C. Lorento, A. Bijaksana, P. Negara, and R. Dwi, “Implementasi Sentimen Masyarakat berdasarkan Tweet terkait Kebijakan Kemendikbud di Masa Pandemi Covid-19 Implementation of Community Sentiment based on Tweets related to Ministry of Education and Culture Policies during the Covid-19 Pandemic,” vol. 10, no. 3, 2022, doi: 10.26418/justin.v10i3.54243.
DOI: http://dx.doi.org/10.26418/jari.v2i1.69682
Refbacks
- There are currently no refbacks.

This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
View My Stats

This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.