Penilaian Kinerja Akurasi Metode Klasifikasi dalam Dataset Penerimaan Mahasiswa Baru Universitas XYZ

Indra Griha Tofik Isa, Febie Elfaladonna

Abstract


Universitas XYZ merupakan salah satu Perguruan Tinggi yang berlokasi di Kota Palembang yang melakukan kegiatan Penerimaan Mahasiswa Baru (PMB) untuk menjaring calon mahasiswa. Data PMB dari tahun ke tahun belum digunakan secara optimal dalam menghasilkan pengetahuan yang memberikan nilai manfaat bagi pengguna, sehingga diperlukan sebuah pemodelan data yang efisien dan tepat untuk menghasilkan akurasi data yang baik. Penelitian yang dilakukan bertujuan untuk menilai kinerja akurasi pemodelan yang terdapat dalam metode klasifikasi yang meliputi pemodelan k-NN, Decision Tree Classifier, Naive Bayes Classifier, Support Vector Machine (SVM) dan AdaBoost terhadap fitur dalam dataset Penerimaan Mahasiswa Baru (PMB) yang digunakan untuk memprediksi preferensi pemilihan program studi. 26 Fitur dalam dataset diamati hingga menghasilkan 6 fitur yang memiliki nilai korelasi yang tinggi untuk dilibatkan dalam penilaian kinerja akurasi, yang meliputi ‘Jurusan Sekolah’, ‘Penghasilan’, ‘Tahun Masuk’, ‘Tahun Lulus’, ‘Tipe Sekolah’ dan ‘Status Sekolah’ dengan data record sebanyak 2.704 data. Tahapan dilakukan menggunakan Data Life Cycle yang meliputi: (1) Business Understanding yang terdiri dari Penentuan Masalah, Tujuan Proyek, Solusi dari Perspektif Bisnis, dan Instrumen Pengukuran Keberhasilan; (2) Data Understanding dengan penelaahan data; (3) Data Preparation; (4) Modeling; (5) Evaluation. Hasil akhir menunjukkan bahwa k-NN classifier memiliki persentasi akurasi tertinggi sebesar 72.2% dan direkomendasikan dalam pemodelan preferensi program studi bagi calon mahasiswa baru di Universitas XYZ Kota Palembang.


Keywords


Data Mining; Klasifikasi; Penerimaan Mahasiiswa Baru; Dataset PMB; Penilaian Akuras

Full Text:

PDF

References


S. A. Nulhaqim, R. D. Heryady, R. Pancasilawan, and M. Fedryansyah, “Peranan Perguruan Tinggi Dalam Meningkatkan Kualitas Pendidikan Di Indonesia Untuk Menghadapi Asean Community 2015,” Share Soc. Work J., vol. 6, no. 2, pp. 197–219, 2015.

K. Law, T. Li, and S. Geng, “Student enrollment, motivation and learning performance in a blended learning environment: The mediating effects of social, teaching, and cognitive presence,” Comput. Educ., vol. 136, no. September, pp. 1–12, 2019, doi: 10.1016/j.compedu.2019.02.021.

D. Bukhari, “Data Science Curriculum: Current Scenario,” Int. J. Data Min. Knowl. Manag. Process, vol. 10, no. 3, pp. 1–13, 2020, doi: 10.5121/ijdkp.2020.10301.

P. Saini, “Building a Classification Model for Enrollment in Higher Educational Courses using Data Mining Techniques,” ArXiv, vol. 1405, no. 3729, pp. 696–697, 2014, doi: 10.1021/ja01318a049.

D. A. A. AlHammadi and M. S. Aksoy, “Data Mining in Higher Education,” Period. Eng. Nat. Sci., vol. 1, no. 2, pp. 1–4, 2013, doi: 10.21533/pen.v1i2.17.

S. Alturki and N. Alturki, “Using Educational Data Mining to Predict Students’ Academic Performance for Applying Early Interventions,” J. Inf. Technol. Educ. Innov. Pract., vol. 20, pp. 121–137, 2021. doi: 10.28945/4835

L. W. Santoso and Yulia, “The Analysis of Student Performance Using Data Mining,” Adv. Intell. Syst. Comput., vol. 924, no. June, pp. 559–573, 2019, doi: 10.1007/978-981-13-6861-5_48.

I. G. T. Isa, “Aplikasi Asesmen Calon Debitur menggunakan Naive Bayes di Koperasi Mitra Sejahtera SMK Negeri 1 Kota Sukabumi,” J. Sisfokom (Sistem Inf. dan Komputer), vol. 10, no. 1, pp. 31–39, 2021, doi: 10.32736/sisfokom.v10i1.1013.

I. G. T. Isa and D. Jhoansyah, “Implementasi Association Rules Dalam Menentukan Posisi Gerobak (Studi Kasus: Foodcourt Universitas Muhammadiyah Sukabumi),” Inform. Mulawarman J. Ilm. Ilmu Komput., vol. 13, no. 2, p. 65, 2019, doi: 10.30872/jim.v13i2.1273.

F. Marisa, “Educational Data Mining (Konsep dan Penerapan),” J. Teknol. Inf., vol. 4, no. 2, pp. 91–93, 2013.

C. Romero and S. Ventura, “Educational data mining: A review of the state of the art,” IEEE Trans. Syst. Man Cybern. Part C Appl. Rev., vol. 40, no. 6, pp. 601–618, 2010, doi: 10.1109/TSMCC.2010.2053532.

C. C. Aggarwal, Data Classification Algorithms and Application. New York: CRC Press, 2015.

M. K. Anam, B. N. Pikir, and M. B. Firdaus, “Penerapan Na ̈ıve Bayes Classifier, K-Nearest Neighbor (KNN) dan Decision Tree untuk Menganalisis Sentimen pada Interaksi Netizen danPemeritah,” MATRIK J. Manajemen, Tek. Inform. dan Rekayasa Komput., vol. 21, no. 1, pp. 139–150, 2021, doi: 10.30812/matrik.v21i1.1092.

J. Hurwitz and D. Kirsch, Machine Learning for Dummies. New Jersey: John Wiley & Sons, Inc, 2018.

M. Brackett, Data Resource Understanding. Utilizing the Data Resource Data. New Jersey: Technics Publication, 2015.

O. Masmoudi, M. Jaoua, A. Jaoua, and S. Yacout, “Data Preparation in Machine Learning for Condition-based Maintenance,” J. Comput. Sci., vol. 17, no. 6, pp. 525–538, 2021, doi: 10.3844/JCSSP.2021.525.538.

S. Suthaharan, Machine Learning Models and Algorithms for Big Data Classification. North Carolina: Springer, 2016.

M. Hossin, “A Review on Evaluation Metrics for Data Classification Evaluations,” Int. J. Data Min. Knowl. Manag. Process, vol. 5, no. 2, pp. 01–11, 2015, doi: 10.5121/ijdkp.2015.5201.

P. Schober and L. A. Schwarte, “Correlation Coefficients: Appropriate Use and Interpretation,” Anesth. Analg., vol. 126, no. 5, pp. 1763–1768, 2018, doi: 10.1213/ANE.0000000000002864.

A. Suad A. and B. Wesam S., “Review of data preprocessing techniques in data mining.pdf,” J. Eng. Appl. Sci., vol. 12, no. 16, pp. 4102–4107, 2017, doi: doi=jeasci.2017.4102.4107.




DOI: http://dx.doi.org/10.26418/jp.v8i2.54316

Refbacks

  • There are currently no refbacks.