PENERAPAN SYNTHETIC MINORITY OVERSAMPLING TECHNIQUE DALAM MENGATASI DATA TIDAK SEIMBANG PADA METODE CLASSIFICATION AND REGRESSION TREE

Rizky Dwi Permatasari, Setyo Wira Rizki, Naomi Nessyana Debataraja

Abstract


Metode Classification and Regression Trees (CART) merupakan teknik klasifikasi berbentuk pohon klasifikasi, yang menggambarkan hubungan antara variabel independen dan dependennya. Ketidakseimbangan data dapat menyebabkan rendahnya nilai sensitivitas dan nilai Area Under Curve (AUC). Salah satu metode yang dapat mengatasi data tidak seimbang adalah dengan melakukan Synthetic Minority Oversampling Technique (SMOTE). SMOTE merupakan teknik dengan penambahan data buatan pada kelas minoritas pada tahap sebelum menganalisis data. Tujuan  dari penelitian ini untuk membandingkan model tanpa dan dengan SMOTE pada metode CART. Adapun untuk langkah-langkah dalam melakukan SMOTE yaitu dengan menentukan nilai oversampling sebanyak data yang akan dibangkitkan pada data kelas minoritasnya. Sedangkan untuk membentuk pohon klasifikasi yaitu dengan cara pemilihan pemilah, penentuan simpul terminal, penandaan label kelas, dan penentuan pohon klasifikasi optimal. Data yang digunakan dalam penelitian ini adalah data sekunder hasil survey sosial ekonomi nasional (SUSENAS) tahun 2017 di Kabupaten Sambas dengan 494 sampel yang terdiri dari 8 variabel independen  dan satu variabel dependen. Hasil ketepatan klasifikasi penelitian ini, menunjukkan bahwa model dengan SMOTE menghasilkan nilai lebih akurat dibandingkan dengan model tanpa SMOTE. Hal ini dapat dilihat model dengan SMOTE menghasilkan nilai sensitivitas lebih tinggi yaitu 67,05% dari sebelumnya yaitu 36,36%, dan nilai AUC 94,35% lebih tinggi dari sebelum dilakukan SMOTE.

 

Kata kunci: Pohon Klasifikasi, Ketepatan Klasifikasi, data tidak seimbang, Oversampling


Full Text:

PDF


DOI: http://dx.doi.org/10.26418/bbimst.v9i1.38949

Refbacks

  • There are currently no refbacks.