K NEAREST NEIGHBOR DALAM IMPUTASI MISSING DATA
Abstract
Missing data adalah suatu informasi yang tidak tersedia dalam suatu data. Missing data mempengaruhi hasil penelitian karena keberadaan missing data dapat mengurangi tingkat akurasi dari hasil penelitian. Missing data dapat diatasi dengan imputasi. Imputasi merupakan suatu metode yang mengatasi missing data dengan mengisi nilai yang hilang dengan suatu nilai berdasarkan informasi lain yang didapat dari data tersebut. Salah satu metode imputasi adalah metode K Nearest Neighbor (KNN). Penelitian ini dilakukan untuk memprediksi nilai yang hilang dengan metode KNN. KNN bekerja dengan menghitung weight mean estimation berdasarkan jumlah K. K adalah jumlah observasi terdekat yang akan digunakan. Dalam penelitian ini, K yang digunakan yaitu , , , dan . Mean Square Error (MSE) dan Mean Absolute Percentage Error (MAPE) digunakan untuk mengetahui ketepatan hasil imputasi. Berdasarkan nilai rata-rata MSE dan MAPE dari replikasi, KNN terbaik pada missing data dan terjadi pada saat , sedangkan untuk missing data 30% terjadi saat .
Kata kunci : weight mean estimation, MSE, MAPE
Full Text:
PDFDOI: http://dx.doi.org/10.26418/bbimst.v7i1.23498
Refbacks
- There are currently no refbacks.