Prediksi Bedah Toraks Menggunakan Seleksi Fitur Forward Selection dan K-Nearest Neighbor

Rangga Sanjaya, Fitriyani Fitriyani

Abstract


Kanker paru merupakan penyakit yang memerlukan tindakan penanganan yang cepat dan terarah, dimana penyebab paling tinggi dari kanker paru adalah merokok. Bedah toraks merupakan operasi yang paling umum untuk kanker paru. Bedah toraks dapat mengobati kanker paru, akan tetapi usia hidup pasien pasca operasi yang menjadi masalah, sehingga sebelum melakukan operasi dokter harus dapat memilih pasien dengan tepat berdasarkan resiko dan manfaat. Penelitian ini menggunakan dataset thoracic surgery dengan menggunakan algoritma K-Nearest Neighbor. Pada dataset thoracic surgery terdapat kelas atau fitur yang tidak relevan sehingga dilakukan seleksi fitur menggunakan Forward Selection. Eksperimen dan pengolahan data yang dilakukan, dibantu oleh software Rapidminer. Pada penelitian ini akan dilakukan perbandingan performa antara algoritma K-Nearest Neighbor tanpa seleksi fitur dengan K-Nearest Neighbor dengan seleksi fitur Forward Selection. Berdasarkan hasil pengujian dan perbandingan dari kedua model yang diusulkan, algoritma K-NN dengan optimasi fitur menggunakan metode forward selection memiliki nilai akurasi lebih baik dibandingkan dengan algoritma K-NN tanpa seleksi fitur.


Keywords


Thoracic Surgery; Forward Selection; K-Nearest Neighbor

Full Text:

PDF

References


A. Zulkifli, “Kanker Paru,†Buku Ajar iImu Penyakit Dalam, pp. 2254–2261, 2011.

M. Koklu, H. Kahramanli, and N. Allahverdi, “Applications of Rule Based Classification,†2013, no. November, pp. 1991–1998.

H. Esteva, T. G. Núñez, and R. O. Rodríguez, “Neural Networks and Artificial Intelligence in Thoracic Surgery,†Thorac. Surg. Clin., vol. 17, no. 3, pp. 359–367, 2007.

V. Sindhu, S. A. S. Prabha, S. Veni, and M. Hemalatha, “Thoracic surgery analysis using data mining techniques,†vol. 5, no. April, pp. 578–586, 2014.

K. J. Danjuma, “Performance Evaluation of Machine Learning Algorithms in Post-operative Life Expectancy in the Lung Cancer Patients,†J. Comput. Sci. Issues, 2015.

D. A. Adeniyi, Z. Wei, and Y. Yongquan, “Automated web usage data mining and recommendation system using K-Nearest Neighbor (KNN) classification method,†Appl. Comput. Informatics, vol. 12, no. 1, pp. 90–108, 2016.

B. K. Samanthula, Y. Elmehdwi, and W. Jiang, “K-nearest neighbor classification over semantically secure encrypted relational data,†Int. J. Control Theory Appl., vol. 9, no. 27, pp. 437–443, 2016.

S. Fallahpour, E. N. Lakvan, and M. H. Zadeh, “Using an ensemble classifier based on sequential floating forward selection for financial distress prediction problem,†J. Retail. Consum. Serv., vol. 34, no. March 2016, pp. 159–167, 2017.

X. Wu and V. Kumar, The Top Ten Algorithms in Data Mining. Boca Raton, London, New York: CRC Press taylor & Francis Group, 2009.

P. Koncz and J. Paralic, “An approach to feature selection for sentiment analysis,†2011 15th IEEE Int. Conf. Intell. Eng. Syst., pp. 357–362, 2011.

Alpaydın Ethem, Introduction to Machine Learning Second Edition, 2nd ed. London: MIT, 2010.

T. Xu, Q. Peng, and Y. Cheng, “Identifying the semantic orientation of terms using S-HAL for sentiment analysis,†Knowledge-Based Syst., vol. 35, pp. 279–289, 2012.

G. Forman, “An extensive empirical study of feature selection metrics for text classification,†J. Mach. Learn. Res., vol. 3, pp. 1289–1305, 2003.

D. T. Larose, Data Mining Methods and Models. 2006.

X. Wu et al., Top 10 algorithms in data mining. 2008.

C. Catal and B. Diri, “A systematic review of software fault prediction studies,†Expert Syst. Appl., vol. 36, no. 4, pp. 7346–7354, 2009.

I. H. Witten, E. Frank, and M. a. Hall, Data Mining. 2011.

I. Mierswa, “RapidMiner Voted Most Used Analytics Software in KDNuggets Poll.†.




DOI: http://dx.doi.org/10.26418/jp.v5i3.35324

Refbacks

  • There are currently no refbacks.


Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License
  View My Stats