Machine Linear untuk Analisis Regresi Linier Biaya Asuransi Kesehatan dengan Menggunakan Python Jupyter Notebook

Muhammad Sholeh, Suraya Suraya, Dina Andayati

Abstract


Machine learning atau pembelajaran mesin dikategorikan sebagai  salah satu cabang dari artificial intelligence atau kecerdasan buatan dan  algoritma yang populer diantaranya adalah melakukan prediksi dengan menggunakan regresi linear. Penelitian yang dilakukan mengimplementasikan  prediksi biaya asuransi kesehatan yang dipengaruhi berbagai faktor seperti umur, jenis kelamin, bmi (kategori berat badan), banyak anak, apakah seorang perokok dan wilayah. Prediksi yang dilakukan adalah di awal diantaranya seorang perokok dan orang yang mempunyai berat badan tidak ideal akan membayar biaya asuransi yang lebih besar jika dibandingkan dengan orang yang tidak merokok dan orang mempunyai berat badan ideal. Data diolah dari www.kaggle.com, data disimpan dalam file csv (insurance.csv). Dataset terdiri dari 1338 dan 7 kolom. Metode penelitian dilakukan dengan  memeriksa data dari data yang salah atau  dapat mengganggu proses analisis, melakukan analisis pada dataset serta membagi data menjadi data training dan data test. Proses pembagian data adalah 80% digunakan untuk data training dan 20% untuk data test. Semua proses diolah dengan menggunakan pemrograman Python. Library Python yang digunakan numpy, pandas, matplotlib, seaborn, sklearn. Proses analisis  dikerjakan dengan Jupyter Notebook. Hasil penelitian menghasilkan model regresi linear ganda y = -12436.85+  270.35 X1 -188.37 X2+342.77 X3+474.07 X4+24320.10 X5 -385.60 X6 dengan Coefficient of determination 0.7244150380582826 dan MSE 34608265.193358265. Hasil akhir analisis dilakukan perbandingan antara y aktual dengan y prediksi  baik dalam bentuk tabel maupun grafik.

Keywords


Asuransi; Jupyter Notebook; Machine Learning; Regresi Linear; Python

Full Text:

PDF

References


Robert Kurniawan and B. Yuniarto, Analisis Regresi. Jakarta: Kencana, 2016.

J. Supranto, Statistik, Teori dan Aplikasi. Surabaya: Penerbit Erlangga, 2016.

S. Burns, Python Machine Learning Deep Learning Tensorflow. 2018.

Suyanto, Machine Learning Tingkat Dasar dan Lanjut. Bandung: Informatika, 2018.

I. Goodfellow, Machine Learning. MIT Press, 2016.

B. D. F. Kurniatullah and Y. T. C. Pramudi, “Estimation of Students’ Graduation Using Multiple Linear Regression Method,” Journal of Applied Intelligent System, vol. 2, no. 1, pp. 29–36, 2017, doi: 10.33633/jais.v2i1.1415.

C. K. Puteri and L. N. Safitri, “Analysis of linear regression on used car sales in Indonesia,” Journal of Physics: Conference Series, vol. 1469, no. 1, 2020, doi: 10.1088/1742-6596/1469/1/012143.

I. Budiman and A. N. Akhlakulkarimah, “Aplikasi Data Mining Menggunakan Multiple Linear Regression Untuk Pengenalan Pola Curah Hujan,” Kumpulan jurnaL Ilmu Komputer (KLIK), vol. 02, no. 01, pp. 34–44, 2015.

V. W. Putri et al., “Penerapan Multiple Regression dalam Pendugaan Awal Kelulusan Mahasiswa,” Seminar Nasional Teknologi Informasi, Komunikasi dan Industri (SNTIKI) 9, no. 1, pp. 18–19, 2017.

S. S. Rahardjo and R. Sanusi, “Linear Regression Analysis on the Determinants of Hypertension Prevention Behavior,” Journal of Health Promotion and Behavior, vol. 4, no. 1, pp. 22–31, 2019, doi: 10.26911/thejhpb.2019.04.01.03.

A. A. Boyko et al., “Using linear regression with the least squares method to determine the parameters of the Solow model,” Journal of Physics: Conference Series, vol. 1582, no. 1, 2020, doi: 10.1088/1742-6596/1582/1/012016.

H. K. Pambudi, P. G. A. Kusuma, F. Yulianti, and K. A. Julian, “Prediksi Status Pengiriman Barang Menggunakan Metode Machine Learning,” Jurnal Ilmiah Teknologi Infomasi Terapan, vol. 6, no. 2, pp. 100–109, 2020, doi: 10.33197/jitter.vol6.iss2.2020.396.

K. Puteri and A. Silvanie, “MACHINE LEARNING UNTUK MODEL PREDIKSI HARGA SEMBAKO,” Jurnal Nasional Informatika, vol. 1, no. 2, pp. 82–94, 2020.

G. N. Ambika, B. P. Singh, B. Sah, and D. Tiwari, “Air quality index prediction using linear regression,” International Journal of Recent Technology and Engineering, vol. 8, no. 2, pp. 4247–4252, 2019, doi: 10.35940/ijrte.B2437.078219.

B. M. Yashaswini, “Logistic Regression Analysis of breast cancer tumor using Python IDE,” vol. 5, no. 22, pp. 1–3, 2017.

Prabha, Anindhitha, Archana, and B. N. M. V., “Predicting House Price Values Using Linear Regression with Ridge Regularization Approach,” International Journal of Advanced Science and Technology, vol. 29, no. 9s, pp. 5489–5495, 2020.

M. R. Fahlepi and A. Widjaja, “Penerapan Metode Multiple Linear Regression Untuk Prediksi Harga Sewa Kamar Kost,” vol. 1, no. 2, pp. 615–629, 2019.

P. Tanaman, P. Di, and K. Karawang, “Analisis regresi linier berganda dalam estimasi produktivitas tanaman padi di kabupaten karawang 1,2),” pp. 117–128, 2016.

S. N. Waghmare and C. N. Sakhale, “Formulation of Experimental Data Based model using SPSS ( Linear Regression ) for Stirrup Making Operation by Human Powered Flywheel Motor,” International Research Journal of Engineering and Technology (IRJET), vol. 02, no. 04, pp. 461–468, 2015.

N. Intan, P. Hati, and S. Nugroho, “Analisis Tingkat Penerimaan Calon Konsumen Terhadap Jenis Mobil Dengan Menggunakan Metode Regresi Linier,” Jurnal Teknik Elektro Unnes, vol. 8, no. 2, pp. 50–55, 2016, doi: 10.15294/jte.v8i2.7761.

L. Dan and X. Shi, “Estimates of Pedestrian Crossing Delay based on Multiple Linear Regression and Application,” Procedia - Social and Behavioral Sciences, vol. 96, no. Cictp, pp. 1997–2003, 2013, doi: 10.1016/j.sbspro.2013.08.225.

E. Karamazova, T. Jusufi Zenku, and Z. Trifunov, “Analysing and Comparing the Final Grade in Mathematics by Linear Regression Using Excel and SPSS,” International Journal of Mathematics Trends and Technology, vol. 52, no. 5, pp. 334–344, 2017, doi: 10.14445/22315373/ijmtt-v52p549.

E. Widianawati et al., “Optimalisasi Penggunaan Ms Excel Terhadap Kepekaan Data Informasi Kesehatan di Posyandu,” Jurnal Manajemen Informasi Kesehatan Indonesia, vol. 8, no. 1, pp. 87–92, 2020, doi: 10.33560/jmiki.v8i1.261.

A. Kurniadi and Y. Novianto, “Penerapan Metode Regresi Linier untuk Memprediksi Kebiasaan Pelanggan Studi Kasus : PT . Mensa Binasukses,” Jurnal Ilmiah Mahasiswa Teknik Informatika, vol. 2, no. 2, p. 107, 2020.

E. B. Pattikayhatu, “ANALISIS KEKERASAN MATERIAL PEGAS MOBIL DALAM PEMBUATAN PERKAKAS RUMAH TANGGA DI USAHA PANDAI BESI SEHATI JAYA - MALUKU,” Jurnal Teknik Mesin, vol. 3, no. 2, pp. 72–78, 2020.

J. Enterprise, Mengolah Data dengan Python dan Pandas. Jakarta: Elex Media Komputindo, 2021.

W. Musu et al., “Pengaruh Komposisi Data Training dan Testing terhadap Akurasi Algoritma C4 . 5,” in PROSIDING SEMINAR ILMIAH SISTEM INFORMASI DAN TEKNOLOGI INFORMASI, 2021, pp. 186–195.

E. D. Wahyuni, A. A. Arifiyanti, and M. Kustyani, “Exploratory Data Analysis dalam Konteks Klasifikasi Data Mining,” in Prosiding Nasional Rekayasa Teknologi Industri dan Informasi XIV Tahun 2019 (ReTII), 2019, pp. 263–269.

T. Cahyono, Statistika Terapan & Indikator Kesehatan. Yogyakarta: Deepublish Publisher, 2018.




DOI: http://dx.doi.org/10.26418/jp.v8i1.48822

Refbacks

  • There are currently no refbacks.