Pemilihan Distance Measure Pada K-Means Clustering Untuk Pengelompokkan Member Di Alvaro Fitness

Mario Anggara, Herry Sujaini, Helfi Nasution

Abstract


Clustering merupakan salah satu metode Data Mining yang bersifat tanpa arahan (unsupervised). Ada dua jenis data clustering yang sering dipergunakan dalam proses pengelompokan data yaitu hierarchical (hirarki) data clustering dan non-hierarchical (non hirarki) data clustering. KMeans Clustering merupakan salah satu metode data clustering non hirarki yang berusaha mempartisi data yang ada ke dalam bentuk satu atau lebih cluster/kelompok. Salah satu ciri clustering yang baik atau optimal adalah jika menghasilkan cluster yang berisi data dengan tingkat kemiripan (similarity) yang tinggi pada cluster yang sama dan tingkat kemiripan rendah pada cluster yang berbeda. Distance measure digunakan untuk mengukur kemiripan data dalam suatu cluster. Hasil dari proses clustering akan menghasilkan hasil yang berbeda apabila distance measure yang digunakan berbeda. Fitness atau kebugaran didefinisikan sebagai keberhasilan seseorang dalam beradaptasi dengan tekanan fisik dan mental yang ditemui dalam hidupnya. Fitness secara umum didefinisikan sebagai program latihan yang disusun secara ilmiah dan sistematis untuk membantu atlet dalam beradaptasi dengan beban fisik yang dihadapinya dalam suatu latihan yang terkontrol. Peminat fitness yang semakin bertambah membuat member di setiap fitness centre ikut bertambah. Pengelompokkan terhadap member tersebut dibutuhkan oleh setiap fitness centre. Member fitness tersebut dapat dikelompokkan dengan cara clustering. Alvaro fitness merupakan salah satu fitness centre yang berkembang saat ini. Pengujian pada penelitian ini dilakukan dengan pengujian silhouette coefficient. Hasil pengujian Silhouette Coefficient setiap distance measure nya, antara lain Euclidean Distance bernilai 0,232149, Manhattan Distance bernilai 0,240016, dan Chebyshev Distance bernilai 0.242821. Berdasarkan hasil dari pengujian silhouette coefficient yang dilakukan, distance measure paling optimal untuk kasus ini adalah Chebyshev Distance ,yaitu dengan nilai silhouette coefficient paling mendekati 1 adalah 0.242821.

Keywords


Clustering, K-Means Clustering, Distance Measure, Euclidean Distance, Manhattan Distance, Chebyshev Distance, Silhouette Coefficient

Full Text:

PDF

References


Agusta, Yudi. 2007.

K-Means

-Penerapan, Permasalahan dan Metode

Terkait. Jurnal Sistem dan Informatika, volume 3, no 1.

Nurjaya, Dede Rohmat. 2009. General Fitness Training. Penataran

Pelatih Cabang Olahraga Dayung pada Pengda (Pengurus Daerah),

PPLP (Pusat Pembinaan dan Latihan Olahraga Pelajar), PPLM (Pusat

Pembinaan dan Latihan Olahraga Mahasiswa) dan Perguruan Tinggi

Se

-Indonesia

Turban, E. dkk. 2005. Decicion Support Systems and Intelligent

Systems.. Yogyakarta : Andi Offset.

Larose , Daniel T. 2005. Discovering Knowledge in Data: An

Introduction to Data Mining. John Willey & Sons. Inc.

Santosa, B. 2007. Data Mining: Teknik Pemanfaatan Data untuk

Keperluan Bisnis. Yogyakarta: Graha Ilmu.

Santoso, S. 2010. Statistik Multivariat. Jakarta: Elex Media

Komputindo.

Teknomo, Kardi. 2015. Chebyshev Distance.

http://people.revoledu.com/kardi/tutorial/Similarity/ChebyshevDistan

ce.html

Handoyo, Rendy, dkk. 2014. Perbandingan Metode Clustering

Menggunakan Metode Single Linkage dan K-Means Pada

Pengelompokan Dokumen. JSM STMIK Mikroskil, volume 15, no 2.


Refbacks

  • There are currently no refbacks.


Copyright (c)

ara komputer View My Stats
Creative Commons License
All article in Justin is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License