Implementasi Metode K-Means Clustering dan Algoritma Cosine Similarity pada Repository Digital Jurusan Informatika

Abu Riza, Arif Bijaksana Putra Negara, Helen Sasty Pratiwi

Abstract


Penelitian ini bertujuan untuk mengelola data dokumen tugas akhir dalam Repositori Digital Jurusan Informatika. Fokus pengolahan data adalah pengelompokan dokumen berdasarkan abstrak dan penghitungan tingkat kemiripan antara dokumen-dokumen tersebut. Prosesnya dimulai dengan mengambil abstrak dari setiap dokumen tugas akhir dan melakukan pemrosesan teks menggunakan metode Nazief-Adriani. Kemudian, dilakukan perhitungan bobot kata dengan algoritma TF-IDF dan pengelompokan dokumen menggunakan K-Means Clustering. Selanjutnya, dihitung tingkat kemiripan antara dokumen-dokumen dalam kelompok menggunakan Cosine Similarity. Penelitian ini juga mengimplementasikan sistem berupa website yang memungkinkan pengguna mengakses dan memanfaatkan hasil pengolahan data. Diharapkan penelitian ini dapat memberikan pengelompokan dokumen tugas akhir yang efisien dan akurat berdasarkan abstrak, serta tingkat kemiripan yang baik antara dokumen-dokumen tersebut. Hal ini akan membantu pengguna mencari informasi relevan dan meningkatkan manajemen Repositori Digital Jurusan Informatika.


Keywords


Repositori Digital, abstrak, pengolahan dokumen, K-Means Clustering, Cosine Similarity, Text Processing, TF-IDF.

Full Text:

PDF


DOI: https://doi.org/10.26418/juara.v2i2.73974

Refbacks

  • There are currently no refbacks.


Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.


View My Stats

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.