Optimasi Rabin Karp dengan Rolling Hash dan k-Gram pada Similarity Check Dokumen Abstrak Jurnal

Siti Yuliyanti, Euis Nur Fiitriani Dewi, Andi Nur Rachman

Abstract


Rolling hash digunakan untuk mengatasi masalah hash pada Rabin Karp dengan memperbaharui kemunculan string berulang dengan menghitung nilai hash dari substring, dimana nilai hash dihitung lebih cepat dengan nilai hash lama sehingga dapat dibandingkan secara konstan. Kemudian penelitian ini menambahkan k-gram untuk melakukan pergerakan dari kata satu ke kata didepannya, dengan tujuan mampu meningkatkan akurasi dengan pengechekan teks pada dokumen yang lebih spesifik. Tahapan penelitian meliputi pengumpulan dataset yang berasal dari dokumen abstrak jurnal yang kemudian dilakukan praproses mulai dari cleansing, case folding, filtering, stemming dengan stopword selanjutnya implementasi rolling hash dan k-gram pada Rabin Karp untuk meningkatkan sensifitas pada similarity check serta mengetahui peningkatan presentase ketepatan dalam mendeteksi kemiripan dokumen. Hasil penelitian Hasil pengujian menunjukan k=7 menunjukan kemiripan lebih tinggi dibanding k=5 karena penelitian ini menggunakan panjang karakter jurnal > n dengan nilai kemiripan tertinggi yaitu k=7 pada dokumen jurnal 4 yaitu kemiripan abstrak 49,93% dan kemiripan judul 14,00% sedangkan untuk k=5 yaitu 12,01% kemiripan abstrak dan 4,17% kemiripan judul sehingga k-gram, basis, dan modulo berpengaruh terhadap perhitungan similarity dokumen.


Keywords


k-gram; rolling hash; rabin karp; similarity check; substring

Full Text:

PDF

References


W. A. S. S L B Ginting, Y R Ginting, Sutomo, “Aplikasi Deteksi Kemiripan Kata Menggunakan Algoritma Rabin-Karp,” J. Teknol. dan Inf., vol. 12, no. 2, pp. 162–175, 2022, doi: 10.34010/jati.v12i2.

T. Xplore, “Deteksi Plagiarisme Abstrak Skripsi dengan Menggunakan Algoritma Rabin Karp ( Studi Kasus : Fakultas Ilmu Komputer Universitas Singaperbangsa Karawang ),” vol. 6, no. 2, pp. 75–81, 2021.

A. Sunyoto and T. Informatika, “Implementasi Algoritma Rabin Karp untuk Pendeteksian Plagiat Dokumen Teks Menggunakan Konsep Similarity,” vol. 2, no. 7, pp. 23–28, 2013.

I. Widaningrum, D. Mustikasari, R. Arifin, and E. Dyah Cahyani, “Analisa Penggunaan K-Gram pada Karakter, Kata dan Kalimat untuk Mendeteksi Kesamaan Dokumen,” Pros. Semin. Nas. Teknoka, vol. 5, no. 2502, pp. 59–64, 2020, doi: 10.22236/teknoka.v5i.333.

F. Teknik, T. Informatika, U. Pamulang, T. Documents, and R. Algorithm, “Implementasi Algoritma Rabin-Karp Untuk Pendeteksian Plagiarisme Pada File Dokumen Berupa Text Berbasis Web,” vol. 3, no. 3, pp. 150–154, 2022, doi: 10.47065/josh.v3i3.1404.

R. Apriani et al., “Analisis Sentimen dengan Naïve Bayes Terhadap Komentar Aplikasi Tokopedia,” J. Rekayasa Teknol. Nusa Putra, vol. 6, no. 1, pp. 54–62, 2019, [Online]. Available: https://rekayasa.nusaputra.ac.id/article/view/86

A. Filcha and M. Hayaty, “Implementasi Algoritma Rabin-Karp untuk Pendeteksi Plagiarisme pada Dokumen Tugas Mahasiswa,” JUITA J. Inform., vol. 7, no. 1, p. 25, 2019, doi: 10.30595/juita.v7i1.4063.

A. Pratama Putra, Y. Pratama, E. Kharisma Krisnadi, I. Purnamasari, and D. Dwi Saputra, “Text Mining untuk Sentimen Analisis dengan Metode Naïve Bayes, SMOTE, N-Gram dan AdaBoost Pada Twitter CommuterLine,” J. Sains Komput. Inform. (J-SAKTI, vol. 6, no. 2, pp. 961–973, 2022.

H. Setiawan, E. Utami, and S. Sudarmawan, “Analisis Sentimen Twitter Kuliah Online Pasca Covid-19 Menggunakan Algoritma Support Vector Machine dan Naive Bayes,” J. Komtika (Komputasi dan Inform., vol. 5, no. 1, pp. 43–51, 2021, doi: 10.31603/komtika.v5i1.5189.

D. A. Putra and H. Sujaini, “Implementasi Algoritma Rabin-Karp untuk Membantu Pendeteksian Plagiat pada Karya Ilmiah,” J. Sist. dan Teknol. Inf., vol. 4, no. 1, pp. 66–74, 2015, [Online]. Available: http://jurnal.untan.ac.id/index.php/justin/article/view/12411

D. N. Sari and D. P. Utomo, “Implementasi Algoritma Rabin-Karp Pada Pencarian Quotes Tokoh Terkenal,” Pelita Inform. Inf. dan Inform., vol. 9, no. 1, pp. 43–55, 2020.

T. Jaringan, S. Bahri, and R. Wajhillah, “InfoTekJar : Jurnal Nasional Informatika dan Optimalisasi Algoritma Rabin Karp menggunakan TF-IDF Dalam Pencocokan Text Pada Penilaian Ujian Essay Otomatis,” vol. 2, pp. 4–7, 2020.

T. Tawang, I. Billhaqqi, and G. W. Wicaksono, “ANALISIS PERBANDINGAN ALGORITMA RABIN - KARP DAN WINNOWING DALAM PENILAIAN JAWABAN,” pp. 269–276, 2020.

T. Hidayat and M. Muttaqin, “Pengujian Sistem Informasi Pendaftaran dan Pembayaran Wisuda Online menggunakan Black Box Testing dengan Metode Equivalence Partitioning dan Boundary Value Analysis,” J. Tek. Inform. UNIS JUTIS, vol. 6, no. 1, 2018.

A. Nisa, E. Darwiyanto, and I. Asror, “Analisis Sentimen Menggunakan Naive Bayes Classifier dengan Chi-Square Feature Selection Terhadap Penyedia Layanan Telekomunikasi,” e-Proceeding Eng. , vol. 6, no. 2, p. 8650, 2019.




DOI: http://dx.doi.org/10.26418/justin.v12i1.71224

Refbacks

  • There are currently no refbacks.


Copyright (c) 2024 JUSTIN (Jurnal Sistem dan Teknologi Informasi)

ara komputer
View My Stats

Creative Commons License
All article in Justin is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License