Aplikasi Pengoreksi Ejaan (Spelling Correction) pada Naskah Jurnal Bidang Informatika dengan N-Gram dan Jaro-Winkler Distance

Jefri Hasiholan Simanjuntak, Herry Sujaini, Hafiz Muhardi

Abstract


Kesalahan penulisan atau typographical error adalah hal yang biasa terjadi dalam penulisan suatu dokumen. Namun dalam penulisan dokumen karya ilmiah seperti jurnal penelitian, hal tersebut harus dihindari karena dapat membuat informasi yang disampaikan menjadi tidak jelas ataupun bias. Untuk mengatasi permasalan tersebut dibutuhkan sebuah aplikasi spelling corrector yang mampu mendeteksi typographical error dan dapat memberikan rekomendasi kata yang sesuai. Terdapat banyak metode yang bisa diimplementasikan dalam membangun sebuah aplikasi spelling corrector, diantaranya ialah N-Gram dan Jaro-Winkler Distance. Jaro-Winkler Distance berperan untuk menghitung nilai kemiripan antara kata yang mengalami typographical error terhadap kata pada korpus untuk mencari daftar kata yang paling mendekati. Korpus yang digunakan disusun dari naskah jurnal bidang informatika serta kosa kata KBBI. Kemudian N-Gram digunakan untuk mencari nilai probabilitas kata dengan memperhatikan satu kata sebelum dan satu kata sesudahnya atau yang disebut nilai bigram. Metode-metode tersebut diterapkan pada sebuah aplikasi spelling corrector berbasis web yang dapat mendeteksi kesalahan penulisan dan memberikan rekomendasi perbaikan pada dokumen Microsoft Word (.docx), khususnya dokumen jurnal bidang informatika. Pengujian aplikasi dilakukan dengan 9 jenis kesalahan penulisan. Jumlah kalimat yang diujikan adalah 180 kalimat dan pada tiap kalimat terdapat satu kata yang salah. Pengujian memperoleh hasil yang menyatakan bahwa aplikasi ini memberikan tingkat kesesuaian atau presisi 71,348% dan tingkat kesuksesan 98,449% untuk memberikan satu saran perbaikan kata yang sesuai untuk satu kata yang salah dalam suatu kalimat. Metode-metode tersebut dapat diterapkan untuk memperbaiki typographical error akan tetapi kualitas dan kuantitas korpus sangat berpengaruh pada hasil yang diberikan, sehingga masih sangat dibutuhkan korpus yang lebih baik lagi.


Keywords


jaro-winkler distance; jurnal bidang informatika; korpus; n-gram; spelling corrector.

Full Text:

PDF

References


Jamilah, “Penggunaan Bahasa Baku dalam Karya Ilmiah Mahasiswa,” J. Tarb. J. Ilm. Kependidikan, vol. 6, no. 2, pp. 41–52, 2017, doi: 10.18592/tarbiyah.v6i2.1603.

J. Frando, I. Ruslianto, and R. Hidayati, “Penerapan Jaro Winkler Distance Dalam Aplikasi Pengoreksi Kesalahan Penulisan Bahasa Indonesia Berbasis Web [1],” J. Komput. dan Apl., vol. 07, no. 03, pp. 44–53, 2019.

M. S. Simanjuntak, H. Sujaini, and N. Safriadi, “Spelling Corrector Bahasa Indonesia dengan Kombinasi Metode Peter Norvig dan N-Gram,” J. Edukasi dan Penelit. Inform., vol. 4, no. 1, p. 17, 2018, doi: 10.26418/jp.v4i1.24075.

V. Ningrum, “Penggunaan Kata Baku Dan Tidak Baku Di Kalangan Mahasiswa Universitas Pembangunan Nasional ‘Veteran’ Yogyakarta,” J. Skripta, vol. 5, no. 2, pp. 22–27, 2020, doi: 10.31316/skripta.v5i2.398.

A. I. Fahma, I. Cholissodin, and R. S. Perdana, “Identifikasi Kesalahan Penulisan Kata ( Typographical Error ) pada Dokumen Berbahasa Indonesia Menggunakan Metode N-gram dan Levenshtein Distance,” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 2, no. 1, pp. 53–62, 2018.

R. Martin, D. S. Naga, V. C. Mawardi, T. Informatika, U. Tarumanagara, and G. Petamburan, “PENGGUNAAN SPELLING CORRECTION DENGAN METODE PETER NORVIG DAN N-GRAM,” J. Ilmu Komput. dan Sist. Inf., vol. 9, no. 1, pp. 175–180, 2021.

T. Maghfira, I. Cholissodin, and A. Widodo, “Deteksi Kesalahan Ejaan dan Penentuan Rekomendasi Koreksi Kata yang Tepat Pada Dokumen Jurnal JTIIK Menggunakan Dictionary Lookup dan Damerau-Levenshtein Distance,” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 1, no. 6, pp. 498–506, 2017.

F. A. Muttaqin and A. M. Bachtiar, “Implementasi Teks Mining Pada Aplikasi Pengawasanpenggunaan Internet Anak ‘Dodo Kids Browser,’” J. Ilm. Komput. dan Inform., 2016.

P. M. Prihatini, “Implementasi Ekstraksi Fitur Pada Pengolahan Dokumen Berbahasa Indonesia,” J. Matrix, vol. 6, no. 3, pp. 174–178, 2016.

E. Septiandri, “Rancang Bangun Aplikasi Information Retrieval Untuk Mengkoleksi Data Paralel Korpus Teks Bahasa Inggris – Bahasa Indonesia,” vol. 84, pp. 487–492, 2013, [Online]. Available: http://ir.obihiro.ac.jp/dspace/handle/10322/3933.

Mutammimah, H. Sujaini, and R. D. Nyoto, “Peter Norvig dan Spelling Checker BK-Trees pada Kata Berbahasa Indonesia,” J. Sist. dan Teknol. Inf., vol. 5, no. 1, pp. 1–5, 2016.

A. Kurniawati, S. Puspitodjati, and S. Rahman, “Implementasi Algoritma Jaro-Winkler Distance untuk Membandingkan Kesamaan Dokumen Berbahasa Indonesia,” Proceeding, Semin. Ilm. Nas. Komput. dan Sist. Intelijen KOMMIT 2008, Depok, Indones., 2010.

A. Prasetyo, W. M. Baihaqi, and I. S. Had, “Algoritma Jaro-Winkler Distance: Fitur Autocorrect dan Spelling Suggestion pada Penulisan Naskah Bahasa Indonesia di BMS TV,” J. Teknol. Inf. dan Ilmu Komput., vol. 5, no. 4, p. 435, 2018, doi: 10.25126/jtiik.201854780.

C. Supriadi, H. D. Purnomo, and I. Sembiring, “Sensitivitas Sistem Pencarian Artikel Bahasa Indonesia Menggunakan Metode n-gram Dan Tanimoto Cosine,” J. Transform., vol. 18, no. 1, p. 63, 2020, doi: 10.26623/transformatika.v18i1.2184.

S. Santoso and R. Nurmalina, “Perencanaan dan Pengembangan Aplikasi Absensi Mahasiswa Menggunakan Smart Card Guna Pengembangan Kampus Cerdas (Studi Kasus Politeknik Negeri Tanah Laut),” J. Integr., vol. 9, no. 1, pp. 84–91, 2017.




DOI: http://dx.doi.org/10.26418/jp.v8i2.48092

Refbacks

  • There are currently no refbacks.