Analisis Akurasi Algoritma Extended Word Similarity Based Clustering (EWSB) pada Mesin Penerjemah Bahasa Indonesia-Minang

Hendro Priyatman, Muhammad Saleh, Herry Sujaini

Abstract


Extended Word Similarity Based (EWSB) Clustering adalah algoritma pengklasteran kata berdasarkan nilai kemiripan kata yang didapat dari hasil komputasi terhadap sebuah korpus. Salah satu manfaat dari hasil pengklasteran dengan algoritma ini adalah untuk meningkatkan kualitas output dari sebuah mesin penerjemah berbasis statistik (MPS). Dari hasil penelitian sebelumnya, hasil pengklasteran dengan algoritma EWSB terbukti memperbaiki akurasi mesin penerjemah bahasa Inggris sebagai Bahasa asal ke bahasa Indonesia sebagai Bahasa target, dimana algoritma tersebut diaplikasikan pada bahasa Indonesia sebagai bahasa target. Paper ini mendiskusikan hasil penelitian penggunaan EWSB pada MPS dari bahasa Indonesia ke bahasa Minang, dimana algoritma tersebut diaplikasikan pada bahasa Minang sebagai bahasa target. Penelitian yang dilakukan memperoleh hasil bahwa algoritma EWSB cukup efektif jika digunakan pada bahasa Minang sebagai bahasa target. Hasil penelitian ini menunjukkan bahwa penggunaan algoritma EWSB dapat meningkatkan tingkat akurasi terjemahan sebesar 6,36%.


Keywords


Mesin penerjemah statistik; Extended Word Similarity Based (EWSB) Clustering; bahasa Indonesia-Minang

Full Text:

PDF

References


Koehn, P., dan Hoang, H., 2007. “Factored translation models”, Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning.

Youssef, I., Sakr, M., dan M. Kouta, 1999. Linguistic factors in statistical machine translation involving arabic language, IJCSNS International Journal of Computer Science and Network Security, Vol.9 No.11.

Razavian, N. Sharif, dan Vogel, S., 2010. “Fixed length word suffix for factored statistical machine translation”, Proceedings of the ACL 2010 Conference Short Papers, Uppsala.

Sujaini, H., Kuspriyanto, Arman, A.A. dan Purwarianti, A., 2013. Extended Word Similarity Based Clustering on Unsupervised PoS Induction to Improve English-Indonesian Statistical Machine Translation, 16th ORIENTAL COCOSDA/CASLRE-2013, Gurgaon, India.

Sujaini H., dan Bijaksana, A., 2015. “Analisis Penggunaan Algoritma EWSB pada Mesin Penerjemah Bahasa Indonesia-Inggris”, Seminar Nasional FORTEI 2015, Pontianak.

Juzrizal, 2012. “Tatabahasa Bahasa Minangkabau”. UNP Press. Padang

Efendi, R., Fitri M., dan Andreswari, D., 2014. Andreswari, “Rancang Bangun Aplikasi Kamus Bahasa Indonesia-Minang, Minang-Indonesia Berbasis Android”, Jurnal Ilmiah Bidang Sains –Teknologi Murni Disiplin dan Antar Disiplin. Vol.1 No.14

Peng, L. A., 2013. “Survey of Machine Translation Methods”. TELKOMNIKA Indonesian Journal of Electrical Engineering. 11(12): 7125-7130

Sujaini, H., Kuspriyanto, Arman, A.A. dan Purwarianti, 2012. “Pengaruh part-of-speech pada mesin penerjemah bahasa inggris-indonesia berbasis factored translation model”, SNATI 2012, Yogyakarta.

Maskur, 2014. “Relevansi Hasil Pencarian Pada Mesin Pencari Berdasarkan Kedekatan Kata Menggunakan Ontologi”, Junal Gamma, Vol. 10, No. 1., 123-129

Hermawan, R.F., Romadhony, A., Al-Faraby, S., 2017. Implementasi dan Analisis Kesamaan Semantik pada Bahasa Indonesia dengan Metode berbasis Vektor, e-Proceeding of Engineering, Vol.4, No.3, 4641-4649.

Jiang, J.J., and Conrath, D.W. 1997, Semantic Similarity Based on Corpus Statistics and Lexical Taxonomy, In Proceedings of International Conference Research on Computational Linguistics (ROCLING X), Taiwan.

Hartuv, E., and Shamir, R., 2000. "A Clustering Algorithm Based on Graph Connectivity", Information processing letters, vol. 76, no. 4-6.

Uppada, S.K. 2014. Centroid Based Clustering Algorithms - A Clarion Study, (IJCSIT) International Journal of Computer Science and Information Technologies, Vol. 5, NO. 6, 7309-7313.

Mumtaz, K.K. and Duraiswamy, K. 2010. An Analysis on Density Based Clustering of Multi Dimensional Spatial Data, Indian Journal of Computer Science and Engineering, Vol. 1, No. 1.




DOI: http://dx.doi.org/10.26418/jp.v6i3.43330

Refbacks

  • There are currently no refbacks.