Uji Nilai Akurasi pada Neural Machine Translation (NMT) Bahasa Indonesia ke Bahasa Tiochiu Pontianak dengan Mekanisme Attention Bahdanau

Lo Bun San, Herry Sujaini, Tursina Tursina

Abstract


Mesin penerjemah merupakan cabang penting dari pemrosesan bahasa alami yang bertujuan untuk menerjemahkan bahasa alami menggunakan komputer. Mesin penerjemahan statistik sudah banyak diuji dalam kasus terjemahan bahasa lokal/daerah oleh penelitian di Indonesia. Penelitian mesin penerjemahan neural beberapa tahun belakangan ini, terus menjadi pilihan dalam mesin penerjemahan yang bahkan sampai saat ini sudah diterapkan pada google. Mesin penerjemah dimanfaatkan sebagai usaha dalam membudidayakan suatu bahasa lokal/daerah untuk komputasi, supaya bahasa tersebut tidak hilang karena pengaruh bahasa dilingkungan tempat tinggal yang berbeda-beda. Dalam pengujian ini mekanisme yang digunakan dalam mesin terjemahan neural adalah mekanisme attention Bahdanau dari uji akurasi penerjemahan Bahasa Indonesia ke Bahasa Tiochiu. Mekanisme attention Bahdanau muncul sebagai pengujian peningkatan akurasi terbaik saat ini berkat penggunaan rumus skor attentionnya. Adapun pengujian bahasa alami yang digunakan adalah kalimat bahasa Indonesia diterjemahkan ke kalimat bahasa Tiochiu Pontianak dengan mekanisme Attention Bahdanau pada Mesin Penerjemah Neural. Data korpus pararel yang diuji adalah 500 kalimat dengan data latih adalah 4500 kalimat. Perlunya dilakukan penelitian terhadap mekanisme attention untuk nilai akurasi tertinggi berdasarkan nilai skor BLUE dan ahli bahasa. Langkah-langkah yang digunakan dalam menguji dan mendapatkan nilai akurasi skor BLEU mekanisme attention dimulai dari metode membagi data uji secara validasi k-fold cross sebanyak 10 data uji dan masing-masing data uji tersebut dilatih sebanyak tujuh kali pengujian dari jumlah epoch kelipatan 10. Setelah didapatkan skor nilai akurasinya dari pelatihan sebanyak 70 kali tersebut dihitung dan dicari rata-rata nilai akurasi tertinggi didasarkan jumlah epoch didapatkan serta uji manual oleh ahli bahasa dengan mengambil sampel dari data uji yang memiliki akurasi tertinggi tersebut. Hasil uji mekanisme mesin terjemahan neural dengan attention Bahdanau yang didapatkan terdapat pada sampel uji6. Rata-rata nilai akurasi paling tinggi sebesar 18,41% pada epoch 50, dan uji oleh ahli bahasa pada 167 kalimat terjemahan memperoleh nilai akurasi sebesar 54,51%. Serta uji otomatis BLEU paling tinggi dengan pengujian k-fold cross validation pada sampel uji6 dengan jumlah epoch 50 sebesar 24,26%. Nilai akurasi otomatis BLEU tertinggi pada sampel Uji6 dengan tanpa Attention Bahdanau sebesar 12,41%. Sehingga dapat disimpulkan bahwa dengan mekanisme Attention Bahdanau adalah tingkat hasil akurasi yang terbaik.


Keywords


Mesin Penerjemah Jaringan Saraf Tiruan; Mekanisme Attention Bahdanau; Deep Learning Tensorflow; Pemrosesan Bahasa Alami; Bahasa Indonesia; Bahasa Tiochiu Pontianak

Full Text:

PDF

References


D. Bahdanau, K. H. Cho, and Y. Bengio, “Neural machine translation by jointly learning to align and translate,” 3rd Int. Conf. Learn. Represent. ICLR 2015 - Conf. Track Proc., pp. 1–15, 2015.

N. Kalchbrenner and P. Blunsom, “Recurrent continuous translation models,” EMNLP 2013 - 2013 Conf. Empir. Methods Nat. Lang. Process. Proc. Conf., no. October, pp. 1700–1709, 2013.

I. Sutskever, O. Vinyals, and Q. V. Le, “Sequence to sequence learning with neural networks,” Adv. Neural Inf. Process. Syst., vol. 4, no. January, pp. 3104–3112, 2014.

K. Cho et al., “Learning phrase representations using RNN encoder-decoder for statistical machine translation,” in EMNLP 2014 - 2014 Conference on Empirical Methods in Natural Language Processing, Proceedings of the Conference, 2014, pp. 1724–1734, doi: 10.3115/v1/d14-1179.

Z. Abidin, “Translation of Sentence Lampung-Indonesian Languages with Neural Machine Translation Attention Based Approach,” Inov. Pembang. J. Kelitbangan, vol. 6, no. 02, pp. 191–206, 2018, doi: 10.35450/jip.v6i02.97.

D. Sebagai, S. Satu, U. Memperoleh, and G. Sarjana, “Mesin penerjemah bahasa inggris – indonesia berbasis jaringan saraf tiruan dengan mekanisme attention menggunakan arsitektur transformer skripsi,” 2018.

W. Untara and T. Setiawan, “Problema Mesin Penerjemah Berbasis Ai Dalam Proses Penerjemahan Buku Inggris-Indonesia Dan Solusinya,” Adab. J. Bhs. dan Sastra, vol. 4, no. 1, p. 92, 2020, doi: 10.14421/ajbs.2020.04105.

M. Y. Aristyanto and R. Kurniawan, “Pengembangan Metode Neural Machine Translation Berdasarkan Hyperparameter Neural Network,” Semin. Nas. Off. Stat., vol. 2021, no. 1, pp. 935–946, 2021, doi: 10.34123/semnasoffstat.v2021i1.789.

Y. Fauziyah, R. Ilyas, and F. Kasyidi, “MESIN PENTERJEMAH BAHASA INDONESIA-BAHASA SUNDA MENGGUNAKAN RECURRENT NEURAL NETWORKS,” vol. 16, pp. 313–322, 2022.

W. Gunawan, H. Sujaini, and T. Tursina, “Analisis Perbandingan Nilai Akurasi Mekanisme Attention Bahdanau dan Luong pada Neural Machine Translation Bahasa Indonesia ke Bahasa Melayu Ketapang dengan Arsitektur Recurrent Neural Network,” J. Edukasi dan Penelit. Inform., vol. 7, no. 3, p. 488, 2021, doi: 10.26418/jp.v7i3.50287.

M. T. Luong, H. Pham, and C. D. Manning, “Effective approaches to attention-based neural machine translation,” Conf. Proc. - EMNLP 2015 Conf. Empir. Methods Nat. Lang. Process., pp. 1412–1421, 2015, doi: 10.18653/v1/d15-1166.

J. Gu, K. Cho, and V. O. K. Li, “Trainable greedy decoding for neural machine translation,” EMNLP 2017 - Conf. Empir. Methods Nat. Lang. Process. Proc., pp. 1968–1978, 2017, doi: 10.18653/v1/d17-1210.

A. Karpathy and L. Fei-Fei, “Deep Visual-Semantic Alignments for Generating Image Descriptions,” IEEE Trans. Pattern Anal. Mach. Intell., vol. 39, no. 4, pp. 664–676, 2017, doi: 10.1109/TPAMI.2016.2598339.

Y. Marathe, “Neural Machine Translation using Bahdanau Attention Mechanism,” medium.com, 2020. .

G. Loye, “Attention Mechanism,” blog.floydhub.com, 2019. .

J. Brownlee, “What is Teacher Forcing for Recurrent Neural Networks?,” machinelearningmastery.com, 2021. .

M.-T. Luong, “Neural Machine Translation,” Stanford University, 2016.

M. S. Islam and B. S. Purkayastha, “English to Bodo Phrase-Based Statistical Machine Translation,” in Advanced Computing and Communication Technologies, Springer, 2018, pp. 207–217.




DOI: http://dx.doi.org/10.26418/jp.v9i3.63346

Refbacks

  • There are currently no refbacks.