Pivot Language Bahasa Melayu Pontianak ke Bahasa Bugis Menggunakan Neural Machine Translation

Alda Dwi Meilinda, Herry Sujaini, Novi Safriadi

Abstract


Bahasa merupakan faktor terpenting yang digunakan dalam interaksi sosial. Kemampuan berbahasa yang berbeda di kalangan masyarakat berpotensi menghambat pertukaran informasi secara verbal. Upaya yang dapat dilakukan untuk mengurangi kesalahan dalam menyampaikan informasi yaitu dengan penggunaan teknologi mesin penerjemahan. Beberapa tahun terakhir, neural machine translation telah menghasilkan terjemahan alami yang lebih akurat menggunakan arsitektur transformers dan framework tensorflow. Namun, saat ini sulit menemukan pasangan data korpus paralel dari bahasa daerah, seperti bahasa Melayu Pontianak dan bahasa Bugis, untuk memudahkan pembuatan korpus paralel digunakan bahasa Indonesia sebagai pivot language dengan arsitektur transformers. Penelitian ini bertujuan untuk mengetahui hasil nilai akurasi pada neural machine translation sebelum dan sesudah menggunakan pivot language dari bahasa Melayu Pontianak ke bahasa Bugis. Data penelitian yang digunakan berjumlah 3000 baris kalimat bahasa Melayu Pontianak dan bahasa Bugis, 3000 baris kalimat bahasa Melayu Pontianak dan bahasa Indonesia, serta 3000 baris kalimat bahasa Indonesia dan bahasa Bugis. Hasil pengujian otomatis BLEU yang diperoleh menggunakan pivot language meningkat sebesar 1,43% dibandingkan pengujian tanpa pivot language. Berdasarkan hasil penelitian penggunaan pivot language dari bahasa Melayu Pontianak ke bahasa Bugis menggunakan neural machine translation mengalami peningkatan nilai akurasi.

Keywords


Neural Machine Translation; Pivot Language; Framework Tensorflow; Transformers; BLEU

Full Text:

PDF

References


Wibowo Wahyu. 2001. Manajemen Bahasa:Pengorganisasian Karangan Pragmatik dalam Bahasa Indonesia. Jakarta: PT Gramedia Pustaka Utama.

Hua Wu dan Haifeng Wang. 2007. Pivot Language Approach for Phrase-Based Statistical Machine Translation. In Proceedings of 45th Annual Meeting of the Association for Computational Linguistics, pages 856–863.

Yong Cheng, Qian Yang, Yang Liu, Maosong Sun, dan Wei Xu. 2017. Joint training for pivot-based neural machine translation. In Proceedings of the 26th International Joint Conference on Artificial Intelligence, pages 3974-3980. AAAI Press.

Yunsu Kim, Petre Petrov, Pavel Petrushkov, Shahram Khadavi, Herman Ney. 2019. Pivot-based transfer learning for neural machine translation between non-English languages. arXiv preprint arXiv:1909.09524.

Marta R. Costa-Jussa, Noe Casas, Carlos Escolano, dan Jose A.R. Fonollosa. 2019. Chinese-Catalan : A Neural Machine Translation Approach Based on Pivoting and Attention Mechanisms. ACM Transactions on Asian and Low-Resource Language Information Processing. Vol. 18, No. 43. pp. 1-8. doi:10.1145/3312575.

Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N Gomez, Łukasz Kaiser, and Illia Polosukhin. 2017. Attention is all you need. In Advances in Neural Information Processing Systems, pages 5998–6008.

Philipp Koehn. 2017. Neural machine translation. arXiv preprint arXiv:1709.07809.

Zhixing Tan, Shuo Wang, Zonghan Yang, Gang Chen, Xuancheng Huang, Maosong Sun, dan Yang Liu. 2020. Neural Machine Translation: A review of Methods, Resources, and Tools. AI Open, 1, 5-21.

Martin Abadi, Paul Barham, Jianmin Chen, Zhifeng Chen, Andy Davis, Jeffrey Dean, Matthieu Devin, Sanjay Ghemawat, Geoffrey Irving, Michael Israd, Manjunath Kudlur, Josh Levenberg, Rajat Monga, Sherry Moore, Derek G. Murray, Benoit Stiner, Paul Tucker, Vijay Vasudevan, Pete Warden, Martin Wicke, Yuan Yu, dan Xiaoqing Zheng. 2016. TensorFlow: A system for large-scale machine learning. In 12th USENIX symposium on operating systems design and implementation (OSDI 16) (pp. 265-283).

Kishore Papineni, Salim Roukos, Todd Ward, dan Wei-Jing Zhu. 2002. BLEU: a Method for Automatic Evaluation of Machine Translation. In Proceedings of the 40th annual meeting of the Association for Computational Linguistics.pp. 311-318.

Syarifah Nurbaiti. 2020. Pendekatan Pivot Language Terhadap Nilai Akurasi Mesin Penerjemah Statistik. Skripsi. Program Studi Sarjana Teknik Informatika Universitas Tanjungpura, Pontianak.

M.I. Said. 1977. Kamus Bahasa Bugis-Indonesia. Jakarta: Pusat Pembinaan dan Pengembangan Bahasa Departemen Pendidikan dan Kebudayaan.

Nitin Madnani. 2007. Getting Started on Natural Language Processing With Python. XRDS: Crossroads, the ACM Magazine for Students, 13(4), 5-5.

Jason Brownlee. 2018. Better deep learning: train faster, reduce overfitting, and make better predictions. Machine Learning Mastery.

Wahyu Gunawan, Herry Sujaini, dan Tursina. 2021. Analisis Perbandingan Nilai Akurasi Mekanisme Attention Bah danau dan Luong pada Neural Machine Translation Bahasa Indonesia ke Bahasa Melayu Ketapang dengan Arsitektur Recurrent Neural Network. JEPIN. ISSN(e): 2548-9364, Vol 7 No. 3.




DOI: http://dx.doi.org/10.26418/jp.v9i2.59813

Refbacks

  • There are currently no refbacks.