Peningkatan Mesin Penerjemah Statistik dengan Menambah Kuantitas Korpus Monolingual (Studi Kasus : Bahasa Indonesia - Sunda)

Robby Darwis, Herry Sujaini, Rudy Dwi Nyoto

Abstract


Bahasa merupakan alat komunikasi yang dijadikan sarana untuk berinteraksi dengan masyarakat sekitar. Kemampuan akan penguasaan banyak bahasa tentunya akan mempermudah untuk berinteraksi dengan orang lain dari berbagai daerah yang berbeda. Oleh karena itu, diperlukan penerjemah untuk menambah pengetahuan akan berbagai bahasa yang ada. Mesin Penerjemah Statistik (Statistical Machine Translation) merupakan sebuah pendekatan mesin penerjemah dengan hasil terjemahan yang dihasilkan atas dasar model statistik yang parameter-parameternya diambil dari hasil analisis korpus paralel. Korpus paralel adalah pasangan korpus yang berisi kalimat-kalimat dalam suatu bahasa dan terjemahannya. Salah satu fitur yang digunakan untuk meningkatkan akurasi hasil terjemahan adalah dengan fitur Menambah Kuantitas Korpus Monolingual.Tujuan yang ingin dicapai dalam penelitian ini adalah melakukan penggunaan fitur Menambah Kuantitas Korpus Monolingual pada mesin penerjemah statistik bahasa Indonesia ke bahasa Sunda untuk meningkatkan nilai akurasi hasil terjemahan. Pengujian dilakukan dengan membandingkan nilai akurasi hasil terjemahan sebelum dan setelah Menambah Kuantitas Korpus Monolingual. Penelitian menggunakan korpus paralel sebanyak 3000 korpus. Pengujian dilakukan dengan dua cara, yaitu pengujian otomatis menggunakan Bilingual Evaluation Understudy (BLEU) dan pengujian oleh ahli bahasa Sunda. Dari hasil penelitian, penggunaan Menambah Kuantitas Korpus Monolingual dapat meningkatkan kualitas terjemahan untuk mesin penerjemah bahasa Indonesia ke bahasa Sunda. Hal itu terlihat dari hasil pengujian dengan menambahkan fitur Menambah Kuantitas Korpus Monolingual terdapat peningkatan nilai BLEU dengan korpus 3400 sebesar 0.32%, 4400 korpus sebesar 0.51%, 5400 korpus sebesar 0,42%, 6400 korpus sebesar 0.51%, 7400 korpus sebesar 0.87%, 8400 korpus sebesar 1.04%, 9400 korpus sebesar 1.79%  pada pengujian otomatis dan 19.13% pada pengujian oleh ahli bahasa. Berdasarkan hal tersebut, mesin penerjemah statistik bahasa Indonesia ke bahasa Sunda dengan penggunaan fitur Menambah Kuantitas Korpus Monolingual dapat meningkatkan nilai akurasi hasil terjemahan

Keywords


Menambah Kuantitas Korpus Monolingual , mesin penerjemah statistik, korpus paralel, BLEU score, Indonesia, Sunda

Full Text:

PDF

References


Sujaini, Herry. (2014). Mesin Penerjemah Situs Berita Online Bahasa Indonesia ke bahasa Melayu Pontianak. Jurnal ELKHA Vol. 6. No 2

Hidayat, Andri. (2015). Aplikasi Penerjemah Dua Arah Bahasa Indoensia - Bahasa Melayu Sambas Berbasis Web Dengan Menggunakan Decoder Moses. Pontianak: Universitas Tanjungpura

Hadi, Ibnu. 2014. Uji Akurasi Mesin Penerjemah Statistik Bahasa Indonesia ke Bahasa Melayu Sambas dan Bahasa Melayu Sambas ke Bahasa Indonesia. Pontianak: JUSTIN Vol 3 No 1.

Manning, Christopher D., Schutze, Hinrich. 2000. Foundations Of Statistical Natural Language Processing. London : The MIT Press Cambridge Massachusetts.

Tanuwijaya, Hansel. 2009. Penerjemahan Inggris-Indonesia Menggunakan Mesin Penerjemah Statistik Dengan Word Reordering dan Phrase Reordering. Jakarta, Jurnal ilmu Komputer dan Informasi Vol 2 No 1.

Indrayana, Danny. 2016. Meningkatkan Akurasi Mesin Penerjemah Bahasa Indonesia ke Bahasa Melayu Pontianak Dengan Part Of Speech. Pontianak: JUSTIN Vol 3 No 1.

Mandira, Soni. 2016. Perbaikan Probabilitas Lexical Model Untuk Meningkatkan Akurasi Mesin Penerjemah Statistik. Pontianak: JEPIN Vol 2 No 1.

Sujaini, Herry., Negara, Arif Bijaksana Putra. 2015. Analysis of Extended Word Similarity Clustering based Algorithm on Cognate Language. Gujarat: ESRSA Publications Pvt. Ltd.

Hasbiansyah, Muhammad. 2016. Tuning For Quality Untuk Uji Akurasi Mesin Penerjemah Statistik (MPS) Bahasa Indonesia - Bahasa Dayak Kanayatn. Pontianak, JEPIN Vol 1 No 1 2016.

Koehn, Philipp. 2007. Moses: Open Source Toolkit for Statistical Machine Translation. Annual Meeting of the Association for Computational Linguistics (ACL), demonstration session, Prague, Czech Republic.

McEnery, T., et al. 2006. Corpus-Based Language Studies: An Advanced Resource Book. Oxon: Routledge.

Hunston, S. 2002. Corpora in Applied Linguistics. Cambridge: Cambridge University Press.

Amalia, Farida. 2009. “Ideologi dalam Penerjemahan”. Makalah disajikan dalam Forum Ilmiah Pengajar Bahasa Prancis Prancis se Indonesia di Bandung.

Sudarno, A.P. 2011. Penerjemahan Buku Teori dan Aplikasi. Surakarta :UNS Press.

Sheddy, N. Tjandra. 2005. Analisis Penerjemahan. Jakarta, library UI Vol 8 No 1.

Papineni, K., et al. 2002. Bleu: a Method for Automatic Evaluation of Machine Translation. Philadelphia : Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics (ACL).A. Karnik, “Performance of TCP congestion control with rate feedback: TCP/ABR and rate adaptive TCP/IP,” M. Eng. thesis, Indian Institute of Science, Bangalore, India, Jan. 1999.




DOI: http://dx.doi.org/10.26418/justin.v7i1.27254

Refbacks

  • There are currently no refbacks.


Copyright (c) 2019 JUSTIN (Jurnal Sistem dan Teknologi Informasi)

ara komputer
View My Stats

Creative Commons License
All article in Justin is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License