TUNING FOR QUALITY UNTUK UJI AKURASI MESIN PENERJEMAH STATISTIK (MPS) BAHASA INDONESIA - BAHASA DAYAK KANAYATN

Muhammad Hasbiansyah, Herry Sujaini, Novi Safriadi

Abstract


Bahasa merupakan alat komunikasi yang penting bagi manusia, karena dengan menggunakan bahasa kita dapat mengetahui dan mengetahui informasi yang dibutuhkan, dengan bahasa juga manusia dapat mengekspresikan diri, menyampaikan kritik dan pendapat, pikiran serta keinginannya. Namun tidak semua orang memiliki bahasa yang sama, sehingga hal ini dapat menghalangi dalam melakukan pertukaran informasi. Oleh karena itu, saat ini salah satu teknologi yang sedang dikembangkan yaitu mesin penerjemah untuk mengatasi masalah penerjemahan bahasa. Namun kualitas dari hasil terjemahan yang dihasilkan masih mengandung keterbatasan. Hasil terjemahan yang optimal dapat diperoleh dengan menggunakan konsep penerjemahan statistik. Mesin Penerjemah Statistik (Statistical Machine Translation) merupakan sebuah pendekatan mesin penerjemah dengan hasil terjemahan yang dihasilkan atas dasar model statistik yang parameter-parameternya diambil dari hasil analisis korpus paralel. Tujuan yang ingin dicapai dalam penelitian ini adalah melakukan proses tuning pada mesin penerjemah statistik bahasa Indonesia ke bahasa Dayak Kanayatn untuk mengetahui pengaruh proses tuning terhadap hasil terjemahan. Pengujian dilakukan dengan membandingkan skor akurasi hasil terjemahan sebelum dan setelah proses tuning. Penelitian menggunakan korpus paralel sebanyak 3667. Pengujian dilakukan secara otomatis menggunakan Bilingual Evaluation Understudy (BLEU). Hasil dari pengujian adalah terdapat peningkatan skor BLEU sebesar 3,04%. Berdasarkan hasil pengujian, tingkat akurasi terjemahan setelah proses tuning pada mesin penerjemah statistik bahasa Indonesia ke bahasa Dayak Kanayatn dengan mengubah bobot parameter-parameter phrase translation, language model, distortion dan word penalty dapat meningkatkan nilai akurasi hasil terjemahan.

Keywords


Tuning for quality, mesin penerjemah statistik, BLEU, bahasa Indonesia, bahasa Dayak Kanayatn

Full Text:

PDF

References


]Akuntono, Indra. 2012. Jumlah Ragam Bahasa di Indonesia. Jakarta :

Dikti

Triyono, Sulis. 2006. Pembahasan Hasil Penelitian: Pergeseran Bahasa

Daerah Akibat Kontak Bahasa Melalui Pembauran. Yogyakarta,

LITERA Vol 5 No 1.

Manning, Christopher D., Schutze, Hinrich. 2000. Foundations Of

Statistical Natural Language Processing. London : The MIT Press

Cambridge Massachusetts.

Sujaini, Herry., Negara, Arif Bijaksana Putra. 2015. Analysis of

Extended Word Similarity Clustering based Algorithm on Cognate

Language. Gujarat: ESRSA Publications Pvt. Ltd.

Koehn, Philipp. 2007. Moses: Open Source Toolkit for Statistical

Machine Translation. Annual Meeting of the Association for

Computational Linguistics (ACL), demonstration session, Prague,

Czech Republic.

McEnery, T., et al. 2006. Corpus

-Based Language Studies: An

Advanced Resource Book. Oxon: Routledge.

Tanuwijaya, Hansel., Manurung, Hisar Maruli. 2009. Penerjemahan

Inggris

-Indonesia Menggunakan Mesin Penerjemah Statistik Dengan

Word Reordering dan Phrase Reordering. Jakarta, Jurnal ilmu

Komputer dan Informasi Vol 2 No 1.


Refbacks

  • There are currently no refbacks.


Copyright (c)

ara komputer
View My Stats

Creative Commons License
All article in Justin is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License