Prediksi Jeda pada Ucapan Bahasa Melayu Pontianak dengan Menggunakan Metode Shallow Parsing

M Iqbal Kamiludin, Arif Bijaksana Putra Negara, Novi Safriadi

Abstract


Penelitian ini menjelaskan bagaimana menemukan frasa jeda ucapan kalimat Bahasa Melayu Pontianak  menggunakan metode shallow parsing yang merupakan salah satu fungsi dari NLTK (Natural Language Toolkit). Metode shallow parsing ini berfungsi untuk dapat mengetahui kejadian jeda yang terjadi pada kalimat Bahasa Melayu Pontianak melalui potongan frasa. Potongan-potongan frasa yang terbentuk berhubungan dengan frasa jeda dari penutur  agar  dapat digunakan untuk keperluan generasi sistem text to speech (TTS). Metode  shallow parsing pada NLTK (Natural Language Toolkit) membutuhkan atruran grammars dan PoS tagger. Kumpulan aturan grammars dibuat dalam bentuk regular expressions untuk mengklasifikasikan kata-kata yang dapat membentuk frasa dengan menggunakan kategori sintaksis kalimat berdasarkan informasi Part Of Speech (PoS).  Hasil dari penelitian ini adalah kalimat yang telah terpotong-potong membentuk frasa-frasa jeda. Pengujian dilakukan dengan menggunakan precision, recall serta F-measure terhadap kalimat tunggal dan kalimat majemuk. Kalimat tunggal  terdiri dari 47 kalimat dan kalimat majemuk terdiri dari 121 kalimat. Berdasarkan pengujian yang telah dilakukan, didapatkan hasil bahwa metode shallow parsing yang dibentuk berdasarkan aturan grammars sudah dapat membentuk frasa jeda pada kalimat Bahasa Melayu Pontianak. Hasil dari pengujian diperoleh nilai precision dan nilai recall untuk kalimat tunggal adalah 0.74 dan 0.78 dengan nilai f-measure 0.75. Adapun pada kalimat majemuk memperoleh nilai precision dan recall sebesar 0.57 dan 0.67 dengan nilai F-measure 0.61.


Keywords


Frasa Jeda; Shallow Parsing; NLTK; Regular Expressions; Part Of Speech

Full Text:

PDF

References


Na’im, Akhsan., Syaputra, Hendri. 2010. Hasil Sensus Penduduk 2010: Kewarganegaraan, Suku Bangsa, Agama, dan Bahasa Sehari-Hari Penduduk Indonesia. Jakarta: Badan Pusat Statistik..

Novianti,Evi. 2011. Menilik Nasib Bahasa melayu Pontianak. balai Bahasa Propinsi kalimantan Barat.

Abney, S. P., 1991.Parsing By Chunk, In Robert Berwick, Steven Abney, and Carol Tenny (eds), Principle-Based Parsing. Kluwer Academic Publishers.

Arman A.A, Bijaksana Putra Negara, Arif, Purwariantia A, Kuspriyanto. 2013. Syntactic Phrase Chunking for Indonesian Language: The 4th International Conference on Electrical Engineering and Informatics (ICEEI 2013).

Chowdhury, G. 2003 Natural language processing. Annual Review of Information Science and Technology.

Jurafsky, Daniel, dan James H. Martin. 2009. Speech and Language Processing: An Introduction to Natural Language Processing, Speech Recognition, and Computational Linguistics. Edisi kedua. Prentice-Hall.

Indrayana, Danny. 2016. Meningkatkan Akurasi Pada Mesin Penerjemah Bahasa Indonesia Ke Bahasa Melayu Pontianak Dengan Part Of Speech. Pontianak: Skripsi Teknik Informatika Universitas Tanjungpura.

Wicaksono, A F dan Purwarianti, A.( 2010). HMM Based Part-of-Speech Tagger for Bahasa Indonesia. Proceeding of the Fourth Internationul MALINDO Workshop (MALINDO2010).jakarta,Indonesia.

Bijaksana Putra Negara, Arif dan Arman A.A. 2013. Syntax Based Prosody Modeling Using HMM for Bahasa Indonesia. Oriental COCOSDA held jointly with 2013 Conference on Asian Spoken Language Research and Evaluation (O-COCOSDA/CASLRE), 2013 International Conference.


Refbacks

  • There are currently no refbacks.


Copyright (c)

ara komputer View My Stats
Creative Commons License
All article in Justin is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License