Peringkasan Teks Otomatis pada Modul Pembelajaran Berbahasa Indonesia Menggunakan Metode Cross Latent Semantic Analysis (CLSA)

Yunita Maulidia Sari, Nenden Siti Fatonah

Abstract


Perkembangan teknologi yang pesat membuat kita lebih mudah dalam menemukan informasi-informasi yang dibutuhkan. Permasalahan muncul ketika informasi tersebut sangat banyak. Semakin banyak informasi dalam sebuah modul maka akan semakin panjang isi teks dalam modul tersebut. Hal tersebut akan memakan waktu yang cukup lama untuk memahami inti informasi dari modul tersebut. Salah satu solusi untuk mendapatkan inti informasi dari keseluruhan modul dengan cepat dan menghemat waktu adalah dengan membaca ringkasannya. Cara cepat untuk mendapatkan ringkasan sebuah dokumen adalah dengan cara peringkasan teks otomatis. Peringkasan teks otomatis (Automatic Text Summarization) merupakan teks yang dihasilkan dari satu atau lebih dokumen, yang mana hasil teks tersebut memberikan informasi penting dari sumber dokumen asli, serta secara otomatis hasil teks tersebut tidak lebih panjang dari setengah sumber dokumen aslinya. Penelitian ini bertujuan untuk menghasilkan peringkasan teks otomatis pada modul pembelajaran berbahasa Indonesia dan mengetahui hasil akurasi peringkasan teks otomatis yang menerapkan metode Cross Latent Semantic Analysis (CLSA). Jumlah data yang digunakan pada penelitian ini sebanyak 10 file modul pembelajaran yang berasal dari modul para dosen Universitas Mercu Buana, dengan format .docx sebanyak 5 file dan format .pdf sebanyak 5 file. Penelitian ini menerapkan metode Term Frequency-Inverse Document Frequency (TF-IDF) untuk pembobotan kata dan metode Cross Latent Semantic Analysis (CLSA) untuk peringkasan teks. Pengujian akurasi pada peringkasan modul pembelajaran dilakukan dengan cara membandingkan hasil ringkasan manual oleh manusia dan hasil ringkasan sistem. Yang mana pengujian ini menghasilkan rata-rata nilai f-measure, precision, dan recall tertinggi pada compression rate 20% dengan nilai berturut-turut 0.3853, 0.432, dan 0.3715.

Keywords


Cross Latent Semantic Analysis; Modul Pembelajaran; Peringkasan Teks Otomatis; TF-IDF

Full Text:

PDF

References


Y. N. Kholisho, “Pengembangan Modul Pembelajaran Multimedia untuk Meningkatkan Minat dan Pemahaman Konsep Mahasiswa Prodi Pendidikan Informatika,” EDUMATIC J. Pendidik. Inform., vol. 1, no. 1, p. 17, 2017, doi: 10.29408/edumatic.v1i1.733.

I. P. G. Hendra Saputra, “Peringkasan Teks Otomatis Untuk Dokumen Bahasa Bali Berbasis Metode Ektraktif,” J. Ilmu Komput., vol. 10, no. 1, pp. 33–38, 2018.

M. A. Ubaidillah, I. B. G. Dwidasmara, and A. Muliantara, “Peringkas Teks Otomatis Berita Online Menggunakan Metode Cross Latent SemanticAnalysis & Cosine Similarity,” JELIKU (Jurnal Elektron. Ilmu Komput. Udayana), vol. 9, no. 1, p. 105, 2020, doi: 10.24843/jlk.2020.v09.i01.p11.

S. Twinandilla, S. Adhy, B. Surarso, and R. Kusumaningrum, “Multi-Document Summarization Using K-Means and Latent Dirichlet Allocation (LDA) - Significance Sentences,” Procedia Comput. Sci., vol. 135, pp. 663–670, 2018, doi: 10.1016/j.procs.2018.08.220.

J. Saputra, M. Fachrurrozi, and Yunita, “Peringkasan Teks Berita Berbahasa Indonesia Menggunakan Metode Latent Semantic Analysis (LSA) dan Teknik Steinberger & Jezek,” Comput. Sci. ICT, vol. 3, no. 1, pp. 215–219, 2017.

G. Mandar and G. Gunawan, “Peringkasan dokumen berita Bahasa Indonesia menggunakan metode Cross Latent Semantic Analysis,” Regist. J. Ilm. Teknol. Sist. Inf., vol. 3, no. 2, p. 94, 2017, doi: 10.26594/register.v3i2.1161.

D. M. Fazar and N. I. Widiastuti, “Lexical Chain dan Word Sense Disambiguation Untuk Peringkasan Artikel Berbahasa Indonesia,” Techno.Com, vol. 16, no. 2, pp. 195–207, 2017, doi: 10.33633/tc.v16i2.1413.

I. No and J. Pinto, “Available Online at www.ijarcs.info TEXT SUMMARIZER FOR URL AND . DOCX FILES,” vol. 11, no. 4, pp. 18–22, 2020.

M. D. Diana, B. D. Satya, and F. Rahutomo, “Penerapan Algoritma Score-Based pada Peringkasan Teks Cerpen Otomatis,” Semin. Inform. Apl. POLINEMA 2020, 2020.

D. Andriani and M. T. Furqon, “Peringkasan Teks Otomatis Pada Artikel Berita Hiburan Berbahasa Indonesia Menggunakan Metode BM25,” vol. 3, no. 3, pp. 2603–2610, 2019.

H. Noprisson and V. Ayumi, “Implementasi Algoritma Nazief- Adriani Pada Fitur Tebak Kata di Web Edukasi Bahasa Indonesia,” JSAI (Journal Sci. Appl. Informatics), vol. 1, no. 1, pp. 18–23, 2018, doi: DOI:10.36085/jsai.v1i1.10.

H. Jayadianti, R. Damayanti, and ..., “Latent Semantic Analysis (Lsa) Dan Automatic Text Summarization (Ats) Dalam Optimasi Pencarian Artikel Covid 19,” Semin. Nas. …, vol. 2020, no. Semnasif, pp. 52–59, 2020, [Online]. Available: http://jurnal.upnyk.ac.id/index.php/semnasif/article/view/4085.

K. E. Dewi and E. Widiastuti, Nelly Indriani Rainarli, “Evaluasi Sentence Extraction pada Peringkasan Dokumen Otomatis,” Pros. Semin. Nas. Inform. dan Apl., no. September, p. A-8 sd. A-12, 2017.

R. D. Himawan and Eliyani, “Perbandingan Akurasi Analisis Sentimen Tweet terhadap Pemerintah Provinsi DKI Jakarta di Masa,” J. Edukasi dan Penelit. Inform., vol. 7, no. 1, pp. 58–63, 2021, [Online]. Available: https://jurnal.untan.ac.id/.

C. Shah and A. Jivani, “A Hybrid Approach of Text Summarization Using Latent Semantic Analysis and Deep Learning,” 2018 Int. Conf. Adv. Comput. Commun. Informatics, pp. 2039–2044, 2018.

M. M. Tf-idf, “Pendekatan dengan Naturan Language Analysis . Beberapa Teknik Pendekatan statistika,” pp. 134–142, 2019.

D. A. Prabowo, M. A. Fauzi, and Y. A. Sari, “Peringkasan Teks Ekstraktif Kepustakaan Ilmu Komputer Bahasa Indonesia Menggunakan Metode Normalized Google Distance dan K-means,” J. Pengemb. Teknol. Inf. dan Ilmu Komput. Univ. Brawijaya, vol. 1, no. 12, pp. 1697–1707, 2017.




DOI: http://dx.doi.org/10.26418/jp.v7i2.47768

Refbacks

  • There are currently no refbacks.