SISTEM PERINGKAS DOKUMEN BERBAHASA INDONESIA DENGAN METODE LATENT SEMANTIC ANALYSIS (LSA)

Automatic text summarization hingga saat ini masih terus dianalisis dan diteliti untuk mencapai ringkasan yang dapat mendekati ringkasan buatan manusia. Salah satu metode yang dapat digunakan dalam automatic text summarization adalah Latent Semantic Analysis (LSA). Metode LSA dipilih untuk membuktik...

全面介紹

Saved in:
書目詳細資料
主要作者: Ramadhan Akira Rahadian, 081411631014
格式: Theses and Dissertations NonPeerReviewed
語言:Indonesian
Indonesian
出版: 2018
主題:
在線閱讀:https://repository.unair.ac.id/78292/2/ABSTRAK%20ST.SI%2047%2018%20Rah%20s.pdf
https://repository.unair.ac.id/78292/5/FULLTEXT%20ST.SI%2047%2018%20Rah%20s.pdf
https://repository.unair.ac.id/78292/
http://lib.unair.ac.id
標簽: 添加標簽
沒有標簽, 成為第一個標記此記錄!
實物特徵
總結:Automatic text summarization hingga saat ini masih terus dianalisis dan diteliti untuk mencapai ringkasan yang dapat mendekati ringkasan buatan manusia. Salah satu metode yang dapat digunakan dalam automatic text summarization adalah Latent Semantic Analysis (LSA). Metode LSA dipilih untuk membuktikan akurasi jika diterapkan pada dokumen berbahasa Indonesia dengan jumlah kalimat yang banyak. Tahapan penelitian dimulai dengan tahap preprocessing yang terdiri dengan sentence segmentation, case folding, tokenization, stopword removal, dan stemming. Berikutnya dilakukan tahapan pembobotan dokumen dengan menggunakan metode TF-ISF (Term Frequency-Inverse Sentence Frequency). Setelah itu tahapan metode LSA dimulai dengan pembuatan matriks, perhitungan SVD (Singular Value Decomposition), dan sentence selection dengan menggunakan Cross Method dilakukan. Dokumen yang digunakan pada penelitian ini berjumlah 50 dokumen artikel kolom. Proses evaluasi dilakukan melalui 3 tahapan yaitu perhitungan Nilai Kappa, pemilihan kalimat relevan, dan perhitungan Precision, Recall, dan F-Measure dengan compression rate sebesar 30% dan 20% . Kalimat relevan dari 2 evaluator dibandingkan dengan sistem dan Microsoft Word 2007 melalui fitur auto summarize. Hasil dari LSA dengan compression rate 30% adalah 53,91% lalu dengan compression rate 20% adalah 45,91% sedangkan hasil dari Microsoft Word 2007 dengan compression rate 30% adalah 19,01% dan 17,57% untuk compression rate 20%.