SISTEM PERINGKAS DOKUMEN BERBAHASA INDONESIA DENGAN METODE LATENT SEMANTIC ANALYSIS (LSA)
Automatic text summarization hingga saat ini masih terus dianalisis dan diteliti untuk mencapai ringkasan yang dapat mendekati ringkasan buatan manusia. Salah satu metode yang dapat digunakan dalam automatic text summarization adalah Latent Semantic Analysis (LSA). Metode LSA dipilih untuk membuktik...
Saved in:
主要作者: | |
---|---|
格式: | Theses and Dissertations NonPeerReviewed |
語言: | Indonesian Indonesian |
出版: |
2018
|
主題: | |
在線閱讀: | https://repository.unair.ac.id/78292/2/ABSTRAK%20ST.SI%2047%2018%20Rah%20s.pdf https://repository.unair.ac.id/78292/5/FULLTEXT%20ST.SI%2047%2018%20Rah%20s.pdf https://repository.unair.ac.id/78292/ http://lib.unair.ac.id |
標簽: |
添加標簽
沒有標簽, 成為第一個標記此記錄!
|
總結: | Automatic text summarization hingga saat ini masih terus dianalisis dan diteliti untuk mencapai ringkasan yang dapat mendekati ringkasan buatan manusia. Salah satu metode yang dapat digunakan dalam automatic text summarization adalah Latent Semantic Analysis (LSA). Metode LSA dipilih untuk membuktikan akurasi jika diterapkan pada dokumen berbahasa Indonesia dengan jumlah kalimat yang banyak.
Tahapan penelitian dimulai dengan tahap preprocessing yang terdiri dengan sentence segmentation, case folding, tokenization, stopword removal, dan stemming. Berikutnya dilakukan tahapan pembobotan dokumen dengan menggunakan metode TF-ISF (Term Frequency-Inverse Sentence Frequency). Setelah itu tahapan metode LSA dimulai dengan pembuatan matriks, perhitungan SVD (Singular Value Decomposition), dan sentence selection dengan menggunakan Cross Method dilakukan.
Dokumen yang digunakan pada penelitian ini berjumlah 50 dokumen artikel kolom. Proses evaluasi dilakukan melalui 3 tahapan yaitu perhitungan Nilai Kappa, pemilihan kalimat relevan, dan perhitungan Precision, Recall, dan F-Measure dengan compression rate sebesar 30% dan 20% . Kalimat relevan dari 2 evaluator dibandingkan dengan sistem dan Microsoft Word 2007 melalui fitur auto summarize. Hasil dari LSA dengan compression rate 30% adalah 53,91% lalu dengan compression rate 20% adalah 45,91% sedangkan hasil dari Microsoft Word 2007 dengan compression rate 30% adalah 19,01% dan 17,57% untuk compression
rate 20%. |
---|