Wicaksono, Sakti (2024) PEMODELAN TOPIK JURNAL MENGGUNAKAN LATENT DIRICHLET ALLOCATION DENGAN METODE PARAMETER ESTIMASI GIBBS SAMPLINGi Digilib, opac dan e jurnal. Diploma thesis, UPN Veteran Yogyakarta.
Text
Skripsi Fulltext_Sakti Wicaksono_123170031.pdf Restricted to Repository staff only Download (2MB) |
|
Text
Cover.pdf Download (174kB) |
|
Text
Abstrak.pdf Download (18kB) |
|
Text
Daftar Isi.pdf Download (81kB) |
|
Text
Daftar Pustaka.pdf Download (74kB) |
|
Text
Lembar Pengesahan Pembimbing.pdf Download (536kB) |
|
Text
Lembar Pengesahan Penguji.pdf Download (538kB) |
Abstract
Beragamnya dokumen skripsi dengan topik dan metode yang beragam pula, menjadikan
tantangan mahasiswa dalam menyusun skripsi. Topik dan metode yang diteliti pada penelitian
sebelumnya sangat beragam menjadi dilema mahasiswa dalam menentukan topik dan metode
yang akan diteliti. Adanya masalah tersebut peneliti ingin melakukan topic modeling dari
abstrak dokumen skripsi untuk menganalisis topik dan metode dokumen skripsi yang ada.
Salah satu metode topic modeling adalah metode Latent Dirichlet Allocation. Abstrak
dokumen skripsi akan digunakan sebagai objek pada penelitian ini karena abstrak merupakan
ringkasan dari keseluruhan isi karya tulis ilmiah yang mengandung inti dari pembahasan
penelitian yang dilakukan. Pengumpulan data didapat dari website Eprints UPN "Veteran"
Yogyakarta dengan alamat url http://eprints.upnyk.ac.id/. Data diambil dengan metode web
scraping. Data berisi code_subject, subject, title, author, dan abstract. Jumlah data yang
didapat dari web scraping sebanyak 35.650 data.
Hasil nilai coherence score dari model LDA yang dikembangkan untuk pemodelan topik
jurnal tertinggi dari tiap kategori adalah 0.7045 pada kategori Agriculture (General) dengan
jumlah topik sebanyak enam dan nilai terendah adalah 0.3788 pada kategori Computer software
dengan jumlah topik sebanyak empat. Nilai rata-rata dari coherence score dari semua kategori
didapat sebesar 0.5246 dan rata-rata jumlah topik sebanyak enam. Hasil pengujian dari sepuluh
sampel yang digunakan sebagai dokumen uji didapatkan hasil topik yang tidak relevan
sebanyak empat dan topik yang relevan sebanyak enam dengan nilai akurasi sebesar 60%.
Berdasarkan hasil tersebut, dapat disimpulkan bahwa model LDA yang dikembang belum
mampu menghasilkan topik yang relevan dengan dokumen jurnal yang ada.
Kata kunci: text mining; topic modeling; latent dirichlet allocation; gibbs sampling.
Item Type: | Thesis (Diploma) |
---|---|
Uncontrolled Keywords: | text mining; topic modeling; latent dirichlet allocation; gibbs sampling. |
Subjects: | Q Science > Q Science (General) |
Divisions: | Faculty of Engineering, Science and Mathematics > School of Engineering Sciences |
Depositing User: | Eny Suparny |
Date Deposited: | 27 Aug 2024 08:16 |
Last Modified: | 27 Aug 2024 08:16 |
URI: | http://eprints.upnyk.ac.id/id/eprint/40839 |
Actions (login required)
View Item |