PEMODELAN TOPIK JURNAL MENGGUNAKAN LATENT DIRICHLET ALLOCATION DENGAN METODE PARAMETER ESTIMASI GIBBS SAMPLINGi Digilib, opac dan e jurnal

Wicaksono, Sakti (2024) PEMODELAN TOPIK JURNAL MENGGUNAKAN LATENT DIRICHLET ALLOCATION DENGAN METODE PARAMETER ESTIMASI GIBBS SAMPLINGi Digilib, opac dan e jurnal. Diploma thesis, UPN Veteran Yogyakarta.

[thumbnail of Skripsi Fulltext_Sakti Wicaksono_123170031.pdf] Text
Skripsi Fulltext_Sakti Wicaksono_123170031.pdf
Restricted to Repository staff only

Download (2MB)
[thumbnail of Cover.pdf] Text
Cover.pdf

Download (174kB)
[thumbnail of Abstrak.pdf] Text
Abstrak.pdf

Download (18kB)
[thumbnail of Daftar Isi.pdf] Text
Daftar Isi.pdf

Download (81kB)
[thumbnail of Daftar Pustaka.pdf] Text
Daftar Pustaka.pdf

Download (74kB)
[thumbnail of Lembar Pengesahan Pembimbing.pdf] Text
Lembar Pengesahan Pembimbing.pdf

Download (536kB)
[thumbnail of Lembar Pengesahan Penguji.pdf] Text
Lembar Pengesahan Penguji.pdf

Download (538kB)

Abstract

Beragamnya dokumen skripsi dengan topik dan metode yang beragam pula, menjadikan
tantangan mahasiswa dalam menyusun skripsi. Topik dan metode yang diteliti pada penelitian
sebelumnya sangat beragam menjadi dilema mahasiswa dalam menentukan topik dan metode
yang akan diteliti. Adanya masalah tersebut peneliti ingin melakukan topic modeling dari
abstrak dokumen skripsi untuk menganalisis topik dan metode dokumen skripsi yang ada.
Salah satu metode topic modeling adalah metode Latent Dirichlet Allocation. Abstrak
dokumen skripsi akan digunakan sebagai objek pada penelitian ini karena abstrak merupakan
ringkasan dari keseluruhan isi karya tulis ilmiah yang mengandung inti dari pembahasan
penelitian yang dilakukan. Pengumpulan data didapat dari website Eprints UPN "Veteran"
Yogyakarta dengan alamat url http://eprints.upnyk.ac.id/. Data diambil dengan metode web
scraping. Data berisi code_subject, subject, title, author, dan abstract. Jumlah data yang
didapat dari web scraping sebanyak 35.650 data.
Hasil nilai coherence score dari model LDA yang dikembangkan untuk pemodelan topik
jurnal tertinggi dari tiap kategori adalah 0.7045 pada kategori Agriculture (General) dengan
jumlah topik sebanyak enam dan nilai terendah adalah 0.3788 pada kategori Computer software
dengan jumlah topik sebanyak empat. Nilai rata-rata dari coherence score dari semua kategori
didapat sebesar 0.5246 dan rata-rata jumlah topik sebanyak enam. Hasil pengujian dari sepuluh
sampel yang digunakan sebagai dokumen uji didapatkan hasil topik yang tidak relevan
sebanyak empat dan topik yang relevan sebanyak enam dengan nilai akurasi sebesar 60%.
Berdasarkan hasil tersebut, dapat disimpulkan bahwa model LDA yang dikembang belum
mampu menghasilkan topik yang relevan dengan dokumen jurnal yang ada.
Kata kunci: text mining; topic modeling; latent dirichlet allocation; gibbs sampling.

Item Type: Thesis (Diploma)
Uncontrolled Keywords: text mining; topic modeling; latent dirichlet allocation; gibbs sampling.
Subjects: Q Science > Q Science (General)
Divisions: Faculty of Engineering, Science and Mathematics > School of Engineering Sciences
Depositing User: Eny Suparny
Date Deposited: 27 Aug 2024 08:16
Last Modified: 27 Aug 2024 08:16
URI: http://eprints.upnyk.ac.id/id/eprint/40839

Actions (login required)

View Item View Item