Nawangsari, Bella Febriany (2025) PERBANDINGAN METODE LATENT DIRICHLET ALLOCATION (LDA) DAN BERTOPIC DALAM PEMODELAN TOPIK ULASAN APLIKASI PERBANKAN. Skripsi thesis, UPN Veteran Yogyakarta.
![]() |
Text
Cover.pdf Download (741kB) |
![]() |
Text
Abstrak.pdf Download (151kB) |
![]() |
Text
Halaman Pengesahan Pembimbing.pdf Download (924kB) |
![]() |
Text
Halaman Pengesahan Penguji.pdf Download (891kB) |
![]() |
Text
Daftar Isi.pdf Download (149kB) |
![]() |
Text
Daftar Pustaka.pdf Download (113kB) |
![]() |
Text
[Naskah TA Lengkap] 123210089_Bella Febriany Nawangsari.pdf Restricted to Repository staff only Download (30MB) |
![]() |
Text
PANDUAN MENGAKSES DTS FULL.pdf Download (861kB) |
Abstract
Pemodelan topik merupakan metode yang digunakan untuk mengidentifikasi tema�tema tersembunyi dalam kumpulan data teks secara otomatis. Dalam penelitian ini, dilakukan perbandingan antara dua metode populer, yaitu Latent Dirichlet Allocation (LDA) dan BERTopic, dalam menganalisis pemodelan topik pada 8.000 ulasan pengguna aplikasi perbankan mobile wondr by BNI yang diperoleh dari platform Kaggle. Tujuan utama penelitian ini adalah mengevaluasi dan membandingkan kedua metode berdasarkan kualitas topik, yang diukur menggunakan coherence score dan topic diversity, serta efisiensi waktu pemrosesan (runtime).
LDA memerlukan tahapan preprocessing yang lebih kompleks, meliputi pembersihan data, case folding, penghapusan stopword, tokenisasi, normalisasi, penyaringan kata pendek, dan stemming. Sebaliknya, BERTopic hanya menggunakan sebagian tahapan tersebut, sehingga prosesnya lebih ringkas. Dari sisi representasi, LDA mengandalkan pendekatan Bag-of-Words, sementara BERTopic memanfaatkan embedding berbasis transformer dan teknik clustering. Perbedaan mendasar ini memengaruhi performa kedua metode dalam menghasilkan topik yang bermakna dan konsisten.
Hasil pengujian menunjukkan bahwa BERTopic menghasilkan nilai coherence score sebesar 0,6324 dan topic diversity sebesar 0,9500, lebih tinggi dibandingkan LDA yang memperoleh 0,5374 dan 0,7750. LDA juga membutuhkan waktu pemrosesan yang lebih lama akibat tahapan preprocessing yang lebih banyak. Penelitian ini memberikan kontribusi melalui perbandingan menyeluruh atas dua pendekatan pemodelan topik yang berbeda, dengan menggunakan dataset baru yang belum pernah diteliti sebelumnya, sehingga menawarkan perspektif baru dalam studi pemodelan topik terhadap teks ulasan aplikasi.
Kata Kunci: pemodelan topik, LDA, BERTopic, ulasan aplikasi, NLP
Item Type: | Thesis (Skripsi) |
---|---|
Additional Information: | Bella Febriany Nawangsari (Penulis - 123210089) ; Dhimas Arief Dharmawan (Pembimbing) |
Uncontrolled Keywords: | pemodelan topik, LDA, BERTopic, ulasan aplikasi, NLP |
Subjek: | Q Science > QA Mathematics > QA75 Electronic computers. Computer science |
Divisions: | Fakultas Teknik Industri > Informatika (S1) |
Depositing User: | Bayu Pambudi |
Date Deposited: | 15 Jul 2025 03:02 |
Last Modified: | 15 Jul 2025 03:02 |
URI: | http://eprints.upnyk.ac.id/id/eprint/43105 |
Actions (login required)
![]() |
View Item |