PERBANDINGAN METODE LATENT DIRICHLET ALLOCATION (LDA) DAN BERTOPIC DALAM PEMODELAN TOPIK ULASAN APLIKASI PERBANKAN

Nawangsari, Bella Febriany (2025) PERBANDINGAN METODE LATENT DIRICHLET ALLOCATION (LDA) DAN BERTOPIC DALAM PEMODELAN TOPIK ULASAN APLIKASI PERBANKAN. Skripsi thesis, UPN Veteran Yogyakarta.

[thumbnail of Cover.pdf] Text
Cover.pdf

Download (741kB)
[thumbnail of Abstrak.pdf] Text
Abstrak.pdf

Download (151kB)
[thumbnail of Halaman Pengesahan Pembimbing.pdf] Text
Halaman Pengesahan Pembimbing.pdf

Download (924kB)
[thumbnail of Halaman Pengesahan Penguji.pdf] Text
Halaman Pengesahan Penguji.pdf

Download (891kB)
[thumbnail of Daftar Isi.pdf] Text
Daftar Isi.pdf

Download (149kB)
[thumbnail of Daftar Pustaka.pdf] Text
Daftar Pustaka.pdf

Download (113kB)
[thumbnail of [Naskah TA Lengkap] 123210089_Bella Febriany Nawangsari.pdf] Text
[Naskah TA Lengkap] 123210089_Bella Febriany Nawangsari.pdf
Restricted to Repository staff only

Download (30MB)
[thumbnail of PANDUAN MENGAKSES DTS FULL.pdf] Text
PANDUAN MENGAKSES DTS FULL.pdf

Download (861kB)
Official URL: https://upnyk.ac.id/

Abstract

Pemodelan topik merupakan metode yang digunakan untuk mengidentifikasi tema�tema tersembunyi dalam kumpulan data teks secara otomatis. Dalam penelitian ini, dilakukan perbandingan antara dua metode populer, yaitu Latent Dirichlet Allocation (LDA) dan BERTopic, dalam menganalisis pemodelan topik pada 8.000 ulasan pengguna aplikasi perbankan mobile wondr by BNI yang diperoleh dari platform Kaggle. Tujuan utama penelitian ini adalah mengevaluasi dan membandingkan kedua metode berdasarkan kualitas topik, yang diukur menggunakan coherence score dan topic diversity, serta efisiensi waktu pemrosesan (runtime).

LDA memerlukan tahapan preprocessing yang lebih kompleks, meliputi pembersihan data, case folding, penghapusan stopword, tokenisasi, normalisasi, penyaringan kata pendek, dan stemming. Sebaliknya, BERTopic hanya menggunakan sebagian tahapan tersebut, sehingga prosesnya lebih ringkas. Dari sisi representasi, LDA mengandalkan pendekatan Bag-of-Words, sementara BERTopic memanfaatkan embedding berbasis transformer dan teknik clustering. Perbedaan mendasar ini memengaruhi performa kedua metode dalam menghasilkan topik yang bermakna dan konsisten.

Hasil pengujian menunjukkan bahwa BERTopic menghasilkan nilai coherence score sebesar 0,6324 dan topic diversity sebesar 0,9500, lebih tinggi dibandingkan LDA yang memperoleh 0,5374 dan 0,7750. LDA juga membutuhkan waktu pemrosesan yang lebih lama akibat tahapan preprocessing yang lebih banyak. Penelitian ini memberikan kontribusi melalui perbandingan menyeluruh atas dua pendekatan pemodelan topik yang berbeda, dengan menggunakan dataset baru yang belum pernah diteliti sebelumnya, sehingga menawarkan perspektif baru dalam studi pemodelan topik terhadap teks ulasan aplikasi.

Kata Kunci: pemodelan topik, LDA, BERTopic, ulasan aplikasi, NLP

Item Type: Thesis (Skripsi)
Additional Information: Bella Febriany Nawangsari (Penulis - 123210089) ; Dhimas Arief Dharmawan (Pembimbing)
Uncontrolled Keywords: pemodelan topik, LDA, BERTopic, ulasan aplikasi, NLP
Subjek: Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Divisions: Fakultas Teknik Industri > Informatika (S1)
Depositing User: Bayu Pambudi
Date Deposited: 15 Jul 2025 03:02
Last Modified: 15 Jul 2025 03:02
URI: http://eprints.upnyk.ac.id/id/eprint/43105

Actions (login required)

View Item View Item