LATIFAH, AMALIA PUTRI (2025) PERBANDINGAN PERFORMA BERTOPIC DAN NON-NEGATIVE MATRIX FACTORIZATION (NMF) DALAM PEMODELAN TOPIK ULASAN PRODUK SKINCARE. Skripsi thesis, UPN Veteran Yogyakarta.
![]() |
Text
05- Cover.pdf Download (212kB) |
![]() |
Text
04 - Abstrak.pdf Download (240kB) |
![]() |
Text
02 - Pengesahan Pembimbing.pdf Download (499kB) |
![]() |
Text
03 - Pengesahan Penguji.pdf Download (1MB) |
![]() |
Text
05 - Daftar Isi.pdf Download (240kB) |
![]() |
Text
07 - Daftar Pustaka.pdf Download (201kB) |
![]() |
Text
01 - Naskah TA Lengkap.pdf Restricted to Repository staff only Download (7MB) |
Abstract
Pertumbuhan teknologi menjadikan internet sebagai tempat masyarakat
mengekspresikan opini mereka. Salah satunya dalam bentuk ulasan produk kecantikan yang
dibagikan melalui platform digital. Forum Female Daily adalah contoh platform populer di
dunia kecantikan yang menyediakan ribuan ulasan. Banyaknya ulasan yang diunggah
pengguna menghadirkan tantangan tersendiri dalam memahami opini dan tren secara
menyeluruh. Oleh karena itu, dibutuhkan pendekatan otomatis, seperti pemodelan topik
yang mampu menyaring informasi dari ulasan dalam skala besar. Beberapa studi telah
membandingkan metode pemodelan topik untuk menemukan pendekatan terbaik dalam
menganalisis opini pengguna. Salah satunya adalah penelitian oleh Egger & Yu (2022) yang
menunjukkan bahwa NMF unggul dalam menghasilkan topik yang tidak tumpang tindih,
mudah diinterpretasikan, dan cocok untuk teks pendek seperti ulasan. Di sisi lain, BERTopic
dinilai mampu menangkap wawasan baru melalui pendekatan embedding berbasis
transformer dan menawarkan fleksibilitas tinggi dalam pemodelan topik. Kedua metode
tersebut menunjukkan performa yang kompetitif dan mewakili dua pendekatan yang
berbeda, yaitu pendekatan konvensional berbasis aljabar (NMF) dan pendekatan modern
berbasis semantik (BERTopic). Pemilihan keduanya dalam penelitian ini juga didasarkan
pada relevansi metode terhadap karakteristik data ulasan skincare yang pendek, subjektif,
dan ekspresif (Egger & Yu, 2022b).
Penelitian ini menggunakan 2.500 ulasan pengguna terhadap produk Avoskin
Miraculous Refining Toner yang dikumpulkan melalui teknik web scraping dari forum
Female Daily Talk. Data ulasan diproses melalui tahapan praproses teks yang sama untuk
kedua metode, mencakup data cleaning, case folding, tokenization, normalization,
stopwords removal, dan stemming. Pemodelan dengan BERTopic dilakukan melalui
embedding dokumen menggunakan Sentence-BERT, reduksi dimensi dengan UMAP,
clustering menggunakan HDBSCAN, dan representasi topik dengan pendekatan class-based
TF-IDF. Sementara itu, pemodelan NMF dilakukan melalui pembobotan TF-IDF dan
dekomposisi matriks. Evaluasi performa model dilakukan dengan dua metrik utama, yaitu
topic coherence dan topic diversity. Sistem juga dikembangkan dalam bentuk antarmuka
berbasis web menggunakan Streamlit untuk mendukung proses visualisasi dan eksplorasi
hasil topik.
Hasil evaluasi menunjukkan bahwa BERTopic memiliki skor topic coherence yang
lebih tinggi dibandingkan NMF. Hal ini menunjukan topik-topik yang dihasilkan BERTopic
memiliki keterkaitan semantik antar kata yang lebih kuat. Selain itu, nilai topic diversity
pada BERTopic lebih tinggi dibandingkan dengan NMF. Hal ini menunjukkan BERTopic
mampu menghasilkan topik yang lebih bervariasi dan tidak tumpang tindih.
Kata Kunci: BERTopic, NMF, pemodelan topik, TF-IDF, Sentence-BERT
Item Type: | Thesis (Skripsi) |
---|---|
Additional Information: | AMALIA PUTRI LATIFAH (Penulis-123210109) ; Wilis Kaswidjanti (Pembimbing) |
Uncontrolled Keywords: | BERTopic, NMF, pemodelan topik, TF-IDF, Sentence-BERT |
Subjek: | Q Science > QA Mathematics > QA75 Electronic computers. Computer science |
Divisions: | Fakultas Teknik Industri > Informatika (S1) |
Depositing User: | A.Md Eko Suprapti |
Date Deposited: | 23 Jul 2025 03:20 |
Last Modified: | 23 Jul 2025 03:21 |
URI: | http://eprints.upnyk.ac.id/id/eprint/43221 |
Actions (login required)
![]() |
View Item |