Qur'ana Aulia Harlianty, . (2026) ANALISIS DAN PERBANDINGAN TOPIK KOMENTAR TIKTOK PADA ISU PROGRAM MAKAN BERGIZI GRATIS MENGGUNAKAN BERTOPIC DENGAN EMBEDDING INDOBERT DAN UNIVERSAL SENTENCE ENCODER. Skripsi thesis, Universitas Pembangunan Nasional Veteran Yogyakarta.
|
Text
1_Cover_123220183.pdf Download (218kB) |
|
|
Text
2_Abstrak_123220183.pdf Download (153kB) |
|
|
Text
3_Halaman Pengesahan_123220183.pdf Download (468kB) |
|
|
Text
4_Daftar Isi_123220183.pdf Download (280kB) |
|
|
Text
5_Daftar Pustaka_123220183.pdf Download (144kB) |
|
|
Text
6_Fulltext_123220183.pdf Restricted to Repository staff only Download (6MB) |
Abstract
TikTok kini menjadi media sosial dalam komunikasi politik, khususnya pada isu Program "Makan Bergizi Gratis" (MBG). Tingginya volume komentar dengan karakteristik teks yang singkat, tidak terstruktur, dan penuh bahasa tidak baku menciptakan tantangan dalam analisis. Penelitian ini berfokus membandingkan efektivitas dua model word embedding, yaitu IndoBERT sebagai model monolingual dan Universal Sentence Encoder (USE) sebagai model multilingual.
Penelitian ini menggunakan dataset utama berupa komentar berbahasa Indonesia, serta dataset kedua berupa komentar berbahasa Inggris untuk keperluan validasi. Data mentah diproses melalui tahapan preprocessing meliputi cleaning, stopword removal, case folding, tokenisasi, dan stemming. Pada tahap pemodelan topik, diterapkan BERTopic dengan membandingkan embedding IndoBERT dan USE. Evaluasi kinerja model dilakukan secara kuantitatif menggunakan metrik coherence score (C_v) guna mengukur tingkat kepaduan makna antar kata dalam topik yang terbentuk.
Hasil penelitian pada dataset berbahasa Indonesia menunjukkan perbedaan kinerja, di mana IndoBERT unggul dengan coherence score tertinggi sebesar 0.637, sedangkan USE mencapai skor tertinggi 0.602. Analisis memperlihatkan IndoBERT mampu menghasilkan topik mikro yang mendetail dan emosional, karena kemampuannya menangkap konteks bahasa lokal dan gaul. Sebaliknya, USE cenderung menghasilkan topik yang bersifat makro atau general. Namun, pada pengujian validasi menggunakan dataset berbahasa Inggris, model USE terbukti tampil jauh lebih unggul dengan coherence score sebesar 0.810, berbanding terbalik dengan IndoBERT yang mengalami penurunan performa dengan hasil 0.600. Penelitian ini menyimpulkan bahwa model monolingual seperti IndoBERT lebih efektif untuk analisis teks media sosial informal berbahasa Indonesia, sedangkan model multilingual seperti USE sangat tangguh dan direkomendasikan untuk memproses data lintas bahasa (code mixing) atau bahasa asing.
Kata Kunci: pemodelan topik, BERTopic, IndoBERT, USE, coherence score.
| Item Type: | Tugas Akhir (Skripsi) |
|---|---|
| Additional Information: | Qur'ana Aulia Harlianty (Penulis - 123220183) Agus Sasmito Aribowo (Pembimbing) |
| Uncontrolled Keywords: | pemodelan topik, BERTopic, IndoBERT, USE, coherence score. |
| Subjek: | Q Science > QA Mathematics > QA75 Electronic computers. Computer science Q Science > QA Mathematics > QA76 Computer software |
| Divisions: | Fakultas Teknik Industri > (S1) Informatika |
| Depositing User: | Indah Lestari |
| Date Deposited: | 04 Mar 2026 03:02 |
| Last Modified: | 04 Mar 2026 03:02 |
| URI: | http://eprints.upnyk.ac.id/id/eprint/47231 |
Actions (login required)
![]() |
View Item |
