ANALISIS DAN PERBANDINGAN TOPIK KOMENTAR TIKTOK PADA ISU PROGRAM MAKAN BERGIZI GRATIS MENGGUNAKAN BERTOPIC DENGAN EMBEDDING INDOBERT DAN UNIVERSAL SENTENCE ENCODER

Qur'ana Aulia Harlianty, . (2026) ANALISIS DAN PERBANDINGAN TOPIK KOMENTAR TIKTOK PADA ISU PROGRAM MAKAN BERGIZI GRATIS MENGGUNAKAN BERTOPIC DENGAN EMBEDDING INDOBERT DAN UNIVERSAL SENTENCE ENCODER. Skripsi thesis, Universitas Pembangunan Nasional Veteran Yogyakarta.

[thumbnail of 1_Cover_123220183.pdf] Text
1_Cover_123220183.pdf

Download (218kB)
[thumbnail of 2_Abstrak_123220183.pdf] Text
2_Abstrak_123220183.pdf

Download (153kB)
[thumbnail of 3_Halaman Pengesahan_123220183.pdf] Text
3_Halaman Pengesahan_123220183.pdf

Download (468kB)
[thumbnail of 4_Daftar Isi_123220183.pdf] Text
4_Daftar Isi_123220183.pdf

Download (280kB)
[thumbnail of 5_Daftar Pustaka_123220183.pdf] Text
5_Daftar Pustaka_123220183.pdf

Download (144kB)
[thumbnail of 6_Fulltext_123220183.pdf] Text
6_Fulltext_123220183.pdf
Restricted to Repository staff only

Download (6MB)
Official URL: https://upnyk.ac.id

Abstract

TikTok kini menjadi media sosial dalam komunikasi politik, khususnya pada isu Program "Makan Bergizi Gratis" (MBG). Tingginya volume komentar dengan karakteristik teks yang singkat, tidak terstruktur, dan penuh bahasa tidak baku menciptakan tantangan dalam analisis. Penelitian ini berfokus membandingkan efektivitas dua model word embedding, yaitu IndoBERT sebagai model monolingual dan Universal Sentence Encoder (USE) sebagai model multilingual.
Penelitian ini menggunakan dataset utama berupa komentar berbahasa Indonesia, serta dataset kedua berupa komentar berbahasa Inggris untuk keperluan validasi. Data mentah diproses melalui tahapan preprocessing meliputi cleaning, stopword removal, case folding, tokenisasi, dan stemming. Pada tahap pemodelan topik, diterapkan BERTopic dengan membandingkan embedding IndoBERT dan USE. Evaluasi kinerja model dilakukan secara kuantitatif menggunakan metrik coherence score (C_v) guna mengukur tingkat kepaduan makna antar kata dalam topik yang terbentuk.
Hasil penelitian pada dataset berbahasa Indonesia menunjukkan perbedaan kinerja, di mana IndoBERT unggul dengan coherence score tertinggi sebesar 0.637, sedangkan USE mencapai skor tertinggi 0.602. Analisis memperlihatkan IndoBERT mampu menghasilkan topik mikro yang mendetail dan emosional, karena kemampuannya menangkap konteks bahasa lokal dan gaul. Sebaliknya, USE cenderung menghasilkan topik yang bersifat makro atau general. Namun, pada pengujian validasi menggunakan dataset berbahasa Inggris, model USE terbukti tampil jauh lebih unggul dengan coherence score sebesar 0.810, berbanding terbalik dengan IndoBERT yang mengalami penurunan performa dengan hasil 0.600. Penelitian ini menyimpulkan bahwa model monolingual seperti IndoBERT lebih efektif untuk analisis teks media sosial informal berbahasa Indonesia, sedangkan model multilingual seperti USE sangat tangguh dan direkomendasikan untuk memproses data lintas bahasa (code mixing) atau bahasa asing.

Kata Kunci: pemodelan topik, BERTopic, IndoBERT, USE, coherence score.

Item Type: Tugas Akhir (Skripsi)
Additional Information: Qur'ana Aulia Harlianty (Penulis - 123220183) Agus Sasmito Aribowo (Pembimbing)
Uncontrolled Keywords: pemodelan topik, BERTopic, IndoBERT, USE, coherence score.
Subjek: Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Q Science > QA Mathematics > QA76 Computer software
Divisions: Fakultas Teknik Industri > (S1) Informatika
Depositing User: Indah Lestari
Date Deposited: 04 Mar 2026 03:02
Last Modified: 04 Mar 2026 03:02
URI: http://eprints.upnyk.ac.id/id/eprint/47231

Actions (login required)

View Item View Item