OPTIMALISASI KLASIFIKASI EMOSI PADA TWEET INDONESIA: STUDI PENGARUH NORMALISASI SLANG DAN BALANCING KELAS MENGGUNAKAN METODE INDOBERTWEET

HANDOYO, NANANG TRI (2025) OPTIMALISASI KLASIFIKASI EMOSI PADA TWEET INDONESIA: STUDI PENGARUH NORMALISASI SLANG DAN BALANCING KELAS MENGGUNAKAN METODE INDOBERTWEET. Other thesis, UPN "Veteran" Yogyakarta.

[thumbnail of COVER_123210058_NANANG TRI HANDOYO.pdf] Text
COVER_123210058_NANANG TRI HANDOYO.pdf

Download (177kB)
[thumbnail of ABSTRAK_123210058_NANANG TRI HANDOYO.pdf] Text
ABSTRAK_123210058_NANANG TRI HANDOYO.pdf

Download (193kB)
[thumbnail of PENGESAHAN PEMBIMBING_123210058_NANANG TRI HANDOYO.pdf] Text
PENGESAHAN PEMBIMBING_123210058_NANANG TRI HANDOYO.pdf

Download (1MB)
[thumbnail of PENGESAHAN PENGUJI_123210058_NANANG TRI HANDOYO.pdf] Text
PENGESAHAN PENGUJI_123210058_NANANG TRI HANDOYO.pdf

Download (1MB)
[thumbnail of DAFTAR ISI_123210058_NANANG TRI HANDOYO.pdf] Text
DAFTAR ISI_123210058_NANANG TRI HANDOYO.pdf

Download (191kB)
[thumbnail of DAFTAR PUSTAKA_123210058_NANANG TRI HANDOYO.pdf] Text
DAFTAR PUSTAKA_123210058_NANANG TRI HANDOYO.pdf

Download (219kB)
[thumbnail of SKRIPSI FULLTEXT_123210058_NANANG TRI HANDOYO.pdf] Text
SKRIPSI FULLTEXT_123210058_NANANG TRI HANDOYO.pdf
Restricted to Repository staff only

Download (8MB)
Official URL: https://www.upnyk.ac.id/

Abstract

Media sosial, terutama Twitter, menjadi platform utama bagi masyarakat Indonesia
untuk mengekspresikan emosi dan berbagi pendapat. Dengan lebih dari 24 juta pengguna
aktif di Indonesia, volume data yang dihasilkan sangat besar setiap harinya. Analisis emosi
pada tweet menjadi penting untuk memahami dinamika sentimen publik terhadap berbagai
peristiwa dan kebijakan. Namun, pemrosesan teks bahasa Indonesia pada tweet menghadapi
tantangan besar, terutama karena penggunaan bahasa informal (slang) yang meluas.
Penggunaan slang dalam teks sosial media dapat menurunkan akurasi model Natural
Language Processing (NLP) jika tidak dilakukan normalisasi yang tepat. Selain itu,
distribusi kelas dalam klasifikasi emosi pada tweet sering kali tidak seimbang, dengan
beberapa emosi lebih jarang muncul daripada yang lain, menyebabkan bias dalam prediksi
model.
Penelitian ini bertujuan untuk mengatasi masalah tersebut dengan
mengimplementasikan normalisasi slang word dan teknik balancing kelas menggunakan
Random Oversampling (ROS) untuk meningkatkan akurasi klasifikasi emosi pada tweet
berbahasa Indonesia menggunakan model IndoBERTweet. Normalisasi slang word
bertujuan untuk menggantikan slang word dengan bentuk formal yang lebih mudah dipahami
oleh model, sedangkan teknik balancing kelas digunakan untuk mengurangi bias terhadap
kelas mayoritas. Model IndoBERTweet yang telah dilatih khusus untuk memahami teks
informal berbahasa Indonesia diharapkan dapat menunjukkan peningkatan performa melalui
penerapan kedua teknik tersebut.
Hasil penelitian menunjukkan bahwa penerapan normalisasi slang word
meningkatkan akurasi model dari 92,57% menjadi 93,02%. Teknik balancing kelas lebih
lanjut meningkatkan akurasi menjadi 93,67%, dan kombinasi kedua teknik tersebut
menghasilkan akurasi tertinggi sebesar 94,75%. Penelitian ini membuktikan bahwa
normalisasi slang word dan balancing kelas secara efektif meningkatkan kinerja model
IndoBERTweet dalam klasifikasi emosi pada tweet berbahasa Indonesia, serta memberikan
kontribusi dalam pengembangan sistem NLP yang lebih akurat untuk aplikasi analisis
sentimen dan pemantauan opini publik.
Kata Kunci: Klasifikasi Emosi, Normalisasi Slang, Random Oversampling, IndoBERTweet

Item Type: Thesis (Other)
Additional Information: Nanang Tri Handoyo (Penulis - 123210058) ; Agus Sasmito Aribowo (Pembimbing)
Uncontrolled Keywords: Klasifikasi Emosi, Normalisasi Slang, Random Oversampling, IndoBERTweet
Subjek: T Technology > T Technology (General)
Divisions: x. Faculty of Engineering, Science and Mathematics > School of Engineering Sciences
Depositing User: Indah Lestari
Date Deposited: 30 Jun 2025 03:07
Last Modified: 30 Jun 2025 03:07
URI: http://eprints.upnyk.ac.id/id/eprint/42873

Actions (login required)

View Item View Item