PENERAPAN EASY DATA AUGMENTATION (EDA) PADA DETEKSI EMOSI TEKS BAHASA INDONESIA MENGGUNAKAN BIDIRECTIONAL LONG-SHORT TERM MEMORY (BILSTM) DAN WORD EMBEDDING FASTTEXT

Ramadhan, Syihabudin Rahmat (2024) PENERAPAN EASY DATA AUGMENTATION (EDA) PADA DETEKSI EMOSI TEKS BAHASA INDONESIA MENGGUNAKAN BIDIRECTIONAL LONG-SHORT TERM MEMORY (BILSTM) DAN WORD EMBEDDING FASTTEXT. Other thesis, UPN "Veteran" Yogyakarta.

[thumbnail of LAPORAN_123200081_SYIHABUDIN RAHMAT RAMADHAN (1).pdf] Text
LAPORAN_123200081_SYIHABUDIN RAHMAT RAMADHAN (1).pdf
Restricted to Repository staff only

Download (2MB)
[thumbnail of COVER.pdf] Text
COVER.pdf

Download (138kB)
[thumbnail of ABSTRAK.pdf] Text
ABSTRAK.pdf

Download (72kB)
[thumbnail of LEMBAR PENGESAHAN PEMBIMBING.pdf] Text
LEMBAR PENGESAHAN PEMBIMBING.pdf

Download (83kB)
[thumbnail of LEMBAR PENGESAHAN PENGUJI.pdf] Text
LEMBAR PENGESAHAN PENGUJI.pdf

Download (97kB)
[thumbnail of DAFTAR ISI.pdf] Text
DAFTAR ISI.pdf

Download (36kB)
[thumbnail of DAFTAR PUSTAKA.pdf] Text
DAFTAR PUSTAKA.pdf

Download (81kB)

Abstract

Deteksi emosi merupakan aspek penting dalam analisis teks, yang bertujuan untuk
mengekstrak emosi seperti kebahagiaan, kesedihan, dan kemarahan dari data tekstual.
Penelitian ini berfokus pada deteksi emosi dalam teks bahasa Indonesia menggunakan
metode Bidirectional Long Short-Term Memory (BiLSTM) yang dipadukan dengan
Fasttext word embeddings.
Dataset yang digunakan dalam penelitian ini adalah Emotion Classification on
Indonesian Twitter Dataset, yang terdiri dari 4.403 tweet yang diberi label ke dalam lima
kelas emosi: cinta, kemarahan, kesedihan, kebahagiaan, dan ketakutan. Untuk
meningkatkan performa model, teknik Easy Data Augmentation (EDA) diterapkan guna
meningkatkan variasi data. Hasil penelitian menunjukkan bahwa augmentasi dataset
sebelum splitting mencapai akurasi validasi berkisar antara 86,2% hingga 96,13%, dengan
parameter alpha 0,1 menghasilkan akurasi tertinggi. Performa ini melampaui penelitian
sebelumnya oleh Glenn et al. (2023), yang melaporkan akurasi sebesar 70,83%. Namun,
terdapat indikasi data leakage dan overfitting yang teridentifikasi ketika augmentasi
diterapkan sebelum pemisahan data. Sebaliknya, ketika augmentasi dilakukan setelah
splitting, akurasi validasi turun menjadi 71,6%, yang tetap melampaui penelitian
sebelumnya namun menegaskan adanya kebocoran data dalam skenario augmentasi
sebelum pemisahan.
Penelitian ini menekankan bahwa meskipun augmentasi data dapat secara
signifikan meningkatkan akurasi, perhatian yang cermat terhadap waktu pelaksanaan
augmentasi sangat penting untuk menghindari hasil yang menyesatkan. Kedua skenario
augmentasi data yang digunakan dalam penelitian ini melampaui performa penelitian
sebelumnya, menunjukkan efektivitas augmentasi dalam meningkatkan deteksi emosi pada
teks bahasa Indonesia.
Kata Kunci : Deteksi Emosi, BILSTM, Easy Data Augmentation, Pemrosesan Bahasa
Alami,Augmentasi,Fasttext

Item Type: Thesis (Other)
Uncontrolled Keywords: Deteksi Emosi, BILSTM, Easy Data Augmentation, Pemrosesan Bahasa Alami,Augmentasi,Fasttext
Subjects: H Social Sciences > H Social Sciences (General)
T Technology > T Technology (General)
Divisions: Faculty of Engineering, Science and Mathematics > School of Engineering Sciences
Depositing User: A.Md.SI Indah Lestari Wulan Aji
Date Deposited: 13 Nov 2024 01:13
Last Modified: 13 Nov 2024 01:13
URI: http://eprints.upnyk.ac.id/id/eprint/41619

Actions (login required)

View Item View Item