Inayanti, Fauziyah Ahmad (2023) PERBANDINGAN PELABELAN MANUAL DAN VADER PADA ANALISIS SENTIMEN TENTANG ANTI-ASIAN HATE SPEECH TERKAIT COVID-19 DI TWITTER DENGAN METODE SUPPORT VECTOR MACHINE. Diploma thesis, Universitas Pembangunan Nasional "Veteran" Yogyakarta.
Text
SKRIPSI FULL_FAUZIYAH AHMAD INAYANTI.pdf Restricted to Repository staff only Download (5MB) |
|
Text
ABSTRAK.pdf Download (11kB) |
|
Text
COVER.pdf Download (276kB) |
|
Text
DAFTAR ISI.pdf Download (311kB) |
|
Text
DAFTAR PUSTAKA.pdf Download (142kB) |
|
Text
PENGESAHAN PEMBIMBING.pdf Download (665kB) |
|
Text
PENGESAHAN PENGUJI.pdf Download (660kB) |
Abstract
Pelabelan data merupakan salah satu langkah dalam membuat data latih dan data uji
pada analisis sentimen dengan pendekatan machine learning. Data yang telah dilabeli
dibutuhkan dalam metode supervised learning untuk dapat mengklasifikasikan data baru.
Pada umumnya, pelabelan data dilakukan secara manual oleh ahli dalam bidang terkait.
Namun, pelabelan data secara manual merupakan pekerjaan berat yang membutuhkan
waktu lama, apalagi jika datanya berjumlah banyak, dan rawan terjadi human-error.
Terdapat beragam metode lexicon-based yang dapat digunakan untuk melabeli data
secara otomatis pada analisis sentiment, salah satunya adalah VADER (Valence Aware
Dictionary and sEntiment Reasoner). Metode merupakan metode lexicon-based yang
sensitif dalam konteks micro-blog dan mampu mendeteksi intensitas kekuatan emosional
yang tersirat dari sebuah teks. Penelitian ini menggabungkan metode pelabelan VADER
dan algoritma Support Vector Machine (SVM) kemudian membandingkannya dengan
model gabungan pelabelan manual dan algoritma SVM.
Data yang digunakan pada penelitian ini diambil dari Twitter tentang ujaran
kebencian bertajuk anti-Asian yang muncul selama pandemi COVID-19. Terdapat 1530
data, yang kemudian dibagi menjadi 1224 data latih dan 306 data uji. Berdasarkan hasil
pengujian, model dengan gabungan pelabelan VADER dan algoritma SVM memperoleh
nilai akurasi, presisi, recall, dan f1-score yang lebih baik daripada gabungan pelabelan
manual dan algoritma SVM. Gabungan pelabelan VADER dan algoritma SVM
memperoleh nilai akurasi, presisi, recall, dan f1-score sebesar 90%. Sedangkan gabungan
pelabelan manual dan algoritma SVM memperoleh nilai akurasi, presisi, recall, dan f1-
score sebesar 85%. Selain itu, dilakukan pengujian dengan data uji hasil pelabelan
VADER pada model dengan gabungan pelabelan manual dan algoritma SVM yang
memperoleh nilai akurasi, presisi, recall, dan f1-score sebesar 88%.
Kata kunci: analisis sentimen, ujaran kebencian, Twitter, VADER, Support Vector
Machine
Item Type: | Thesis (Diploma) |
---|---|
Uncontrolled Keywords: | analisis sentimen, ujaran kebencian, Twitter, VADER, Support Vector Machine |
Subjects: | Q Science > Q Science (General) |
Divisions: | Faculty of Engineering, Science and Mathematics > School of Engineering Sciences |
Depositing User: | Eny Suparny |
Date Deposited: | 18 Aug 2023 06:26 |
Last Modified: | 18 Aug 2023 06:26 |
URI: | http://eprints.upnyk.ac.id/id/eprint/36980 |
Actions (login required)
View Item |