PERBANDINGAN PELABELAN MANUAL DAN VADER PADA ANALISIS SENTIMEN TENTANG ANTI-ASIAN HATE SPEECH TERKAIT COVID-19 DI TWITTER DENGAN METODE SUPPORT VECTOR MACHINE

Inayanti, Fauziyah Ahmad (2023) PERBANDINGAN PELABELAN MANUAL DAN VADER PADA ANALISIS SENTIMEN TENTANG ANTI-ASIAN HATE SPEECH TERKAIT COVID-19 DI TWITTER DENGAN METODE SUPPORT VECTOR MACHINE. Diploma thesis, Universitas Pembangunan Nasional "Veteran" Yogyakarta.

[thumbnail of SKRIPSI FULL_FAUZIYAH AHMAD INAYANTI.pdf] Text
SKRIPSI FULL_FAUZIYAH AHMAD INAYANTI.pdf
Restricted to Repository staff only

Download (5MB)
[thumbnail of ABSTRAK.pdf] Text
ABSTRAK.pdf

Download (11kB)
[thumbnail of COVER.pdf] Text
COVER.pdf

Download (276kB)
[thumbnail of DAFTAR ISI.pdf] Text
DAFTAR ISI.pdf

Download (311kB)
[thumbnail of DAFTAR PUSTAKA.pdf] Text
DAFTAR PUSTAKA.pdf

Download (142kB)
[thumbnail of PENGESAHAN PEMBIMBING.pdf] Text
PENGESAHAN PEMBIMBING.pdf

Download (665kB)
[thumbnail of PENGESAHAN PENGUJI.pdf] Text
PENGESAHAN PENGUJI.pdf

Download (660kB)

Abstract

Pelabelan data merupakan salah satu langkah dalam membuat data latih dan data uji
pada analisis sentimen dengan pendekatan machine learning. Data yang telah dilabeli
dibutuhkan dalam metode supervised learning untuk dapat mengklasifikasikan data baru.
Pada umumnya, pelabelan data dilakukan secara manual oleh ahli dalam bidang terkait.
Namun, pelabelan data secara manual merupakan pekerjaan berat yang membutuhkan
waktu lama, apalagi jika datanya berjumlah banyak, dan rawan terjadi human-error.
Terdapat beragam metode lexicon-based yang dapat digunakan untuk melabeli data
secara otomatis pada analisis sentiment, salah satunya adalah VADER (Valence Aware
Dictionary and sEntiment Reasoner). Metode merupakan metode lexicon-based yang
sensitif dalam konteks micro-blog dan mampu mendeteksi intensitas kekuatan emosional
yang tersirat dari sebuah teks. Penelitian ini menggabungkan metode pelabelan VADER
dan algoritma Support Vector Machine (SVM) kemudian membandingkannya dengan
model gabungan pelabelan manual dan algoritma SVM.
Data yang digunakan pada penelitian ini diambil dari Twitter tentang ujaran
kebencian bertajuk anti-Asian yang muncul selama pandemi COVID-19. Terdapat 1530
data, yang kemudian dibagi menjadi 1224 data latih dan 306 data uji. Berdasarkan hasil
pengujian, model dengan gabungan pelabelan VADER dan algoritma SVM memperoleh
nilai akurasi, presisi, recall, dan f1-score yang lebih baik daripada gabungan pelabelan
manual dan algoritma SVM. Gabungan pelabelan VADER dan algoritma SVM
memperoleh nilai akurasi, presisi, recall, dan f1-score sebesar 90%. Sedangkan gabungan
pelabelan manual dan algoritma SVM memperoleh nilai akurasi, presisi, recall, dan f1-
score sebesar 85%. Selain itu, dilakukan pengujian dengan data uji hasil pelabelan
VADER pada model dengan gabungan pelabelan manual dan algoritma SVM yang
memperoleh nilai akurasi, presisi, recall, dan f1-score sebesar 88%.
Kata kunci: analisis sentimen, ujaran kebencian, Twitter, VADER, Support Vector
Machine

Item Type: Thesis (Diploma)
Uncontrolled Keywords: analisis sentimen, ujaran kebencian, Twitter, VADER, Support Vector Machine
Subjects: Q Science > Q Science (General)
Divisions: Faculty of Engineering, Science and Mathematics > School of Engineering Sciences
Depositing User: Eny Suparny
Date Deposited: 18 Aug 2023 06:26
Last Modified: 18 Aug 2023 06:26
URI: http://eprints.upnyk.ac.id/id/eprint/36980

Actions (login required)

View Item View Item