Aldhiansyah, Pandhu Brian (2020) ALGORITMA RANDOM FOREST DECISION TREE UNTUK KLASIFIKASI PESAN ISU SUKU AGAMA RAS DAN ANTAR GOLONGAN (SARA) DI TWITTER. Other thesis, UNIVERSITAS PEMBANGUNAN NASIONAL “VETERAN” YOGYAKARTA.
|
Text
COVER_123150104_PANDHU BRIAN ALDHIANSYAH.pdf Download (262kB) | Preview |
|
|
Text
PENGESAHAN PEMBIMBING_123150104_PANDHU BRIAN ALDHIANSYAH.pdf Download (219kB) | Preview |
|
|
Text
ABSTRAK_123150104_PANDHU BRIAN ALDHIANSYAH.pdf Download (10kB) | Preview |
|
|
Text
DAFTAR ISI_123150104_PANDHU BRIAN ALDHIANSYAH.pdf Download (287kB) | Preview |
Abstract
Isu SARA (suku, ras, agama dan antar golongan) merupakan sentimen diskriminatif menyangkut keturunan, agama, etnis dan kebangsaan atau kesukuan. Isu SARA menjadi salah satu faktor utama penyebab terjadinya konflik di media sosial dalam masyarakat multikultural. Di Indonesia, Twitter merupakan salah satu media sosial yang paling banyak untuk menyebarkan ujaran kebencian dalam bentuk isu SARA. Masyarakat bisa melaporkan konten SARA di Kepolisian terdekat. Sedangkan Polsek Pati mengalami beberapa kendala dalam menangani kasus kejahatan siber tersebut antara lain, kemampuan SDM yang masih terbatas, sarana komputerisasi yang belum bisa mengklasifikasi pesan SARA secara otomatis dan pemahaman masyarakat tentang pesan yang mengandung unsur SARA. Penelitian ini menggunakan algoritma random forest decision tree yang dikombinasikan dengan pembobotan fitur TF-IDF. Metode tersebut menggunakan data latih sebanyak 1707 dokumen dengan pembagian 1158 dokumen non-sara dan 549 dokumen pesan sara untuk dilakukan pembuatan model algortima. Model algoritma random forest dibuat menggunakan data numerik hasil pembobotan fitur TF-IDF terhadap data latih. Penelitian ini menggunakan model algortima yang terbuat dari 3000 pohon keputusan. Model algoritma melakukan pengklasifikasian pesan dari hasil scraping url di Twitter apakah pesan tersebut masuk ke dalam kategori SARA atau tidak. Penelitian ini menghasilkan sistem web yang dapat membantu Polsek Pati dalam menerima aduan konten SARA, namun untuk proses klasifikasi pesan yang mengandung SARA atau tidak masih belum bisa dikatakan berhasil. Hal ini dikarenakan algoritma random forest decision tree digunakan untuk komputasi data numerik dan tidak sesuai jika digunakan untuk data berupa teks atau kata-kata. Sehingga akurasi klasifikasi tergantung pada ketersediaan kata yang ada di data latih. Pengujian pada penelitian ini menggunakan confusion matrix yang mendapatkan nilai akurasi sebesar 93%.
Item Type: | Thesis (Other) |
---|---|
Subjects: | Q Science > QA Mathematics > QA75 Electronic computers. Computer science |
Divisions: | Faculty of Engineering, Science and Mathematics > School of Electronics and Computer Science |
Depositing User: | Nurul Alifah Rahmawati |
Date Deposited: | 30 Jan 2020 07:18 |
Last Modified: | 30 Jan 2020 07:18 |
URI: | http://eprints.upnyk.ac.id/id/eprint/22361 |
Actions (login required)
View Item |