IDENTIFIKASI HOAX PADA ARTIKEL KESEHATAN BERBAHASA INDONESIA MENGGUNAKAN KOMBINASI METODE K-NEAREST NEIGHBOR DAN NAÏVE BAYES

Thareq Aziz, Thareq (2019) IDENTIFIKASI HOAX PADA ARTIKEL KESEHATAN BERBAHASA INDONESIA MENGGUNAKAN KOMBINASI METODE K-NEAREST NEIGHBOR DAN NAÏVE BAYES. Other thesis, Universitas Pembangunan Nasional Veteran Yogyakarta.

Preview	Text Cover 123150113_Thareq Aziz.pdf Download (155kB) \| Preview
Preview	Text Pengesahan Pembimbing 123150113_Thareq Aziz.pdf Download (415kB) \| Preview
Preview	Text Abstrak_123150113_Thareq Aziz.pdf Download (32kB) \| Preview
Preview	Text Daftar Isi_123150113_Thareq Aziz.pdf Download (40kB) \| Preview

Abstract

Artikel merupakan suatu karya tulis yang mempunyai sifat faktual serta terdapat
pendapat atau ide seseorang mengenai masalah tertentu. Artikel memiliki tujuan untuk
mendidik, mempengaruhi, memberitahu, meyakinkan, atau dapat menghibur dengan cara
mempublikasikannya. Dengan banyaknya persebaran berita saat ini, maka akan sulit untuk
menentukan suatu berita tersebut tergolong dalam berita yang benar adanya atau berita hoax.
Begitupun dengan berita mengenai kesehatan. Tidak dapat dipungkiri ketika seseorang
mendapat berita mengenai kesehatan pasti akan membacanya dan kemudian akan
menelannya mentah-mentah. Informasi yang ada di berita mengenai kesehatan tersebut pasti
akan mempengaruhi pemikiran seseorang mengenai kondisi tubuhnya. Oleh karena itu
dibutuhkan suatu sistem cerdas untuk mengklasifikasikan artikel kesehatan tersebut untuk
mengidentifikasi apakah termasuk dalam kategori hoax atau fakta.
Algoritma Kombinasi K-Nearest Neighbor dan Naïve Bayes merupakan algoritma
klasifikasi yang menggabungkan algoritma K-Nearest Neighbor dengan algoritma Naïve
Bayes. Penggabungan kedua metode ini berguna untuk mempercepat kinerja K-Nearest
Neighbor sehingga tidak perlu menghitung keseluruhan data, tetapi menghitung dari
probabilitas yang mungkin. Sehingga dengan metode kombinasi tersebut dapat memperoleh
hasil yang lebih baik. Untuk proses yang dilakukan dalam klasifikasi yaitu mengumpulkan
data, melakukan tahap preprocessing (cleansing, case folding, tokenizing, stopword removal
dan stemming), pembobotan fitur menggunakan metode Term Frequency Invers Document
Frequency, melakukan tahap klasifikasi (menghitung probabilitas dengan Naïve Bayes dan
dilanjutkan klasifikasi dengan K-Nearest Neighbor). Pada tahap pengujian menggunakan
tabel confusion matrix untuk mencari nilai akurasi, presisi, dan recall.
Dari pengujian tersebut menghasilkan nilai akurasi optimum untuk klasifikasi artikel
kesehatan sebesar 88%, untuk nilai presisi optimum sebesar 83%, sedangkan untuk nilai
recall optimum sebesar 100%. Dari pengujian tersebut dihasilkan nilai akurasi yang cukup
tinggi sehingga algoritma tersebut cocok diterapkan pada klasifikasi teks.

Item Type:	Tugas Akhir (Other)
Subjek:	Q Science > QA Mathematics > QA76 Computer software
Divisions:	x. Eprints Lama > 4
Depositing User:	Nurul Alifah Rahmawati
Date Deposited:	23 Sep 2019 06:44
Last Modified:	23 Sep 2019 06:44
URI:	http://eprints.upnyk.ac.id/id/eprint/21182

Actions (login required)

View Item