Thareq Aziz, Thareq (2019) IDENTIFIKASI HOAX PADA ARTIKEL KESEHATAN BERBAHASA INDONESIA MENGGUNAKAN KOMBINASI METODE K-NEAREST NEIGHBOR DAN NAÏVE BAYES. Other thesis, Universitas Pembangunan Nasional Veteran Yogyakarta.
Preview |
Text
Cover 123150113_Thareq Aziz.pdf Download (155kB) | Preview |
Preview |
Text
Pengesahan Pembimbing 123150113_Thareq Aziz.pdf Download (415kB) | Preview |
Preview |
Text
Abstrak_123150113_Thareq Aziz.pdf Download (32kB) | Preview |
Preview |
Text
Daftar Isi_123150113_Thareq Aziz.pdf Download (40kB) | Preview |
Abstract
Artikel merupakan suatu karya tulis yang mempunyai sifat faktual serta terdapat
pendapat atau ide seseorang mengenai masalah tertentu. Artikel memiliki tujuan untuk
mendidik, mempengaruhi, memberitahu, meyakinkan, atau dapat menghibur dengan cara
mempublikasikannya. Dengan banyaknya persebaran berita saat ini, maka akan sulit untuk
menentukan suatu berita tersebut tergolong dalam berita yang benar adanya atau berita hoax.
Begitupun dengan berita mengenai kesehatan. Tidak dapat dipungkiri ketika seseorang
mendapat berita mengenai kesehatan pasti akan membacanya dan kemudian akan
menelannya mentah-mentah. Informasi yang ada di berita mengenai kesehatan tersebut pasti
akan mempengaruhi pemikiran seseorang mengenai kondisi tubuhnya. Oleh karena itu
dibutuhkan suatu sistem cerdas untuk mengklasifikasikan artikel kesehatan tersebut untuk
mengidentifikasi apakah termasuk dalam kategori hoax atau fakta.
Algoritma Kombinasi K-Nearest Neighbor dan Naïve Bayes merupakan algoritma
klasifikasi yang menggabungkan algoritma K-Nearest Neighbor dengan algoritma Naïve
Bayes. Penggabungan kedua metode ini berguna untuk mempercepat kinerja K-Nearest
Neighbor sehingga tidak perlu menghitung keseluruhan data, tetapi menghitung dari
probabilitas yang mungkin. Sehingga dengan metode kombinasi tersebut dapat memperoleh
hasil yang lebih baik. Untuk proses yang dilakukan dalam klasifikasi yaitu mengumpulkan
data, melakukan tahap preprocessing (cleansing, case folding, tokenizing, stopword removal
dan stemming), pembobotan fitur menggunakan metode Term Frequency Invers Document
Frequency, melakukan tahap klasifikasi (menghitung probabilitas dengan Naïve Bayes dan
dilanjutkan klasifikasi dengan K-Nearest Neighbor). Pada tahap pengujian menggunakan
tabel confusion matrix untuk mencari nilai akurasi, presisi, dan recall.
Dari pengujian tersebut menghasilkan nilai akurasi optimum untuk klasifikasi artikel
kesehatan sebesar 88%, untuk nilai presisi optimum sebesar 83%, sedangkan untuk nilai
recall optimum sebesar 100%. Dari pengujian tersebut dihasilkan nilai akurasi yang cukup
tinggi sehingga algoritma tersebut cocok diterapkan pada klasifikasi teks.
Item Type: | Thesis (Other) |
---|---|
Subjek: | Q Science > QA Mathematics > QA76 Computer software |
Divisions: | x. Faculty of Engineering, Science and Mathematics > School of Engineering Sciences |
Depositing User: | Nurul Alifah Rahmawati |
Date Deposited: | 23 Sep 2019 06:44 |
Last Modified: | 23 Sep 2019 06:44 |
URI: | http://eprints.upnyk.ac.id/id/eprint/21182 |
Actions (login required)
![]() |
View Item |