Thareq Aziz, Thareq (2019) IDENTIFIKASI HOAX PADA ARTIKEL KESEHATAN BERBAHASA INDONESIA MENGGUNAKAN KOMBINASI METODE K-NEAREST NEIGHBOR DAN NAÏVE BAYES. Other thesis, Universitas Pembangunan Nasional Veteran Yogyakarta.
|
Text
Cover 123150113_Thareq Aziz.pdf Download (155kB) | Preview |
|
|
Text
Pengesahan Pembimbing 123150113_Thareq Aziz.pdf Download (415kB) | Preview |
|
|
Text
Abstrak_123150113_Thareq Aziz.pdf Download (32kB) | Preview |
|
|
Text
Daftar Isi_123150113_Thareq Aziz.pdf Download (40kB) | Preview |
Abstract
Artikel merupakan suatu karya tulis yang mempunyai sifat faktual serta terdapat pendapat atau ide seseorang mengenai masalah tertentu. Artikel memiliki tujuan untuk mendidik, mempengaruhi, memberitahu, meyakinkan, atau dapat menghibur dengan cara mempublikasikannya. Dengan banyaknya persebaran berita saat ini, maka akan sulit untuk menentukan suatu berita tersebut tergolong dalam berita yang benar adanya atau berita hoax. Begitupun dengan berita mengenai kesehatan. Tidak dapat dipungkiri ketika seseorang mendapat berita mengenai kesehatan pasti akan membacanya dan kemudian akan menelannya mentah-mentah. Informasi yang ada di berita mengenai kesehatan tersebut pasti akan mempengaruhi pemikiran seseorang mengenai kondisi tubuhnya. Oleh karena itu dibutuhkan suatu sistem cerdas untuk mengklasifikasikan artikel kesehatan tersebut untuk mengidentifikasi apakah termasuk dalam kategori hoax atau fakta. Algoritma Kombinasi K-Nearest Neighbor dan Naïve Bayes merupakan algoritma klasifikasi yang menggabungkan algoritma K-Nearest Neighbor dengan algoritma Naïve Bayes. Penggabungan kedua metode ini berguna untuk mempercepat kinerja K-Nearest Neighbor sehingga tidak perlu menghitung keseluruhan data, tetapi menghitung dari probabilitas yang mungkin. Sehingga dengan metode kombinasi tersebut dapat memperoleh hasil yang lebih baik. Untuk proses yang dilakukan dalam klasifikasi yaitu mengumpulkan data, melakukan tahap preprocessing (cleansing, case folding, tokenizing, stopword removal dan stemming), pembobotan fitur menggunakan metode Term Frequency Invers Document Frequency, melakukan tahap klasifikasi (menghitung probabilitas dengan Naïve Bayes dan dilanjutkan klasifikasi dengan K-Nearest Neighbor). Pada tahap pengujian menggunakan tabel confusion matrix untuk mencari nilai akurasi, presisi, dan recall. Dari pengujian tersebut menghasilkan nilai akurasi optimum untuk klasifikasi artikel kesehatan sebesar 88%, untuk nilai presisi optimum sebesar 83%, sedangkan untuk nilai recall optimum sebesar 100%. Dari pengujian tersebut dihasilkan nilai akurasi yang cukup tinggi sehingga algoritma tersebut cocok diterapkan pada klasifikasi teks.
Item Type: | Thesis (Other) |
---|---|
Subjects: | Q Science > QA Mathematics > QA76 Computer software |
Divisions: | Faculty of Engineering, Science and Mathematics > School of Engineering Sciences |
Depositing User: | Nurul Alifah Rahmawati |
Date Deposited: | 23 Sep 2019 06:44 |
Last Modified: | 23 Sep 2019 06:44 |
URI: | http://eprints.upnyk.ac.id/id/eprint/21182 |
Actions (login required)
View Item |