PERBANDINGAN ALGORITMA K-NEAREST NEIGHBOR DAN NAÏVE BAYES CLASSIFIER UNTUK KLASIFIKASI HOAX PADA BERITA KESEHATAN BERBAHASA INDONESIA

RACHMAD, FAIZ (2021) PERBANDINGAN ALGORITMA K-NEAREST NEIGHBOR DAN NAÏVE BAYES CLASSIFIER UNTUK KLASIFIKASI HOAX PADA BERITA KESEHATAN BERBAHASA INDONESIA. Diploma thesis, UPN "Veteran" Yogyakarta.

[thumbnail of ABSTRAK (5).pdf] Text
ABSTRAK (5).pdf

Download (31kB)
[thumbnail of COVER (4).pdf] Text
COVER (4).pdf

Download (163kB)
[thumbnail of DAFTAR ISI (4).pdf] Text
DAFTAR ISI (4).pdf

Download (52kB)
[thumbnail of DAFTAR PUSTAKA (3).pdf] Text
DAFTAR PUSTAKA (3).pdf

Download (104kB)
[thumbnail of HALAMAN PENGESAHAN PEMBIMBING.pdf] Text
HALAMAN PENGESAHAN PEMBIMBING.pdf

Download (568kB)
[thumbnail of HALAMAN PENGESAHAN PENGUJI.pdf] Text
HALAMAN PENGESAHAN PENGUJI.pdf

Download (485kB)
[thumbnail of SKRIPSI_FaizRachmad_123160135.pdf] Text
SKRIPSI_FaizRachmad_123160135.pdf
Restricted to Repository staff only

Download (2MB)

Abstract

Dengan banyaknya persebaran berita saat ini, maka akan sulit untuk menentukan suatu berita tersebut tergolong dalam berita yang benar atau berita hoax. Berita hoax akan dicerna dan jika tidak berhati-hati akan mempengaruhi cara berpikir pembacanya. Informasi yang ada di berita kesehatan pasti akan mempengaruhi pemikiran seseorang mengenai kondisi tubuhnya. Padahal berita tersebut belum tentu dapat dipertanggungjawabkan keasliannya. Namun membedakan berita yang fakta dan hoax tidak dapat dilakukan oleh orang awam. Maka dari itu perlu adanya klasifikasi hoax pada berita kesehatan untuk mengidentifikasi berita tersebut sebuah hoax atau fakta.
Pada penelitian ini dilakukan perbandingan terhadap metode K-Nearest Neighbor dan Naïve Bayes Classifier pada klasifikasi hoax berita kesehatan berbahasa Indonesia. Data yang digunakan pada penelitian ini merupakan data primer sebanyak 2446 judul berita yang bersumber dari penelitian terdahulu dan hasil web scrapping yang telah memiliki label. Model K-Nearest Neighbor menggunakan nilai ketetanggaan terdekat yaitu K=1, K=3, K=5 dan K=7. Metode TFIDF sebagai ekstraksi fitur dari teks judul berita dengan kedua metode tersebut untuk mengklasifikasikan fitur yang diperoleh sehingga dapat melakukan klasifikasi hoax atau fakta pada judul berita kesehatan. Lalu pada tahap terakhir dilakukan proses pengujian terhadap model K-Nearest Neighbor dan Naïve Bayes Classifier yang telah dihasilkan menggunakan tabel confusion matrix serta menggunakan metode validasi k-fold cross validation dengan dengan rasio data latih dan uji sebesar 80:20. Hasil dari pengujian tersebut berupa nilai rata-rata dari akurasi, presisi, dan recall.
Berdasarkan pengujian dengan confusion matrix dan menggunakan pendekatan k-fold cross validation dengan hasil bahwa model K-Nearest Neighbor mendapatkan hasil rata-rata terbesar pada K=3 dengan akurasi 82,91%, presisi 85,3% dan recall 79,38%. Sedangkan model Naïve Bayes mendapatkan hasil rata-rata akurasi sebesar akurasi 86,42%, presisi 88,10% dan recall 84,05%. Pada pengujian membuktikan bahwa model Naïve Bayes yang dibuat lebih baik jika dibandingkan dengan model K-Nearest Neighbor dengan nilai K=3 yang dibuktikan dengan pengukuran efektifitas confusion matrix.
Kata kunci: berita, klasifikasi hoax berita, perbandingan, , K-Nearest Neighbor, Naïve Baye

Item Type: Thesis (Diploma)
Uncontrolled Keywords: berita, klasifikasi hoax berita, perbandingan, , K-Nearest Neighbor, Naïve Baye
Subjects: Q Science > Q Science (General)
Divisions: Faculty of Engineering, Science and Mathematics > School of Engineering Sciences
Depositing User: Eny Suparny
Date Deposited: 01 Jul 2022 06:50
Last Modified: 01 Jul 2022 06:56
URI: http://eprints.upnyk.ac.id/id/eprint/30218

Actions (login required)

View Item View Item