KLASIFIKASI INFORMASI DAN KELUHAN MASYARAKAT MENGGUNAKAN ALGORITMA FUZZY K-NEAREST NEIGHBOR (Studi Kasus: Unit Pelayanan Informasi dan Keluhan Pemerintah Kota Yogyakarta)

Luhrie, Shalfa Fitriga (2019) KLASIFIKASI INFORMASI DAN KELUHAN MASYARAKAT MENGGUNAKAN ALGORITMA FUZZY K-NEAREST NEIGHBOR (Studi Kasus: Unit Pelayanan Informasi dan Keluhan Pemerintah Kota Yogyakarta). Other thesis, UPN Veteran Yogyakarta.

[img]
Preview
Text
COVER.pdf

Download (163kB) | Preview
[img]
Preview
Text
PENGESAHAN PENGUJI.pdf

Download (523kB) | Preview
[img]
Preview
Text
ABSTRAK.pdf

Download (66kB) | Preview
[img]
Preview
Text
DAFTAR ISI.pdf

Download (97kB) | Preview

Abstract

ABSTRAK UPIK atau Unit Pelayanan Informasi dan Keluhan merupakan suatu platform milik Pemerintah Kota Yogyakarta yang berfungsi untuk menampung pengaduan berupa saran, informasi, keluhan, atau pertanyaan dari masyarakat Kota Yogyakarta. Pengaduan atau selanjutnya disebut informasi dan keluhan yang masuk kemudian akan dikategorikan ke kategori bidang dan unit kerja yang menangani permasalahan tersebut. Untuk mempermudah mengorganisir informasi dan keluhan, meningkatkan efisiensi waktu administrator dalam memilah dan menentukan kategori bidang serta unit kerja, maka perlu dibuat sistem cerdas yang dapat mengklasifikasikan dokumen sesuai tujuan. Informasi dan keluhan memiliki jumlah data sampel perkategori yang tidak seimbang atau dalam klasifikasi teks disebut imbalanced class. Informasi dan keluhan juga memiliki ambiguitas kalimat yang memungkinkan suatu informasi dan keluhan dapat dikategorikan ke beberapa kategori bidang dan unit kerja. Fuzzy K-Nearest Neighbor merupakan algoritma klasifikasi perbaikan dari K-Nearest Neighbor dalam penentuan keanggotaan kelas dari suatu data uji. Penggunaan teori fuzzy dalam K-Nearest Neighbor dapat menangani ambiguitas suatu kalimat. Proses yang dilakukan adalah mengumpulkan data latih dan data uji, melakukan tahap preprocessing (diantaranya case folding, cleansing, tokenization, spelling normalization, stopword removal dan stemming), pembobotan fitur dengan metode Term Frequency Invers Document Frequency, kemudian dilakukan tahap klasifikasi, dan pada tahap akhir dilakukan pengujian menggunakan tabel confusion matrix multiclass untuk mencari nilai akurasi, presisi, dan recall. Hasil pengujian menunjukkan nilai akurasi optimum untuk klasifikasi bidang sebesar 96,528% dengan K=11 pada persentase data 80(train):20(test) dan untuk klasifikasi unit kerja sebesar 97,375% dengan K=9 pada persentase data 70 (train):30(test). Sedangkan nilai presisi dan recall optimum untuk klasifikasi bidang sebesar 56,597% dengan K=11 pada persentase data 80(train):20(test). Sedangkan untuk klasifikasi unit kerja sebesar 58,052% dengan K=5 pada persentase data 90(train):10(test). Kata Kunci: Text Mining, Klasifikasi Teks, Fuzzy K-Nearest Neighbor, Imbalanced Class, Ambiguitas, Confusion Matrix Multiclass

Item Type: Thesis (Other)
Subjects: Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Divisions: Faculty of Engineering, Science and Mathematics > School of Engineering Sciences
Depositing User: S.IP NURUL ALIFAH RAHMAWATI
Date Deposited: 10 Jul 2019 02:46
Last Modified: 10 Jul 2019 02:46
URI: http://eprints.upnyk.ac.id/id/eprint/20220

Actions (login required)

View Item View Item