Andriani, Leni (2023) PENERAPAN METODE SMOTE DAN K-NEAREST NEIGHBOR PADA IMBALANCE DATA ANALISIS SENTIMEN ULASAN APLIKASI TIX ID. Diploma thesis, Universitas Pembangunan Nasional "Veteran" Yogyakarta.
Text
SKRIPSI FULL_LENI ANDRIANI_123180001.pdf Restricted to Repository staff only Download (3MB) |
|
Text
ABSTRAK.pdf Download (54kB) |
|
Text
COVER.pdf Download (147kB) |
|
Text
DAFTAR ISI.pdf Download (100kB) |
|
Text
DAFTAR PUSTAKA.pdf Download (193kB) |
|
Text
PENGESAHAN PEMBIMBING.pdf Download (511kB) |
|
Text
PENGESAHAN PENGUJI.pdf Download (505kB) |
Abstract
Aplikasi TIX ID merupakan salah satu penyedia layanan penjualan tiket bioskop
online yang memiliki jaringan kerjasama dengan bioskop bioskop yang tersebar di Indonesia.
Namun applikasi ini juga cukup banyak menuai komentar komentar yang berisi komentar
positif, neutral maupun negatif, sehingga ada kemungkinan data pada ulasan aplikasi TIX ID
memiliki ketidak seimbangan. Oleh karena itu, diperlukan analisis sentimen yang mampu
mengklasifikasikan ulasan penggguna aplikasi tix id menjadi sentimen positif, negatif dan
netral berdasarkan isi ulasan yang diberikan oleh pengguna.
Penggunaan metode klasifikasi ini dapat secara akurat mengklasifikasikan sebuah
kalimat kedalam sentimen positif, negatif, ataupun netral. Metode K-nearest neighbor atau
yang biasa disebut dengan KNN merupakan Kode Program klasifikasi yang sering digunakan
untuk proses analisis sentimen yang dimana prosesnya dengan cara mengelompokan data baru
berdasarkan jarak data baru ke beberpa data atau tetangga terdekat. Tujuan penelitian ini
adalah untuk mengetahui tingkat akurasi dari penerapan metode SMOTE untuk meningkatkan
kinerja Kode Program klasifikasi K-Nearest Neighbor dalam analisis ulasan aplikasi TIX ID.
Metode SMOTE digunakan untuk mengatasi imbalance dataset. Data yang tidak seimbang
tersebut menyulitkan metode klasifikasi dalam melakukan fungsi generalisasi pada proses
machine learning.
Hasil penelitian ini didapat akurasi pada metode K-Nearest Neighbor sebelum
menggunakan SMOTE dengan parameter K=7 akurasi yang didapat sebesar 76,65%
sedangkan dengan menggunakan SMOTE didapat akurasi tertinggi pada parameter K=3
sebesar 87,05%. Sehingga pada penelitian ini menunjukkan bahwa metode SMOTE sangat
mempengaruhi nilai akurasi yang dilakukan oleh K-Nearest neighbor pada saat data tidak
seimbang.
Kata Kunci : Imbalance Dataset, K-Nearest Neighbor, TIX ID, SMOTE
Item Type: | Thesis (Diploma) |
---|---|
Uncontrolled Keywords: | Imbalance Dataset, K-Nearest Neighbor, TIX ID, SMOTE |
Subjects: | Q Science > Q Science (General) |
Divisions: | Faculty of Engineering, Science and Mathematics > School of Engineering Sciences |
Depositing User: | Eny Suparny |
Date Deposited: | 23 Aug 2023 07:11 |
Last Modified: | 23 Aug 2023 07:13 |
URI: | http://eprints.upnyk.ac.id/id/eprint/37097 |
Actions (login required)
View Item |