Optimasi Support Vector Machine Menggunakan Algoritma Grid Search Untuk Klasifikasi Teks Bahasa Kasar Pada Subtitel Film

Iskhak, Muhamad (2022) Optimasi Support Vector Machine Menggunakan Algoritma Grid Search Untuk Klasifikasi Teks Bahasa Kasar Pada Subtitel Film. Diploma thesis, Universitas Pembangunan Nasional "Veteran" Yogyakarta.

[thumbnail of SKRIPSI FULL_Muhamad Iskhak_123180089.pdf] Text
SKRIPSI FULL_Muhamad Iskhak_123180089.pdf
Restricted to Repository staff only

Download (1MB)
[thumbnail of DAFTAR ISI.pdf] Text
DAFTAR ISI.pdf

Download (483kB)
[thumbnail of DAFTAR PUSTAKA.pdf] Text
DAFTAR PUSTAKA.pdf

Download (2MB)
[thumbnail of ABSTRAK.pdf] Text
ABSTRAK.pdf

Download (486kB)
[thumbnail of COVER.pdf] Text
COVER.pdf

Download (194kB)
[thumbnail of HALAMAN PENGESAHAN PEMBIMBING.pdf] Text
HALAMAN PENGESAHAN PEMBIMBING.pdf

Download (299kB)
[thumbnail of HALAMAN PENGESAHAN PENGUJI.pdf] Text
HALAMAN PENGESAHAN PENGUJI.pdf

Download (335kB)

Abstract

Di Indonesia menonton film yang terdapat bahasa kasar pada subtitel merupakan hal yang
menggangu. Namun perbedaan budaya mengakibatkan beberapa film dari luar negeri
menganggap bahasa kasar sebagai hal yang biasa. Klasifikasi teks bahasa kasar merupakan salah
satu hal yang dapat dilakukan untuk menangani hal tersebut. Penelitian ini menggunakan
metode supervised learning berupa support vector machine (SVM) untuk melakukan klasifikasi
teks bahasa kasar. Teks pada subtitel diklasifikasikan kedalam 2 kategori yaitu teks kategori
bahasa dan kategori teks bukan bahasa kasar.
SVM merupakan metode supervised learning yang memiliki kelemahan dalam menentukan
parameter paling optimal. Sedangkan pemilihan parameter yang tepat pada SVM akan sangat
berpengaruh terhadap hasil accuracy klasifikasi. Penelitian ini menggunakan metode optimasi
parameter grid search (GS) untuk mendapatkan parameter SVM yang paling optimal.
Metodologi penelitan ini dimulai dari studi litelatur, persiapan dataset, preprocessing,
pembobotan kata menggunakan term frequency-inverse document frequency (TF-IDF),
pembuatan model tanpa optimasi, pembuatan model dengan optimasi, validasi dan pengujian
menggunakan k-fold cross validation, kesimpulan dan saran.
Hasil pengujian model SVM tanpa optimasi parameter untuk melakukan klasifikasi teks
bahasa kasar pada subtitel film didapatkan nilai accuracy sebesar 92.3%, nilai precision sebesar
99%, nilai recall sebesar 85.2%, nilai f1-score sebesar 91.5%. Sedangkan hasil dari pengujian
model SVM model dengan optimasi parameter grid search untuk melakukan klasifikasi teks
bahasa kasar pada subtitel film didapatkan nilai accuracy sebesar 95.4%, nilai precision sebesar
98.3%, nilai recall sebesar 92.2%, nilai f1-score sebesar 95.1%. Hasil pengujian tersebut
menunjukan penerapan algoritma grid search untuk membantu menentukan parameter SVM
dapat meningkatkan accuracy sebesar 3.1% dari 92.3% menjadi 95.4%. Hal tersebut juga
berlaku pada recall dengan peningkatan nilai sebesar 7.0% dari 85.2% menjadi 92.2% dan
peningkatan f1-score sebesar 3.6% dari 91.5% menjadi 95.1%. Namun memberikan penurunan
nilai pada precision sebesar 0.7% dari 99% menjadi 98.3%. Hal tersebut dapat disimpulkan
bahwa algoritma optimasi parameter grid search merupakan algoritma pemilihan parameter
yang mampu meningkatkan accuracy klasifikasi teks bahasa kasar pada metode SVM.
Kata kunci: SVM, Grid search, Klasifikasi Teks, Bahasa Kasar, Subtitel Film

Item Type: Thesis (Diploma)
Uncontrolled Keywords: SVM, Grid search, Klasifikasi Teks, Bahasa Kasar, Subtitel Film
Subjects: Q Science > Q Science (General)
Divisions: Faculty of Engineering, Science and Mathematics > School of Engineering Sciences
Depositing User: Eny Suparny
Date Deposited: 08 Jul 2022 06:12
Last Modified: 08 Jul 2022 06:12
URI: http://eprints.upnyk.ac.id/id/eprint/30337

Actions (login required)

View Item View Item