Ristiano, Totti Andra (2022) IMPLEMENTASI KLASIFIKASI TEKS SMS SPAM MENGGUNAKAN METODE SVM DENGAN EKSTRAKSI FITUR FASTTEXT. Diploma thesis, Universitas Pembangunan Nasional "Veteran" Yogyakarta.
Text
COVER.pdf Download (123kB) |
|
Text
ABSTRAK.pdf Download (95kB) |
|
Text
COVER.pdf Download (123kB) |
|
Text
DAFTAR ISI.pdf Download (131kB) |
|
Text
DAFTAR PUSTAKA.pdf Download (126kB) |
|
Text
PENGESAHAN PEMBIMBING.pdf Download (98kB) |
|
Text
PENGESAHAN PENGUJI.pdf Download (196kB) |
|
Text
SKRIPSI FULL_TOTTI ANDRA RISTIANO_123180094.pdf Restricted to Repository staff only Download (1MB) |
Abstract
Tingginya penggunaan perangkat seluler, mengakibatkan penyalahgunaan SMS
sebagai media untuk melakukan kejahatan, seperti spam SMS, phishing, malware, dan
lain-lain. Perlu adanya sebuah sistem yang bisa mengklasifikasi SMS dengan tujuan agar
pengguna perangkat seluler tidak terganggu dengan spam SMS tersebut. Untuk bisa
mengklasifikasi SMS, sistem tersebut memerlukan model machine learning yang memiliki
akurasi tinggi agar bisa mengklasifikasi SMS spam dengan akurat.
Penelitian ini menggunakan Support Vector Machine (SVM) untuk mengklasifikasi
teks SMS spam dengan fastText sebagai ekstraksi fitur. Dataset yang digunakan adalah
dataset penelitian sebelumnya yang berisikan 1143 SMS yang terdiri dari 2 kelas, yaitu
569 ham dan 574 spam. Karena dataset SMS berisikan string, maka perlu dilakukan
ekstraksi fitur terlebih dahulu sebelum digunakan untuk pembuatan model SVM. Untuk
mengekstrak fitur dari dataset SMS tersebut, digunakanlah fastText. Kemudian setelah fitur
dari dataset SMS terekstrak, maka langkah selanjutnya adalah membuat model machine
learning untuk mengklasifikasi SMS spam. Model machine learning yang digunakan
adalah Support Vector Machine atau SVM. Dari studi literatur, fastText merupakan
ekstraksi fitur yang memperhitungkan struktur internal kata, posisi dan hubungan antar
kata dan SVM merupakan metode yang lebih tahan mengalami overfitting. Metodologi
penelitian ini dimulai dari pendahuluan, pengumpulan data, preprocessing data, ekstraksi
fitur menggunakan fastText, pembuatan model SVM, pengujian model SVM, dan yang
terakhir adalah hasil dan laporan.
Hasil pengujian model SVM menggunakan K-Fold Cross Validation dengan K
sebesar 4 mendapatkan accuracy sebesar 95,97%, precision sebesar 94,27%, recall sebesar
97,88%, dan f1-score sebesar 96,03% dengan parameter C sebesar 1, dan gamma sebesar
0,01.
Kata Kunci: SMS spam, Support Vector Machine, fastText, klasifikasi teks
Item Type: | Thesis (Diploma) |
---|---|
Uncontrolled Keywords: | SMS spam, Support Vector Machine, fastText, klasifikasi teks |
Divisions: | Faculty of Engineering, Science and Mathematics > School of Engineering Sciences |
Depositing User: | Eny Suparny |
Date Deposited: | 04 Nov 2022 07:59 |
Last Modified: | 04 Nov 2022 08:00 |
URI: | http://eprints.upnyk.ac.id/id/eprint/31533 |
Actions (login required)
View Item |