IMPLEMENTASI KLASIFIKASI TEKS SMS SPAM MENGGUNAKAN METODE SVM DENGAN EKSTRAKSI FITUR FASTTEXT

Ristiano, Totti Andra (2022) IMPLEMENTASI KLASIFIKASI TEKS SMS SPAM MENGGUNAKAN METODE SVM DENGAN EKSTRAKSI FITUR FASTTEXT. Diploma thesis, Universitas Pembangunan Nasional "Veteran" Yogyakarta.

[thumbnail of COVER.pdf] Text
COVER.pdf

Download (123kB)
[thumbnail of ABSTRAK.pdf] Text
ABSTRAK.pdf

Download (95kB)
[thumbnail of COVER.pdf] Text
COVER.pdf

Download (123kB)
[thumbnail of DAFTAR ISI.pdf] Text
DAFTAR ISI.pdf

Download (131kB)
[thumbnail of DAFTAR PUSTAKA.pdf] Text
DAFTAR PUSTAKA.pdf

Download (126kB)
[thumbnail of PENGESAHAN PEMBIMBING.pdf] Text
PENGESAHAN PEMBIMBING.pdf

Download (98kB)
[thumbnail of PENGESAHAN PENGUJI.pdf] Text
PENGESAHAN PENGUJI.pdf

Download (196kB)
[thumbnail of SKRIPSI FULL_TOTTI ANDRA RISTIANO_123180094.pdf] Text
SKRIPSI FULL_TOTTI ANDRA RISTIANO_123180094.pdf
Restricted to Repository staff only

Download (1MB)

Abstract

Tingginya penggunaan perangkat seluler, mengakibatkan penyalahgunaan SMS
sebagai media untuk melakukan kejahatan, seperti spam SMS, phishing, malware, dan
lain-lain. Perlu adanya sebuah sistem yang bisa mengklasifikasi SMS dengan tujuan agar
pengguna perangkat seluler tidak terganggu dengan spam SMS tersebut. Untuk bisa
mengklasifikasi SMS, sistem tersebut memerlukan model machine learning yang memiliki
akurasi tinggi agar bisa mengklasifikasi SMS spam dengan akurat.
Penelitian ini menggunakan Support Vector Machine (SVM) untuk mengklasifikasi
teks SMS spam dengan fastText sebagai ekstraksi fitur. Dataset yang digunakan adalah
dataset penelitian sebelumnya yang berisikan 1143 SMS yang terdiri dari 2 kelas, yaitu
569 ham dan 574 spam. Karena dataset SMS berisikan string, maka perlu dilakukan
ekstraksi fitur terlebih dahulu sebelum digunakan untuk pembuatan model SVM. Untuk
mengekstrak fitur dari dataset SMS tersebut, digunakanlah fastText. Kemudian setelah fitur
dari dataset SMS terekstrak, maka langkah selanjutnya adalah membuat model machine
learning untuk mengklasifikasi SMS spam. Model machine learning yang digunakan
adalah Support Vector Machine atau SVM. Dari studi literatur, fastText merupakan
ekstraksi fitur yang memperhitungkan struktur internal kata, posisi dan hubungan antar
kata dan SVM merupakan metode yang lebih tahan mengalami overfitting. Metodologi
penelitian ini dimulai dari pendahuluan, pengumpulan data, preprocessing data, ekstraksi
fitur menggunakan fastText, pembuatan model SVM, pengujian model SVM, dan yang
terakhir adalah hasil dan laporan.
Hasil pengujian model SVM menggunakan K-Fold Cross Validation dengan K
sebesar 4 mendapatkan accuracy sebesar 95,97%, precision sebesar 94,27%, recall sebesar
97,88%, dan f1-score sebesar 96,03% dengan parameter C sebesar 1, dan gamma sebesar
0,01.
Kata Kunci: SMS spam, Support Vector Machine, fastText, klasifikasi teks

Item Type: Thesis (Diploma)
Uncontrolled Keywords: SMS spam, Support Vector Machine, fastText, klasifikasi teks
Divisions: Faculty of Engineering, Science and Mathematics > School of Engineering Sciences
Depositing User: Eny Suparny
Date Deposited: 04 Nov 2022 07:59
Last Modified: 04 Nov 2022 08:00
URI: http://eprints.upnyk.ac.id/id/eprint/31533

Actions (login required)

View Item View Item