PENERAPAN LEXICAL FEATURES UNTUK MENGOPTIMASI ALGORITMA RANDOM FOREST DALAM PENDETEKSIAN MALICIOUS URL PADA WEBSITE

Ramadhan, Ekky (2023) PENERAPAN LEXICAL FEATURES UNTUK MENGOPTIMASI ALGORITMA RANDOM FOREST DALAM PENDETEKSIAN MALICIOUS URL PADA WEBSITE. Other thesis, UPN "Veteran" Yogyajarta.

[thumbnail of ABSTRAK.pdf] Text
ABSTRAK.pdf

Download (263kB)
[thumbnail of COVER.pdf] Text
COVER.pdf

Download (307kB)
[thumbnail of DAFTAR ISI.pdf] Text
DAFTAR ISI.pdf

Download (651kB)
[thumbnail of DAFTAR PUSTAKA.pdf] Text
DAFTAR PUSTAKA.pdf

Download (291kB)
[thumbnail of PENGESAHAN PEMBIMBING.pdf] Text
PENGESAHAN PEMBIMBING.pdf

Download (424kB)
[thumbnail of PENGESAHAN PENGUJI.pdf] Text
PENGESAHAN PENGUJI.pdf

Download (442kB)
[thumbnail of SKRIPSI FULL_EKKY RAMADHAN.pdf] Text
SKRIPSI FULL_EKKY RAMADHAN.pdf
Restricted to Repository staff only

Download (2MB)

Abstract

vi
ABSTRAK
Malicious URL (Uniform Resource Locator), atau biasa disebut dengan situs web
jahat adalah ancaman yang umum dan serius bagi keamanan siber. URL berbahaya
menampung konten yang tidak diminta (spam, phishing, unduhan drive-by, dll.) dan
memikat pengguna yang tidak menaruh curiga untuk menjadi korban penipuan (kehilangan
uang, pencurian informasi pribadi, dan instalasi malware), dan menyebabkan kerugian
miliaran dolar setiap tahun. Salah satu cara untuk mendeteksi Malicious Website yaitu
dengan mendeteksi dini lewat URL nya. Dalam penelitian ini, dilakukan pendeteksian
Malicious URL dengan menggunakan Leksikal Fitur untuk ekstraksi fiturnya dan Random
Forest untuk pengklasifikasiannya. Dalam pengekstraksiannya, metode yang digunakan
adalah berdasarkan karakteristik dan atribut dari URL itu sendiri.
Pada penelitian ini, dataset yang diperoleh memiliki tingkat ketidakseimbangan data
yang tinggi. Maka dari itu dilakukan Random Oversampling untuk proses penyeimbangan
datanya. Lalu pengujian model pada penelitian ini difokuskan pada pengoptimasian fitur
leksikal yang digunakan dalam mengklasifikasi jenis malicious url yaitu benign,
defacement, malware, dan phishing menggunakan 10 fitur, 15 fitur, 19 fitur, dan 23 fitur
untuk mencari hasil akurasi klasifikasi terbaik dengan 8-fold cross validation untuk
pengujiannya.
Penelitian ini mencapai kesimpulan bahwa penambahan fitur leksikal yang optimal
dapat meningkatkan akurasi deteksi URL berbahaya. Melalui eksperimen dengan variasi
fitur, hasil terbaik diperoleh dengan 23 fitur leksikal, mencapai akurasi 97,6%. Namun,
ditemukan bahwa pendeteksian URL statis tanpa tanda "/" diakhirnya secara konsisten
terdeteksi sebagai phishing, menunjukkan tantangan dalam membedakan URL berbahaya
dan aman secara akurat. Dengan demikian, penelitian ini memberikan wawasan penting
untuk mengoptimalkan algoritma Random Forest dalam mendeteksi URL berbahaya,
mengingat kompleksitas ancaman siber saat ini.
Kata Kunci: Lexical Features, Random Forest, Confusion Matrix, K-Fold Cross Validation,
Random Oversampling, Malicious, URL.

Item Type: Thesis (Other)
Uncontrolled Keywords: Lexical Features, Random Forest, Confusion Matrix, K-Fold Cross Validation, Random Oversampling, Malicious, URL.
Subjects: Z Bibliography. Library Science. Information Resources > ZA Information resources
Divisions: Faculty of Engineering, Science and Mathematics > School of Engineering Sciences
Depositing User: Eko Yuli
Date Deposited: 13 Dec 2023 07:59
Last Modified: 13 Dec 2023 07:59
URI: http://eprints.upnyk.ac.id/id/eprint/38340

Actions (login required)

View Item View Item