PENERAPAN LEXICAL FEATURES UNTUK MENGOPTIMASI ALGORITMA RANDOM FOREST DALAM PENDETEKSIAN MALICIOUS URL PADA WEBSITE

Ramadhan, Ekky (2023) PENERAPAN LEXICAL FEATURES UNTUK MENGOPTIMASI ALGORITMA RANDOM FOREST DALAM PENDETEKSIAN MALICIOUS URL PADA WEBSITE. Skripsi thesis, UPN "Veteran" Yogyajarta.

	Text ABSTRAK.pdf Download (263kB)
	Text COVER.pdf Download (307kB)
	Text DAFTAR ISI.pdf Download (651kB)
	Text DAFTAR PUSTAKA.pdf Download (291kB)
	Text PENGESAHAN PEMBIMBING.pdf Download (424kB)
	Text PENGESAHAN PENGUJI.pdf Download (442kB)
	Text SKRIPSI FULL_EKKY RAMADHAN.pdf Restricted to Repository staff only Download (2MB)

Abstract

vi
ABSTRAK
Malicious URL (Uniform Resource Locator), atau biasa disebut dengan situs web
jahat adalah ancaman yang umum dan serius bagi keamanan siber. URL berbahaya
menampung konten yang tidak diminta (spam, phishing, unduhan drive-by, dll.) dan
memikat pengguna yang tidak menaruh curiga untuk menjadi korban penipuan (kehilangan
uang, pencurian informasi pribadi, dan instalasi malware), dan menyebabkan kerugian
miliaran dolar setiap tahun. Salah satu cara untuk mendeteksi Malicious Website yaitu
dengan mendeteksi dini lewat URL nya. Dalam penelitian ini, dilakukan pendeteksian
Malicious URL dengan menggunakan Leksikal Fitur untuk ekstraksi fiturnya dan Random
Forest untuk pengklasifikasiannya. Dalam pengekstraksiannya, metode yang digunakan
adalah berdasarkan karakteristik dan atribut dari URL itu sendiri.
Pada penelitian ini, dataset yang diperoleh memiliki tingkat ketidakseimbangan data
yang tinggi. Maka dari itu dilakukan Random Oversampling untuk proses penyeimbangan
datanya. Lalu pengujian model pada penelitian ini difokuskan pada pengoptimasian fitur
leksikal yang digunakan dalam mengklasifikasi jenis malicious url yaitu benign,
defacement, malware, dan phishing menggunakan 10 fitur, 15 fitur, 19 fitur, dan 23 fitur
untuk mencari hasil akurasi klasifikasi terbaik dengan 8-fold cross validation untuk
pengujiannya.
Penelitian ini mencapai kesimpulan bahwa penambahan fitur leksikal yang optimal
dapat meningkatkan akurasi deteksi URL berbahaya. Melalui eksperimen dengan variasi
fitur, hasil terbaik diperoleh dengan 23 fitur leksikal, mencapai akurasi 97,6%. Namun,
ditemukan bahwa pendeteksian URL statis tanpa tanda "/" diakhirnya secara konsisten
terdeteksi sebagai phishing, menunjukkan tantangan dalam membedakan URL berbahaya
dan aman secara akurat. Dengan demikian, penelitian ini memberikan wawasan penting
untuk mengoptimalkan algoritma Random Forest dalam mendeteksi URL berbahaya,
mengingat kompleksitas ancaman siber saat ini.
Kata Kunci: Lexical Features, Random Forest, Confusion Matrix, K-Fold Cross Validation,
Random Oversampling, Malicious, URL.

Item Type:	Tugas Akhir (Skripsi)
Uncontrolled Keywords:	Lexical Features, Random Forest, Confusion Matrix, K-Fold Cross Validation, Random Oversampling, Malicious, URL.
Subjek:	Z Bibliography. Library Science. Information Resources > ZA Information resources
Divisions:	Fakultas Teknik Industri > (S1) Informatika
Depositing User:	Eko Yuli
Date Deposited:	13 Dec 2023 07:59
Last Modified:	06 Aug 2025 03:31
URI:	http://eprints.upnyk.ac.id/id/eprint/38340

Actions (login required)

View Item