Tirta, Wayan Danu (2025) Penerapan Lexical Feature Untuk Algoritma Extreme Gradient Boosting (XGBoost) Dalam Pendeteksian Malicious URL. Other thesis, UPN Veteran Yogyakarta.
![]() |
Text
2. COVER.pdf Download (425kB) |
![]() |
Text
3. ABSTRAK.pdf Download (95kB) |
![]() |
Text
4. LEMBAR PENGESAHAN.pdf Download (1MB) |
![]() |
Text
5. DAFTAR ISI.pdf Download (129kB) |
![]() |
Text
6. DAFTAR PUSTAKA.pdf Download (183kB) |
![]() |
Text
1. FULLTEXT_123200025_WayanDanuTirta.pdf Restricted to Repository staff only Download (4MB) |
Abstract
Keamanan siber menjadi perhatian utama seiring dengan meningkatnya ancaman dari
URL berbahaya yang dapat digunakan untuk menyebarkan malware, melakukan serangan
phishing, dan aktivitas siber berbahaya lainnya. Ancaman ini dapat menyebabkan kerugian
finansial serta pencurian data sensitif. Dalam upaya meningkatkan akurasi deteksi URL
berbahaya, penelitian ini menerapkan algoritma Extreme Gradient Boosting (XGBoost)
dengan memanfaatkan analisis fitur leksikal. Dengan pendekatan ini, sistem deteksi dapat
mengidentifikasi pola yang mencurigakan dalam struktur URL tanpa ketergantungan pada
daftar hitam (blacklist), sehingga lebih adaptif terhadap ancaman baru.
Metodologi penelitian ini dimulai dengan pengumpulan dataset yang terdiri dari
633.010 URL, terbagi secara seimbang antara URL benign dan malicious. Ekstraksi fitur
leksikal dilakukan untuk mendapatkan karakteristik URL yang berkontribusi dalam proses
klasifikasi. Sebanyak 20 fitur leksikal digunakan, di antaranya secure_http, url_length,
domain_entropy, special_char_count, tld_reputation, path_length, digit_letter_ratio,
subdomain_dot_count, query_string_length, protocol_count, dan suspicious_path_words.
Model XGBoost digunakan sebagai algoritma utama dalam pengklasifikasian URL, dengan
parameter yang dioptimalkan menggunakan GridSearchCV. Evaluasi model dilakukan
dengan 8-fold cross-validation menggunakan metrik seperti accuracy, precision, recall, dan
F1-score.
Hasil penelitian menunjukkan bahwa penggunaan fitur leksikal dalam model XGBoost
secara signifikan meningkatkan akurasi deteksi URL berbahaya. Pada pengujian pertama
dengan 5 fitur, akurasi yang diperoleh adalah 88%. Dengan penambahan fitur menjadi 10,
akurasi meningkat menjadi 90%. Selanjutnya, pada percobaan dengan 15 fitur, akurasi
mencapai 97%, dan pada percobaan dengan 20 fitur, model mencapai akurasi tertinggi
sebesar 98,2%. Evaluasi tambahan melalui 8-fold cross-validation menunjukkan bahwa
semakin banyak fitur relevan yang digunakan, semakin baik model dalam mengidentifikasi
URL benign dan malicious. Hasil ini mengonfirmasi bahwa pendekatan berbasis fitur
leksikal dengan algoritma XGBoost memiliki potensi besar dalam meningkatkan keamanan
siber melalui deteksi URL berbahaya yang lebih akurat dan adaptif.
Kata Kunci: URL Berbahaya, Fitur Leksikal, XGBoost, Keamanan Siber, Deteksi Phishing.
Item Type: | Thesis (Other) |
---|---|
Uncontrolled Keywords: | URL Berbahaya, Fitur Leksikal, XGBoost, Keamanan Siber, Deteksi Phishing. |
Subjects: | Q Science > QA Mathematics > QA75 Electronic computers. Computer science |
Divisions: | Faculty of Engineering, Science and Mathematics > School of Electronics and Computer Science |
Depositing User: | A.Md Eko Suprapti |
Date Deposited: | 10 Apr 2025 01:44 |
Last Modified: | 10 Apr 2025 01:44 |
URI: | http://eprints.upnyk.ac.id/id/eprint/42308 |
Actions (login required)
![]() |
View Item |