KLASIFIKASI MALWARE BERBASIS BINARY VISUALIZATION MENGGUNAKAN RESNET-RS

Abdurrohman, Al Jauzi (2024) KLASIFIKASI MALWARE BERBASIS BINARY VISUALIZATION MENGGUNAKAN RESNET-RS. Other thesis, UPN Veteran Yogyakarta.

	Text COVER.pdf Download (247kB)
	Text ABSTRAK.pdf Download (280kB)
	Text HALAMAN PENGESAHAN PEMBIMBING.pdf Download (1MB)
	Text HALAMAN PENGESAHAN PENGUJI.pdf Download (1MB)
	Text DAFTAR ISI.pdf Download (230kB)
	Text DAFTAR PUSTAKA.pdf Download (224kB)
	Text SKRIPSI FULL_AL JAUZI ABDURROHMAN_123200106.pdf Restricted to Repository staff only Download (8MB)

Abstract

Kebocoran data akibat malware menjadi salah satu kejahatan siber yang paling banyak dilaporkan pada tahun 2023, dengan malware berperan sebagai perangkat lunak yang dapat merusak sistem komputer. Malware mudah diluncurkan karena dapat dibuat dari varian yang sudah ada, menyebabkan kerugian besar di berbagai bidang. Maka dari itu, perlu dilakukan upaya untuk meminimalisasi kerugian yang ditimbulkan oleh malware, salah satunya adalah pengklasifikasian malware. Pengklasifikasian malware, termasuk metode berbasis citra seperti binary visualization, dinilai lebih efisien dibanding teknik analisis statis dan dinamis karena tidak memerlukan reverse engineering. Teknik berbasis citra ini memanfaatkan kesamaan citra malware dalam family yang sama untuk diklasifikasikan oleh model machine learning, seperti CNN. Namun, CNN dapat menghadapi masalah vanishing gradient pada model dengan layer yang dalam, yang dapat diatasi oleh arsitektur ResNet dengan skip connection, sehingga memungkinkan penggunaan hingga ratusan layer tanpa mengurangi akurasi.

Pada penelitian ini dilakukan pengklasifikasian citra malware pada dataset MaleVis menggunakan model arsitektur transfer learning ResNet50 dan model yang telah dilakukan pembaruan, yaitu ResNet-RS50 untuk mengetahui perbandingan performa di antara keduanya. Terdapat 26 total kelas pada dataset yang terdiri dari 25 kelas merupakan citra dari malware family yang telah dikenali dan 1 kelas merupakan citra dari file bukan malware. Datasetmengandung data sejumlah 14226 data yang terdiri dari 9100 data training dan 5126 data testing. Model diuji menggunakan metode Hold-Out, maka dari itu data training dibagi kembali menjadi data training dan data validation dengan rasio 7:3. Untuk perbandingan performa, kedua model diberikan hyperparameter yang sama, yaitu kombinasi dari epochsejumlah 25 dan 50 dan batch size senilai 32 dan 64 sehingga menghasilkan 8 kombinasi pengujian.

Dari 8 kombinasi pengujian yang ada, diketahui bahwa model ResNet-RS50 dengan epoch sejumlah 25 dan batch size senilai 64 memiliki performa terbaik dengan akurasi 86,95%, presisi 90,75%, recall 93,98%, f-1 score 90,38%, dan durasi pelatihan selama 3,56 jam. Hasil dari performa 8 kombinasi pengujian kemudian disajikan dalam bentuk grafik sehingga diketahui bahwa kedua model tidak memiliki perbedaan performa yang signifikan, namun model ResNet-RS50 sedikit lebih unggul jika dilatih menggunakan epoch sejumlah 25 dan model ResNet50 sedikit lebih unggul jika dilatih menggunakan epoch sejumlah 50. Keunggulan tersebut ditandai dengan akurasi yang lebih tinggi dengan durasi pelatihan yang kurang lebih sama.

Kata kunci: Malware, binary visualization, CNN, ResNet, MaleVis, transfer learning, ImageNet, epoch, batch size

Item Type:	Tugas Akhir (Other)
Uncontrolled Keywords:	Malware, binary visualization, CNN, ResNet, MaleVis, transfer learning, ImageNet, epoch, batch size
Subjek:	Q Science > QA Mathematics > QA75 Electronic computers. Computer science Q Science > QA Mathematics > QA76 Computer software
Divisions:	x. Eprints Lama > 3
Depositing User:	Bayu Pambudi
Date Deposited:	03 Jan 2025 02:01
Last Modified:	03 Jan 2025 02:01
URI:	http://eprints.upnyk.ac.id/id/eprint/41972

Actions (login required)

View Item