KLASIFIKASI GENRE MUSIK BERDASARKAN SPEKTRUM AUDIO MENGGUNAKAN AUDIO SPECTROGRAM TRANSFORMER (AST)

Novan Joko Trihananto, . (2026) KLASIFIKASI GENRE MUSIK BERDASARKAN SPEKTRUM AUDIO MENGGUNAKAN AUDIO SPECTROGRAM TRANSFORMER (AST). Skripsi thesis, Universitas Pembangunan Nasional Veteran Yogyakarta.

[thumbnail of Cover_123220202.pdf] Text
Cover_123220202.pdf

Download (152kB)
[thumbnail of Abstract_123220202.pdf] Text
Abstract_123220202.pdf

Download (116kB)
[thumbnail of Halaman Pengesahan_123220202.pdf] Text
Halaman Pengesahan_123220202.pdf

Download (197kB)
[thumbnail of Daftar Isi_123220202.pdf] Text
Daftar Isi_123220202.pdf

Download (197kB)
[thumbnail of Daftar Pustaka_123220202.pdf] Text
Daftar Pustaka_123220202.pdf

Download (177kB)
[thumbnail of Fulltext_123220202.pdf] Text
Fulltext_123220202.pdf
Restricted to Repository staff only

Download (1MB)
Official URL: https://upnyk.ac.id

Abstract

Klasifikasi genre musik dibutuhkan untuk membantu pengelolaan koleksi audio digital dan meningkatkan proses pencarian maupun rekomendasi musik. Penelitian ini membangun sistem klasifikasi genre musik berbasis spektrum audio menggunakan Audio Spectrogram Transformer (AST) dengan masukan log Mel-spectrogram. Pengujian dilakukan dalam tiga skenario, yaitu 10 genre sebagai baseline, 5 genre (classical, hiphop, jazz, metal, pop) sebagai skenario utama, serta 3 genre sulit (pop–reggae–rock) untuk menguji tantangan pada genre yang memiliki kemiripan karakteristik. Dataset yang digunakan berasal dari GTZAN, dengan subset utama 5 genre dan pembagian data secara stratified menjadi sekitar 70% data latih, 10% validasi, dan 20% data uji.
Tahap prapemrosesan meliputi standarisasi audio (mono, 16 kHz, durasi 15 detik), ekstraksi log Mel-spectrogram (128 mel), normalisasi, serta augmentasi untuk meningkatkan generalisasi. Representasi log Mel-spectrogram kemudian diproses oleh AST melalui pembentukan patch (patch embedding) dan Transformer encoder untuk menghasilkan prediksi kelas. Evaluasi kinerja dilakukan menggunakan confusion matrix serta metrik accuracy, precision (macro), recall (macro), dan F1-score (macro).
Hasil menunjukkan bahwa skenario 5 genre memberikan performa terbaik dengan accuracy 86,00%, precision (macro) 87,19%, recall (macro) 86,00%, dan F1-score (macro) 86,25%. Pada skenario 10 genre, performa menurun menjadi accuracy 66,50%, sedangkan pada skenario 3 genre sulit diperoleh accuracy 66,67%; penurunan ini dipengaruhi oleh kompleksitas multikelas dan kemiripan pola spektral antar genre. Selain itu, pada skenario 10 genre, capaian AST lebih tinggi dibanding pendekatan tradisional berbasis MFCC+CNN ResNet101 yang dilaporkan mencapai akurasi terbaik 58%, sehingga menunjukkan peningkatan sekitar 8,50 poin persentase

Item Type: Tugas Akhir (Skripsi)
Additional Information: Novan Joko Trihananto (Penulis-123220202) Dr.Heriyanto (Pembimbing)
Uncontrolled Keywords: Klasifikasi Genre Musik, Audio Spectrogram, Transformer, Deep Learning, Spektrum Audio
Subjek: M Music and Books on Music > M Music
M Music and Books on Music > ML Literature of music
M Music and Books on Music > MT Musical instruction and study
Divisions: Fakultas Teknik Industri > (S1) Informatika
Depositing User: Bayu Pambudi
Date Deposited: 20 Feb 2026 01:03
Last Modified: 20 Feb 2026 01:03
URI: http://eprints.upnyk.ac.id/id/eprint/47103

Actions (login required)

View Item View Item