Novan Joko Trihananto, . (2026) KLASIFIKASI GENRE MUSIK BERDASARKAN SPEKTRUM AUDIO MENGGUNAKAN AUDIO SPECTROGRAM TRANSFORMER (AST). Skripsi thesis, Universitas Pembangunan Nasional Veteran Yogyakarta.
|
Text
Cover_123220202.pdf Download (152kB) |
|
|
Text
Abstract_123220202.pdf Download (116kB) |
|
|
Text
Halaman Pengesahan_123220202.pdf Download (197kB) |
|
|
Text
Daftar Isi_123220202.pdf Download (197kB) |
|
|
Text
Daftar Pustaka_123220202.pdf Download (177kB) |
|
|
Text
Fulltext_123220202.pdf Restricted to Repository staff only Download (1MB) |
Abstract
Klasifikasi genre musik dibutuhkan untuk membantu pengelolaan koleksi audio digital dan meningkatkan proses pencarian maupun rekomendasi musik. Penelitian ini membangun sistem klasifikasi genre musik berbasis spektrum audio menggunakan Audio Spectrogram Transformer (AST) dengan masukan log Mel-spectrogram. Pengujian dilakukan dalam tiga skenario, yaitu 10 genre sebagai baseline, 5 genre (classical, hiphop, jazz, metal, pop) sebagai skenario utama, serta 3 genre sulit (pop–reggae–rock) untuk menguji tantangan pada genre yang memiliki kemiripan karakteristik. Dataset yang digunakan berasal dari GTZAN, dengan subset utama 5 genre dan pembagian data secara stratified menjadi sekitar 70% data latih, 10% validasi, dan 20% data uji.
Tahap prapemrosesan meliputi standarisasi audio (mono, 16 kHz, durasi 15 detik), ekstraksi log Mel-spectrogram (128 mel), normalisasi, serta augmentasi untuk meningkatkan generalisasi. Representasi log Mel-spectrogram kemudian diproses oleh AST melalui pembentukan patch (patch embedding) dan Transformer encoder untuk menghasilkan prediksi kelas. Evaluasi kinerja dilakukan menggunakan confusion matrix serta metrik accuracy, precision (macro), recall (macro), dan F1-score (macro).
Hasil menunjukkan bahwa skenario 5 genre memberikan performa terbaik dengan accuracy 86,00%, precision (macro) 87,19%, recall (macro) 86,00%, dan F1-score (macro) 86,25%. Pada skenario 10 genre, performa menurun menjadi accuracy 66,50%, sedangkan pada skenario 3 genre sulit diperoleh accuracy 66,67%; penurunan ini dipengaruhi oleh kompleksitas multikelas dan kemiripan pola spektral antar genre. Selain itu, pada skenario 10 genre, capaian AST lebih tinggi dibanding pendekatan tradisional berbasis MFCC+CNN ResNet101 yang dilaporkan mencapai akurasi terbaik 58%, sehingga menunjukkan peningkatan sekitar 8,50 poin persentase
| Item Type: | Tugas Akhir (Skripsi) |
|---|---|
| Additional Information: | Novan Joko Trihananto (Penulis-123220202) Dr.Heriyanto (Pembimbing) |
| Uncontrolled Keywords: | Klasifikasi Genre Musik, Audio Spectrogram, Transformer, Deep Learning, Spektrum Audio |
| Subjek: | M Music and Books on Music > M Music M Music and Books on Music > ML Literature of music M Music and Books on Music > MT Musical instruction and study |
| Divisions: | Fakultas Teknik Industri > (S1) Informatika |
| Depositing User: | Bayu Pambudi |
| Date Deposited: | 20 Feb 2026 01:03 |
| Last Modified: | 20 Feb 2026 01:03 |
| URI: | http://eprints.upnyk.ac.id/id/eprint/47103 |
Actions (login required)
![]() |
View Item |
