IMPLEMENTASI MEL-FREQUENCY CEPSTRAL COEFFICIENT SEBAGAI METODE EKSTRAKSI CIRI PADA DATA AUDIO SUARA UCAPAN

Marbun, Andre Julio Sumurung (2024) IMPLEMENTASI MEL-FREQUENCY CEPSTRAL COEFFICIENT SEBAGAI METODE EKSTRAKSI CIRI PADA DATA AUDIO SUARA UCAPAN. Diploma thesis, Universitas Pembangunan Nasional "Veteran" Yogyakarta.

[thumbnail of 2. Cover Skripsi_123170079_Andre Julio S Marbun.pdf] Text
2. Cover Skripsi_123170079_Andre Julio S Marbun.pdf

Download (167kB)
[thumbnail of 1. Fultext Skripsi_123170079_Andre Julio S Marbun.pdf] Text
1. Fultext Skripsi_123170079_Andre Julio S Marbun.pdf
Restricted to Repository staff only

Download (5MB)
[thumbnail of 3. Halaman Pengesahan_123170079_Andre Julio S Marbun.pdf] Text
3. Halaman Pengesahan_123170079_Andre Julio S Marbun.pdf

Download (995kB)
[thumbnail of 4. Abstrak Skripsi_123170079_Andre Julio S Marbun.pdf] Text
4. Abstrak Skripsi_123170079_Andre Julio S Marbun.pdf

Download (220kB)
[thumbnail of 5. Daftar Isi Skripsi_123170079_Andre Julio S Marbun.pdf] Text
5. Daftar Isi Skripsi_123170079_Andre Julio S Marbun.pdf

Download (475kB)
[thumbnail of 6. Daftar Pustaka Skripsi_123170079_Andre Julio S Marbun.pdf] Text
6. Daftar Pustaka Skripsi_123170079_Andre Julio S Marbun.pdf

Download (222kB)

Abstract

Suara tidak dapat langsung diolah oleh mesin tanpa adanya proses ekstraksi ciri yang dilakukan terlebih dahulu. Saat ini terdapat begitu banyak pilihan metode ekstraksi ciri yang dapat digunakan, sehingga menentukan metode ekstraksi ciri yang tepat merupakan hal yang tidak mudah. Salah satu metode ekstraksi ciri pada sinyal suara yang kerap kali digunakan yaitu Mel-Frequency Cepstral Coefficient (MFCC). MFCC memiliki prinsip kerja menyerupai sistem pendengaran manusia yang menyebabkan banyak digunakan pada berbagai tugas yang berhubungan dengan pengenalan berdasarkan sinyal suara. Penelitian ini akan menggunakan metode MFCC untuk mengekstrak ciri pada sinyal suara dan Support Vector Machine sebagai metode klasifikasi emosi pada dataset RAVDESS.
MFCC terdiri dari beberapa tahap yaitu Pre-emphasize, Frame Blocking, Windowing, Fast Fourier Transform, Mel-Scaled Filterbank, Discrete Cosine Transform, dan Cepstral Liftering. Jenis rancangan pengujian yang akan dilakukan pada penelitian ini adalah parameter tuning. Parameter tuning dilakukan dengan tujuan untuk memperoleh parameter-parameter yang menghasilkan akurasi terbaik pada model machine learning. Parameter-parameter yang akan di-tuning antara lain, nilai α pada proses Pre-Emphasis, panjang frame beserta panjang overlap pada proses Frame Blocking, jumlah filter mel pada proses Mel-Scaled Filterbank, jumlah cepstral coefficient pada proses Discrete Cosine Transform dan nilai C pada SVM.
Akurasi terbaik pada laki-laki sebesar 85,71% diperoleh dengan kombinasi parameter filter pre-emphasize sebesar 0.95, panjang frame sebesar 0.023 ms, overlap frame yang bersebelahan sebesar 40%, jumlah filter mel pada proses mel-scaled filterbank sebesar 24 mel, jumlah cepstral coefficient sebesar 24 coefficient dan nilai ‘C’ pada SVM sebesar 0,01. Akurasi terbaik pada wanita sebesar 92,21% diperoleh dengan kombinasi parameter filter pre-emphasize sebesar 0.95, panjang frame sebesar 0.023 ms, overlap frame yang bersebelahan sebesar 40%, jumlah filter mel pada proses mel-scaled filterbank sebesar 24 mel, dan jumlah cepstral coefficient sebesar 13 coefficient dan nilai ‘C’ pada SVM sebesar 0,01. Dari kedua hasil pengujian parameter tuning antara laki-laki dan wanita terdapat kesamaan nilai parameter pada semua parameter pengujian, kecuali pada jumlah cepstral coefficient. Jumlah cepstral coefficient pada laki-laki sebanyak 24 coefficient sedangkan jumlah cepstral coefficient pada wanita sebanyak 13 coefficient.
Berdasarkan penelitian yang dilakukan, terdapat kesimpulan sebagai berikut, kombinasi metode MFCC dengan SVM mampu digunakan untuk klasifikasi emosi berdasarkan data masukan berupa intonasi suara dengan akurasi sebesar 85,71% pada laki-laki dan 92,21% pada wanita. Perbedaan akurasi yang didapat antara model laki-laki dan wanita disebabkan karena data yang digunakan berbeda. Model laki-laki dilatih dengan data suara laki-laki dan model wanita dilatih dengan data suara wanita, hal ini dilakukan karena laki-laki dan wanita memiliki rentang frekuensi suara yang berbeda.
Kata kunci: Mel-Frequency Cepstral Coefficient, Support Vector Machine, Klasifikasi emosi, Pemrosesan sinyal

Item Type: Thesis (Diploma)
Uncontrolled Keywords: Mel-Frequency Cepstral Coefficient, Support Vector Machine, Klasifikasi emosi, Pemrosesan sinyal
Subjects: Q Science > Q Science (General)
Divisions: Faculty of Engineering, Science and Mathematics > School of Engineering Sciences
Depositing User: Eny Suparny
Date Deposited: 17 May 2024 08:11
Last Modified: 17 May 2024 08:11
URI: http://eprints.upnyk.ac.id/id/eprint/39454

Actions (login required)

View Item View Item