NAWASTA, REVANTO ALIF (2023) IMPLEMENTASI EKSTRAKSI CIRI MEL-FREQUENCY CEPSTRAL COEFFICIENT MENGGUNAKAN K-NEAREST NEIGHBOR UNTUK DETEKSI EMOSI BERDASARKAN INTONASI SUARA. Other thesis, UPN "Veteran" Yogyakarta.
Text
ABSTRAK.pdf Download (11kB) |
|
Text
COVER.pdf Download (135kB) |
|
Text
DAFTAR ISI.pdf Download (14kB) |
|
Text
DAFTAR PUSTAKA.pdf Download (81kB) |
|
Text
HALAMAN PENGESAHAN PEMBIMBING.pdf Download (1MB) |
|
Text
SKRIPSI FULL_Revanto Alif Nawasta_123170060.pdf Restricted to Repository staff only Download (4MB) |
Abstract
Manusia dan emosi adalah satu kesatuan yang tidak bisa terpisahkan. Umumnya raut
wajah digunakan untuk mengenali emosi seseorang, namun dengan perkembangan teknologi
saat ini, emosi seseorang dapat diketahui dengan mendengar intonasi suara yang diucapkan.
Mayoritas penelitian dibidang pengenalan emosi pada suara, menggunakan dataset
penelitian berbahasa asing yang mengakibatkan susahnya proses divalidasi karena adanya
perbedaan bahasa. Sehingga pada penelitian ini akan dilakukan pengenalan atau deteksi
emosi pada suara menggunakan dataset berbahasa Indonesia.
Mel-Frequency Cepstral Coefficients (MFCC) merupakan metode ekstraksi ciri yang
umum digunakan untuk pengenalan emosi pada suara karena memiliki prinsip kerja yang
menyerupai telinga manusia. Prinsip kerja ini menjadikan MFCC mampu mengatasi
sebagian besar penelitian yang berhubungan dengan pengenalan berdasarkan sinyal suara.
Ada beberapa proses yang terjadi di dalam metode MFCC, yaitu Pre-emphasize, Frame
Blocking, Windowing, Fast Fourier Transform, Mel-scaled Filterbank, dan Discrete Cosine
Transform. K-Nearest Neighbor (KNN) merupakan algoritma supervised machine learning
yang banyak digunakan untuk menyelesaikan permasalahan klasifikasi maupun deteksi
karna kelebihannya yang tangguh terhadap data latih yang noise. Data yang digunakan pada
penelitian ini adalah data suara podcast yang diunduh dari beberapa channel Youtube.
Pengujian yang dilakukan pada penelitian ini yaitu parameter tuning dan pengujian
kemampuan model dalam mendeteksi emosi terhadap data baru. Selain itu pengujian antara
laki-laki dan wanita dilakukan secara terpisah karena laki-laki dan wanita memiliki karakter
suara yang berbeda. Kombinasi antara metode ekstraksi ciri MFCC dan metode KNN
mampu dalam mendeteksi emosi berdasarkan intonasi suara pada pria dengan akurasi
sebesar 88,8% terhadap data test dan 80% terhadap data baru. MFCC dan KNN juga mampu
mendeteksi emosi berdasarkan intonasi suara pada wanita dengan akurasi 92,5% terhadap
data test namun terhadap data baru hanya mampu mencapai akurasi sebesar 50%. Model
pada wanita mengalami kondisi overfitting yang disebabkan oleh data augmentasi pitch
shifting yang tidak mampu menghasilkan sampel data yang cukup untuk secara akurat
merepresentasikan semua kemungkinan nilai data input.
Kata kunci: Mel-Frequency Cepstral Coefficient, K-Nearest Neighbor, Deteksi emosi, Pemrosesan Sinyal.
Item Type: | Thesis (Other) |
---|---|
Uncontrolled Keywords: | Mel-Frequency Cepstral Coefficient, K-Nearest Neighbor, Deteksi emosi, Pemrosesan Sinyal |
Subjects: | T Technology > T Technology (General) |
Divisions: | Faculty of Engineering, Science and Mathematics > School of Engineering Sciences |
Depositing User: | A.Md Apriliani Kusuma Wardhani |
Date Deposited: | 13 Apr 2023 04:17 |
Last Modified: | 13 Apr 2023 04:17 |
URI: | http://eprints.upnyk.ac.id/id/eprint/34543 |
Actions (login required)
View Item |