.Ardan Maulana Nafi'a, . (2025) PENERAPAN MACHINE LEARNING BERBASIS AUDIO DATA MENGGUNAKAN ARSITEKTUR EFFICIENTNETV2-B2 DAN LOG-MEL SPECTROGRAM PADA PENGENALAN PELAFALAN HURUF HIJAIYAH. Skripsi thesis, Universitas Pembangunan Nasional Veteran Yogyakarta.
|
Text
Cover_123210117.pdf Download (117kB) |
|
|
Text
Abstrak_123210117.pdf Download (179kB) |
|
|
Text
Halaman Pengesahan_123210117.pdf Download (776kB) |
|
|
Text
Daftar Isi_123210117.pdf Download (170kB) |
|
|
Text
Daftar Pustaka_123210117.pdf Restricted to Repository staff only Download (177kB) |
|
|
Text
Fulltext_123210117.pdf Restricted to Repository staff only Download (3MB) |
Abstract
Penelitian ini bertujuan untuk mengukur dan menganalisis tingkat akurasi klasifikasi pengenalan pelafalan huruf Hijaiyah, sebagai upaya untuk meningkatkan kualitas pembelajaran berbasis teknologi. Metode yang diimplementasikan adalah Convolutional Neural Network (CNN) dengan arsitektur Transfer Learning EfficientNetV2 (varian B0, B1, dan B2). Data pelafalan audio diubah menjadi representasi visual melalui ekstraksi fitur Log-Mel Spectrogram untuk diolah oleh model. Proses preprocessing data dan penyesuaian arsitektur model inti (base model freeze) dilakukan secara sistematis, diikuti dengan pengujian komparatif untuk mengidentifikasi model dengan kemampuan generalisasi optimal.
Hasil pengujian komparatif menunjukkan adanya variasi kinerja signifikan antar-arsitektur. Model EfficientNetV2-B1 teridentifikasi sebagai model dengan kinerja generalisasi terbaik, mencapai Akurasi Validasi Tertinggi 86.39%. Temuan ini kontras dengan Model B2, yang merupakan model utama penelitian, yang hanya mencapai Akurasi Validasi 84.41%. Kesenjangan kinerja yang lebih lebar pada B2 menunjukkan bahwa peningkatan kapasitas model justru memperparah overfitting, membuktikan bahwa Model B1 mencapai keseimbangan optimal antara kompleksitas dan adaptasi dataset. Secara umum, akurasi global sistem mencapai 97%, dengan analisis Confusion Matrix mengonfirmasi bahwa 91 dari 101 kelas berhasil diprediksi sempurna (Recall 100%), namun menyisakan kelemahan minor pada pelafalan yang memiliki kemiripan akustik, seperti kebingungan antara kelas 'Ba' dan 'Dza'.
Penelitian ini menyimpulkan bahwa implementasi arsitektur EfficientNetV2 sangat efektif untuk tugas klasifikasi pelafalan berbasis spektrogram. Meskipun Model B2 telah ditetapkan sebagai fokus penelitian, Model EfficientNetV2-B1 merupakan arsitektur yang paling andal untuk tujuan implementasi, dengan tingkat akurasi generalisasi 86.39%. Hasil ini tidak hanya berhasil mengukur tingkat akurasi klasifikasi untuk menjawab rumusan masalah, tetapi juga memberikan wawasan kritis mengenai pemilihan arsitektur model yang tepat, di mana model yang lebih ringan dapat mengungguli model yang lebih berat dalam konteks keterbatasan dataset atau hyperparameter tertentu.
| Item Type: | Tugas Akhir (Skripsi) |
|---|---|
| Additional Information: | ARDAN MAULANA NAFI'A (Penulis - 123210117); Wilis Kaswidjanti (Pembibing) |
| Uncontrolled Keywords: | Klasifikasi Audio, Huruf Hijaiyah, EfficientNetV2-B2, Log-Mel Spectrogram, Deep Learning. |
| Subjek: | T Technology > TJ Mechanical engineering and machinery |
| Divisions: | Fakultas Teknik Industri > (S1) Informatika |
| Depositing User: | Bayu Pambudi |
| Date Deposited: | 23 Oct 2025 01:28 |
| Last Modified: | 23 Oct 2025 01:28 |
| URI: | http://eprints.upnyk.ac.id/id/eprint/44833 |
Actions (login required)
![]() |
View Item |
