Azzahra, Denisha Kyla (2025) IMPLEMENTASI MULTI-OBJECT DETECTION UNTUK PENGENALAN TULISAN TANGAN AKSARA SUNDA DENGAN ARSITEKTUR FASTER R-CNN. Skripsi thesis, UPN Veteran Yogyakarta.
|
Text
Abstrak_DenishaKylaAzzahra_123210130.pdf Download (144kB) |
|
|
Text
Cover_DenishaKylaAzzahra_123210130.pdf Download (176kB) |
|
|
Text
DaftarIsi_DenishaKylaAzzahra_123210130.pdf Download (47kB) |
|
|
Text
DaftarPustaka_DenishaKylaAzzahra_123210130.pdf Download (156kB) |
|
|
Text
PengesahanPembimbing_DenishaKylaAzzahra_123210130.pdf Download (443kB) |
|
|
Text
PengesahanPenguji_DenishaKylaAzzahra_123210130.pdf Download (445kB) |
|
|
Text
SkripsiFinal_DenishaKylaAzzahra_123210130.pdf Restricted to Repository staff only Download (5MB) |
Abstract
ABSTRAK
Aksara Sunda merupakan salah satu kekayaan budaya Indonesia yang harus
dilestarikan. Pembelajaran aksara Sunda, terutama dalam bentuk tulisan tangan yang
memiliki keragaman bentuk, masih menjadi sebuah tantangan tersendiri. Oleh karena itu,
diperlukan solusi berbasis teknologi yang mampu mendeteksi dan mengenali tulisan tangan
aksara Sunda secara akurat. Salah satu pendekatan yang digunakan dalam penelitian ini
adalah multi-object detection, yang memungkinkan pengenalan banyak karakter dalam satu
citra sekaligus, sehingga lebih sesuai untuk konteks teks berbaris atau kalimat yang umum
dijumpai pada penulisan aksara Sunda.
Penelitian ini mengimplementasikan model multi-object detection Faster R-CNN
dengan backbone ResNet-50 untuk melakukan pengenalan tulisan tangan aksara Sunda yang
terdiri dari 18 kelas aksara ngalagena (konsonan bervokal “a”) dan 7 kelas aksara swara
(vokal). Tahapan penelitian ini diawali dengan pengumpulan data citra dari sumber dataset
sekunder dan primer. Kemudian, dilakukan pengolahan data citra dengan 4 tahapan, yaitu
anotasi, splitting, preprocessing (auto-orient dan resize), dan augmentasi (rotasi, noise, dan
blur). Setelah data siap, model dilatih menggunakan konfigurasi parameter pelatihan yang
telah disesuaikan untuk menghasilkan performa optimal. Setelah proses pelatihan, dilakukan
post-processing berupa Non-Maximum Suppression (NMS) untuk mengeliminasi deteksi
redundan dan rekonstruksi teks untuk menyusun rangkaian kata atau kalimat berdasarkan
urutan karakter dari hasil deteksi. Tahap akhir dari penelitian meliputi evaluasi performa
model menggunakan metrik mAP dan pengujian pada sistem dengan lingkungan pengujian
berupa aplikasi web server-side.
Hasil pengujian model menunjukkan parameter pelatihan yang menghasilkan
performa terbaik adalah jumlah kelas sebanyak 26, batch size 6, optimizer AdamW, learning
rate 0,0001, weight decay 0,01, step pada iterasi ke-36.000 dan 50.400, total iterasi 57.600,
periode evaluasi dan checkpoint 1.800, serta confidence threshold 0,5. Konfigurasi tersebut
menghasilkan mAP dengan threshold IoU 0,5 dan 0,75 sebesar 98,86% dan 98,52% pada
data validasi serta 97,38% dan 95,85% pada data uji, dengan waktu inferensi rata-rata 7,209
detik dan jumlah maksimal aksara dalam satu citra yang dapat diidentifikasi dengan tepat
sebanyak 15. Penelitian ini memberikan kontribusi terhadap penelitian mengenai pengenalan
tulisan tangan aksara Sunda dengan mengimplementasikan arsitektur Faster R-CNN dan
OCR sederhana yang belum pernah digunakan sebelumnya.
Kata kunci: Faster R-CNN, Aksara Sunda, Pengenalan Tulisan Tangan, Deep Learning,
Deteksi Objek
vii
ABSTRACT
Sundanese script is one of Indonesia’s cultural heritages that must be preserved. The
learning process of Sundanese script, particularly in handwritten form which often exhibits
a wide variety of shapes, remains a significant challenge. Therefore, a technology-based
solution that can accurately detect and recognize handwritten Sundanese characters is
needed. One such approach used in this research is multi-object detection, which enables
the recognition of multiple characters within a single image. This makes it more suitable for
text-line or sentence contexts, which are common in Sundanese script writing.
This study implements a multi-object detection model, Faster R-CNN with a ResNet
50 backbone, to recognize handwritten Sundanese script consisting of 18 ngalagena
(consonants with inherent vowel "a") and 7 swara (vowel) classes. The research process
began with collecting image data from both secondary and primary sources. The image data
was then processed in four stages: annotation, data splitting, preprocessing (auto-orient and
resize), and augmentation (rotation, noise, and blur). Once the data was prepared, the model
was trained using optimized hyperparameter configurations. After training, post-processing
was carried out, including Non-Maximum Suppression (NMS) to eliminate redundant
detections, and text reconstruction to form words or sentences based on the sequence of
detected characters. The final stages of the research involved evaluating the model's
performance using mAP metrics and testing the system within a web-based server-side
application environment.
The test results show that the best-performing training configuration includes 26
total classes, batch size of 6, AdamW optimizer, learning rate of 0.0001, weight decay of
0.01, learning rate steps at iterations 36,000 and 50,400, total iterations of 57,600,
evaluation and checkpoint intervals every 1,800 iterations, and a confidence threshold of
0.5. This configuration achieved mAP scores of 98.86% and 98.52% on the validation data
for IoU thresholds of 0.5 and 0.75, respectively, and 97.38% and 95.85% on the test data.
The average inference time was 7.209 seconds, with the capability of accurately detecting
up to 15 characters in a single image. This study contributes to the research on Sundanese
handwritten script recognition by implementing the Faster R-CNN architecture along with
a simple OCR system, which has not been previously applied in this context.
Keywords: Faster R-CNN, Sundanese Script, Handwriting Recognition, Deep Learning,
Object Detection
viii
| Item Type: | Tugas Akhir (Skripsi) |
|---|---|
| Uncontrolled Keywords: | Faster R-CNN, Sundanese Script, Handwriting Recognition, Deep Learning, Object Detection |
| Subjek: | Z Bibliography. Library Science. Information Resources > ZA Information resources |
| Divisions: | Fakultas Teknik Industri > (S1) Informatika |
| Depositing User: | Eko Yuli |
| Date Deposited: | 14 Oct 2025 01:12 |
| Last Modified: | 14 Oct 2025 01:12 |
| URI: | http://eprints.upnyk.ac.id/id/eprint/44292 |
Actions (login required)
![]() |
View Item |
