Aqillasari, Yolanda Putri (2020) PENERAPAN METODE TESSERACT OCR ENGINE DAN REGULAR EXPRESSION UNTUK PENGOLAHAN CITRA DOKUMEN SURATDI LINGKUNGAN JURUSAN TEKNIK INFORMATIKA UPN "VETERAN" YOGYAKARTA. Diploma thesis, Universitas Pembangunan Nasional "Veteran" Yogyakarta.
|
Text
COVER.pdf Download (240kB) | Preview |
|
|
Text
ABSTRAK.pdf Download (148kB) | Preview |
|
|
Text
DAFTAR ISI.pdf Download (165kB) | Preview |
|
|
Text
DAFTAR PUSTAKA.pdf Download (140kB) | Preview |
|
|
Text
Pengesahan Pembimbing.pdf Download (515kB) | Preview |
|
|
Text
Pengesahan Penguji.pdf Download (536kB) | Preview |
|
Text
SKRIPSI FULL_Yolanda Putri Aqillasari_(123150040) Informatika.pdf Restricted to Repository staff only Download (9MB) |
Abstract
Pada suatu organisasi maupun instansi penggunaan media surat dinilai lebih informatif dalam menyampaikan informasi yang bersifat resmi dan penting. Surat resmi dari suatu instansi memiliki nilai hukum dan dapat dijadikan sebagai alat bukti historis, sehingga pengagendaan surat-surat tersebut perlu dilakukan.Teknologi OCR (optical character recognition) dengan Tesseract OCR Engine dapat diterapkan untuk membantu proses pendataan agenda surat tersebut,yaitu dengan melakukanproses ekstraksi informasi dari citra dokumen suratyang kemudian akan menghasilkan data digitaluntuk dapatdiolah sesuai kebutuhan. Namun hasil akurasi Tesseractakan berkurang apabila terdapat objek gangguan pada citra yang akan diproses.Solusi dari permasalahan ini dapat diatasi dengan menambahkan image preprocessingsebelum proses pengenalan oleh Tesseract untuk meningkatkan kualitas citra, sehingga hasil pengenalan karakter menjadi lebih baik. Tahapan image preprocessingyang dilakukan yaitu scaling, brightness, grayscale, gaussian filtering, otsu thresholdingdan erosi. Selanjutnya data hasil pengenalanOCR akan diklasifikasikan menggunakan algoritma Regular Expression.Adapun data yang diambil adalah datanama instansi pengirim, nomor surat, tanggal surat, perihal dan penerima surat.Hasil yang didapat dari pengujian yang telah dilakukan pada 15 dokumen surat dengan format penulisan yang berbeda, akurasi TesseractOCR dapat ditingkatkan dengan menerapkan image preprocessing. Nilai rata-rata akurasi untuk pengenalan karakter pada citra surat tanpa image preprocessingsebesar 73,503388%, sedangkanpada citra surat dengan image preprocessing menghasilkan nilai akurasi rata-rata sebesar 90,58362%. Sehingga nilai peningkatan rata-rata yang dihasilkan pada pengenalan objek citra surat yaitu sebesar 17,08023%. Selain itu algoritma Regular Expressiondapat digunakan untuk proses klasifikasi data dengan nilai rata-rata akurasi yang dihasilkan untuk atribut nama instansi pengirim sebesar 91,26785%, atribut nomor surat sebesar 90,36643%, atribut tanggal surat sebesar 93,25311%, atribut perihal sebesar 91,69876% dan untuk atribut penerima surat sebesar 92,89901%. Kata Kunci: Surat, Optical Character Recognition,Tessercat OCR Engine,Regular Expression
Item Type: | Thesis (Diploma) |
---|---|
Uncontrolled Keywords: | Kata Kunci: Surat, Optical Character Recognition,Tessercat OCR Engine,Regular Expression |
Subjects: | Z Bibliography. Library Science. Information Resources > ZA Information resources Z Bibliography. Library Science. Information Resources > ZA Information resources > ZA4450 Databases |
Divisions: | Faculty of Engineering, Science and Mathematics > School of Engineering Sciences |
Depositing User: | Eny Suparny |
Date Deposited: | 05 Feb 2021 08:37 |
Last Modified: | 05 Feb 2021 08:37 |
URI: | http://eprints.upnyk.ac.id/id/eprint/24564 |
Actions (login required)
View Item |