PENERAPAN METODE TESSERACT OCR ENGINE DAN REGULAR EXPRESSION UNTUK PENGOLAHAN CITRA DOKUMEN SURATDI LINGKUNGAN JURUSAN TEKNIK INFORMATIKA UPN "VETERAN" YOGYAKARTA

Aqillasari, Yolanda Putri (2020) PENERAPAN METODE TESSERACT OCR ENGINE DAN REGULAR EXPRESSION UNTUK PENGOLAHAN CITRA DOKUMEN SURATDI LINGKUNGAN JURUSAN TEKNIK INFORMATIKA UPN "VETERAN" YOGYAKARTA. Diploma thesis, Universitas Pembangunan Nasional "Veteran" Yogyakarta.

[img]
Preview
Text
COVER.pdf

Download (240kB) | Preview
[img]
Preview
Text
ABSTRAK.pdf

Download (148kB) | Preview
[img]
Preview
Text
DAFTAR ISI.pdf

Download (165kB) | Preview
[img]
Preview
Text
DAFTAR PUSTAKA.pdf

Download (140kB) | Preview
[img]
Preview
Text
Pengesahan Pembimbing.pdf

Download (515kB) | Preview
[img]
Preview
Text
Pengesahan Penguji.pdf

Download (536kB) | Preview
[img] Text
SKRIPSI FULL_Yolanda Putri Aqillasari_(123150040) Informatika.pdf
Restricted to Repository staff only

Download (9MB)

Abstract

Pada suatu organisasi maupun instansi penggunaan media surat dinilai lebih informatif dalam menyampaikan informasi yang bersifat resmi dan penting. Surat resmi dari suatu instansi memiliki nilai hukum dan dapat dijadikan sebagai alat bukti historis, sehingga pengagendaan surat-surat tersebut perlu dilakukan.Teknologi OCR (optical character recognition) dengan Tesseract OCR Engine dapat diterapkan untuk membantu proses pendataan agenda surat tersebut,yaitu dengan melakukanproses ekstraksi informasi dari citra dokumen suratyang kemudian akan menghasilkan data digitaluntuk dapatdiolah sesuai kebutuhan. Namun hasil akurasi Tesseractakan berkurang apabila terdapat objek gangguan pada citra yang akan diproses.Solusi dari permasalahan ini dapat diatasi dengan menambahkan image preprocessingsebelum proses pengenalan oleh Tesseract untuk meningkatkan kualitas citra, sehingga hasil pengenalan karakter menjadi lebih baik. Tahapan image preprocessingyang dilakukan yaitu scaling, brightness, grayscale, gaussian filtering, otsu thresholdingdan erosi. Selanjutnya data hasil pengenalanOCR akan diklasifikasikan menggunakan algoritma Regular Expression.Adapun data yang diambil adalah datanama instansi pengirim, nomor surat, tanggal surat, perihal dan penerima surat.Hasil yang didapat dari pengujian yang telah dilakukan pada 15 dokumen surat dengan format penulisan yang berbeda, akurasi TesseractOCR dapat ditingkatkan dengan menerapkan image preprocessing. Nilai rata-rata akurasi untuk pengenalan karakter pada citra surat tanpa image preprocessingsebesar 73,503388%, sedangkanpada citra surat dengan image preprocessing menghasilkan nilai akurasi rata-rata sebesar 90,58362%. Sehingga nilai peningkatan rata-rata yang dihasilkan pada pengenalan objek citra surat yaitu sebesar 17,08023%. Selain itu algoritma Regular Expressiondapat digunakan untuk proses klasifikasi data dengan nilai rata-rata akurasi yang dihasilkan untuk atribut nama instansi pengirim sebesar 91,26785%, atribut nomor surat sebesar 90,36643%, atribut tanggal surat sebesar 93,25311%, atribut perihal sebesar 91,69876% dan untuk atribut penerima surat sebesar 92,89901%. Kata Kunci: Surat, Optical Character Recognition,Tessercat OCR Engine,Regular Expression

Item Type: Thesis (Diploma)
Uncontrolled Keywords: Kata Kunci: Surat, Optical Character Recognition,Tessercat OCR Engine,Regular Expression
Subjects: Z Bibliography. Library Science. Information Resources > ZA Information resources
Z Bibliography. Library Science. Information Resources > ZA Information resources > ZA4450 Databases
Divisions: Faculty of Engineering, Science and Mathematics > School of Engineering Sciences
Depositing User: Eny Suparny
Date Deposited: 05 Feb 2021 08:37
Last Modified: 05 Feb 2021 08:37
URI: http://eprints.upnyk.ac.id/id/eprint/24564

Actions (login required)

View Item View Item