ชื่อบทความ |
การศึกษาประสิทธิภาพของ Tesseract OCR สำหรับการประมวลผลภาพในการตรวจสอบธุรกรรมทางการเงิน
|
ชื่อบทความ(English) |
The Study of Tesseract OCR Performance for Image Processing in Financial Transaction Verification
|
|
|
ประเภทบทความ |
บทความวิจัย
|
ชื่อผู้แต่ง |
ณรงค์เกียรติ นามห้วยทอง(1), ไตรภาค สิทธิแก้ว(1), อรรถวิท ชังคมานนท์(1), สมนึก สินธุปวน(1) และ ก่องกาญจน์ ดุลยไชย(1*) (Narongkiad Namhuaithong(1), Traiphakh Sitthieaw(1), Attawit Changkamanon(1), Somnuek Sinthupuan(1) and Kongkarn Dullayachai(1*))
|
หน่วยงาน |
สาขาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวิทยาลัยแมโจ้(1) (Computer Science Department, Faculty of Science, Maejo University (1)) *Corresponding author: kongkarn@gmaejo.mju.ac.th
|
ชื่อวารสาร |
วารสารแม่โจ้เทคโนโลยีสารสนเทศและนวัตกรรม ปีที่ 11 ฉบับที่ 2 พฤษภาคม – สิงหาคม 2568
|
บทคัดย่อ |
งานวิจัยนี้มุ่งพัฒนาประสิทธิภาพของ Tesseract OCR สำหรับการตรวจสอบธุรกรรมทางการเงิน โดยศึกษาและเปรียบเทียบรหัสชุดประมวลผลภาพ 5 รูปแบบ ได้แก่ Image Preprocessor Alpha (IPPA), IPP2, IPP6, IPP7 และ IPP12 (Disintegration, n.d.) การวิจัยดำเนินการผ่านสองขั้นตอนหลัก คือ การทดสอบความแม่นยำบนใบเสร็จการโอนเงินจำนวน 116 รายการ และการประเมินประสิทธิภาพการประมวลผลกับชุดข้อมูล 250, 500, 1,000 และ 1,500 รายการ ผลการศึกษาพบว่ารหัสชุดประมวลผลภาพ IPP12 ซึ่งประกอบด้วยเทคนิค Grayscale, Resize, Contrast และ Sauvola Threshold มีประสิทธิภาพสูงสุด โดยเฉพาะเทคนิค Sauvola Threshold ที่สามารถรวมเทคนิคการประมวลผลอื่นๆ ให้อยู่ในวิธีเดียว การวัดประสิทธิภาพด้วย Confusion Matrix แสดงผลลัพธ์ที่อยู่ในเกณฑ์ที่ยอมรับได้ โดยประกอบด้วย Accuracy 81.03% Precision 82.14% Recall 90.79% และค่าดัชนี F1-Score 86.26% การทดสอบประสิทธิภาพด้วยภาษา GO พบว่าระบบใช้เวลาประมวลผลเฉลี่ย 5.313 วินาที ใช้หน่วยความจำ 0.277 GB และจัดสรรพื้นที่ 5.47M งานวิจัยนี้ชี้ให้เห็นความสำคัญของการเลือกเทคนิคประมวลผลภาพที่เหมาะสมในการเพิ่มประสิทธิภาพการตรวจสอบเอกสารทางการเงิน
|
คำสำคัญ |
Tesseract OCR; การประมวลผลภาพ; Sauvola Threshold; การตรวจสอบธุรกรรมทางการเงิน; ความแม่นยำการรู้จำตัวอักษร
|
ปี พ.ศ. |
2568
|
ปีที่ (Vol.) |
11
|
ฉบับที่ (No.) |
2
|
เดือนที่พิมพ์ |
พฤษภาคม - สิงหาคม
|
เลขที่หน้า (Page) |
156-171
|
ISSN |
ISSN 3027-7280 (Online)
|
DOI |
|
ORCID_ID |
0009-0005-2802-2871
|
ไฟล์บทความ |
https://mitij.mju.ac.th/ARTICLE/R68018.pdf
|
| |
เอกสารอ้างอิง | |
|
Bloomberg, D. (n.d.). Leptonica: An open source C library for image processing and analysis. http://leptonica.org/
|
|
Disintegration. (n.d.). Imaging: Image processing package for Go.
https://pkg.go.dev/github.com/disintegration/imaging
|
|
Google. (n.d.). Tesseract OCR.
https://github.com/tesseract-ocr/tesseract
|
|
Lokhande, S. S., & Dawande, N. A. (2015). A survey on document image binarization techniques. In 2015 International Conference on Computing Communication Control and Automation (pp. 742-746). IEEE.
https://doi.org/10.1109/ICCUBEA.2015.148
|
|
Lu, M., & Yang, Y. (2024). Image processing applications in smart contracts: Automated financial transaction verification. Technical Sciences, 41(4), 22.
http://dx.doi.org/10.18280/ts.410422
|
|
Lu, S., Su, B., & Tan, C. L. (2010). Document image binarization using background estimation and stroke edges. International Journal on Document Analysis and Recognition, 13(4), 303-314. http://dx.doi.org/10.1007/s10032-010-0130-8
|
|
Mursari, L. R., & Wibowo, A. (2021). The effectiveness of image preprocessing on digital handwritten scripts recognition with the implementation of OCR Tesseract. Communications in Computer and Information Science, 10(3).
https://doi.org/10.18495/comengapp.v10i3.386
|
|
Sauvola, J., & Pietik?inen, M. (2000). Adaptive document image binarization. Pattern Recognition, 33(2), 225-236. https://doi.org/10.1016/S0031-3203(99)00055-2
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|