ระบบ OCR รองรับรูปแบบไฟล์ใดบ้างสำหรับการอัปโหลด


ระบบ OCR รองรับการอัปโหลดไฟล์ในรูปแบบต่างๆ เพื่อให้ผู้ใช้สามารถแปลงเอกสารจากแหล่งต่างๆ เป็นข้อความที่แก้ไขได้อย่างยืดหยุ่น ต่อไปนี้เป็นรูปแบบไฟล์ทั่วไปบางส่วนที่ระบบ OCR อาจรองรับ:
รูปแบบภาพ:
JPEG/JPG: รูปแบบการบีบอัดภาพที่ใช้กันอย่างแพร่หลาย เหมาะสำหรับภาพถ่ายและเอกสารที่สแกน
PNG: รูปแบบภาพบีบอัดแบบไม่สูญเสียข้อมูลที่รองรับความโปร่งใส และมักใช้สำหรับภาพและไอคอนบนเว็บ
TIFF/TIF (รวมถึง TIFF หลายหน้า): รูปแบบภาพคุณภาพสูงที่ใช้กันทั่วไปในอุตสาหกรรมการพิมพ์และการเผยแพร่ และรองรับเอกสารหลายหน้า
BMP: รูปแบบภาพมาตรฐานในระบบ Windows ที่ไม่มีการบีบอัด มีขนาดไฟล์คุณภาพสูงแต่มีขนาดใหญ่
GIF: รูปแบบภาพที่รองรับแอนิเมชั่นและความโปร่งใส แม้ว่าจะใช้สำหรับภาพบนเว็บเป็นหลัก แต่ระบบ OCR อาจรองรับได้เช่นกัน
รูปแบบเอกสาร:
PDF: รูปแบบเอกสารพกพาที่ใช้กันอย่างแพร่หลายในการแบ่งปันและพิมพ์เอกสาร เช่น หนังสืออิเล็กทรอนิกส์ รายงาน และสัญญา โดยทั่วไประบบ OCR จะสามารถจดจำข้อความที่สแกนในไฟล์ PDF ได้
แม้ว่าระบบ OCR จะสามารถประมวลผลไฟล์ได้หลายรูปแบบ แต่ไฟล์ในรูปแบบที่แตกต่างกันอาจมีผลการจดจำที่แตกต่างกันในระหว่างกระบวนการ OCR ตัวอย่างเช่น ไฟล์ TIFF ที่มีคุณภาพการสแกนสูงและภาพที่ชัดเจน มักจะจดจำได้แม่นยำกว่าไฟล์ JPEG ดังนั้น เมื่อเลือกอัปโหลดไฟล์ ผู้ใช้ควรเลือกตามความต้องการและคุณภาพของไฟล์