OCR เป็นผู้ที่ได้รับการยอมรับตัวอักษรแสงหรือที่เรียกกันในภาษาสเปนเป็นจดจำตัวอักษรแสงOCR เป็นซอฟต์แวร์ที่ช่วยให้จดจำข้อความสร้างภาพเพื่อแปลงเป็นอักขระที่ต่อเนื่องกันแล้วบันทึกในรูปแบบที่กำหนดซึ่งสามารถใช้ในโปรแกรมแก้ไขข้อความเหล่านั้นได้ กล่าวอีกนัยหนึ่งก็คือด้วยเทคโนโลยีใหม่นี้ข้อความหรือเอกสารทุกประเภทรวมทั้งไฟล์ PDF กระดาษสแกนหรือแม้แต่ภาพที่ถ่ายจากกล้องดิจิทัลสามารถแปลงเป็นข้อมูลเพื่อให้มีความเป็นไปได้ในการแก้ไข
ซอฟต์แวร์นี้จะทำงานในลักษณะดังต่อไปนี้ก่อนที่มันวิเคราะห์ส่วนหนึ่งของภาพของเอกสารในคำถามแต่ละ; แจกจ่ายหน้าเป็นชิ้น ๆ เช่นตารางรูปภาพบล็อกข้อความและอื่น ๆ จากนั้นบรรทัดจะกระจายเป็นคำเพื่อให้กลายเป็นอักขระในภายหลัง และเนื่องจากมีการระบุอักขระแล้วซอฟต์แวร์จึงทำการเปรียบเทียบกับกลุ่มรูปภาพของรูปแบบ ความคืบหน้านี้ตามชุดของสมมติฐานเกี่ยวกับสิ่งที่เป็นตัวละครแต่ละตัวคือ; และจากสมมติฐานเหล่านี้จะวิเคราะห์รูปแบบต่างๆของการแบ่งบรรทัดออกเป็นคำและคำเป็นตัว และหลังจากการวิเคราะห์และประมวลผลสมมติฐานจำนวนมากในที่สุดโปรแกรมก็นำเสนอข้อความที่ได้รับการยอมรับและเปลี่ยนรูปแบบด้วยรูปแบบใหม่.
มันควรจะตั้งข้อสังเกตว่าวันนี้มีจำนวนของโปรแกรมที่เสนอตลาดคอมพิวเตอร์ขึ้นอยู่กับ OCR เช่น OmniPage, Abbyy วิจิตร Reader หรือ Readiris YY ที่มีความสามารถไม่เพียง แต่ในการวิเคราะห์และจดจำข้อความดังกล่าวเท่านั้น แต่ยังจดจำรูปแบบและลักษณะด้วย แต่ด้วยข้อ จำกัด บางประการจึงทำให้ต้องแก้ไขข้อความหลังจากวิเคราะห์แล้วเพื่อทำการปรับเปลี่ยน จำเป็นต้อง.