ocr是什麼意思 _勵志人生網

光學字元識別

OCR是英文Optical Character Recognition的縮寫，意思是光學字元識別，也可簡單地稱為文字識別，是文字自動輸入的一種方法。它通過掃描和攝像等光學輸入方式獲取紙張上的文字圖像信息，利用各種模式識別算法分析文字形態特徵，判斷出漢字的標準編碼，並按通用格式存儲在文本檔案中。所以，OCR是一種非常快捷、省力的文字輸入方式，也是在文字量比較大的今天，很受人們歡迎的一種輸入方式。OCR的概念是在1929年由德國科學家Tausheck最先提出來的，後來美國科學家Handel也提出了利用技術對文字進行識別的想法。OCR可套用於銀行票據、大量文字資料、檔案卷宗、文案的錄入和處理領域等場景，適合於銀行、稅務等行業大量票據表格的自動掃描識別及長期存儲。一個OCR識別系統，從影像到結果輸出，須經過影像輸入、影像前處理、文字特徵抽取、比對識別，最後經人工校正將認錯的文字更正，將結果輸出。相對一般文本，通常以最終識別率、識別速度、版面理解正確率及版面還原滿意度4個方面作為OCR技術的評測依據；而相對於表格及票據，通常以識別率或整張通過率及識別速度為測定OCR技術的實用標準。因此，OCR的意思就演變成為利用光學技術對文字和字元進行掃描識別，轉化成計算機內碼，以便文字處理軟體進一步編輯加工的系統技術。