勵志

勵志人生知識庫

ocr是什麼意思

光學字元識別

OCR是英文Optical Character Recognition的縮寫,意思是光學字元識別,也可簡單地稱為文字識別,是文字自動輸入的一種方法。它通過掃描和攝像等光學輸入方式獲取紙張上的文字圖像信息,利用各種模式識別算法分析文字形態特徵,判斷出漢字的標準編碼,並按通用格式存儲在文本檔案中。所以,OCR是一種非常快捷、省力的文字輸入方式,也是在文字量比較大的今天,很受人們歡迎的一種輸入方式。OCR的概念是在1929年由德國科學家Tausheck最先提出來的,後來美國科學家Handel也提出了利用技術對文字進行識別的想法。OCR可套用於銀行票據、大量文字資料、檔案卷宗、文案的錄入和處理領域等場景,適合於銀行、稅務等行業大量票據表格的自動掃描識別及長期存儲。一個OCR識別系統,從影像到結果輸出,須經過影像輸入、影像前處理、文字特徵抽取、比對識別,最後經人工校正將認錯的文字更正,將結果輸出。相對一般文本,通常以最終識別率、識別速度、版面理解正確率及版面還原滿意度4個方面作為OCR技術的評測依據;而相對於表格及票據,通常以識別率或整張通過率及識別速度為測定OCR技術的實用標準。因此,OCR的意思就演變成為利用光學技術對文字和字元進行掃描識別,轉化成計算機內碼,以便文字處理軟體進一步編輯加工的系統技術。