農林漁牧網

您現在的位置是:首頁 > 林業

證件識別技術,即OCR識別技術

2021-12-20由 我要上頭條 發表于 林業

ocr識別是什麼

熱點:OCR,證件識別,身份證識別,護照識別,OCR識別技術

OCR (Optical Character Recognition,

光學字元識別

)是指電子裝置(例如掃描器或數碼相機)檢查紙上列印的字元,透過檢測暗、亮的模式確定其形狀,然後用字元識別方法將形狀翻譯成計算機文字的過程;衡量一個OCR系統性能好壞的主要指標有:拒識率、誤識率、識別速度、使用者介面的友好性,產品的穩定性,易用性及可行性等。

證件識別技術,即OCR識別技術

護照識別

證件識別技術,就是透過光學字元識別原理,透過手機拍照將圖片輸入到證件識別核心SDK,對於不同的影象格式,有著不同的儲存格式,不同的壓縮方式,目前有OpenCV,CxImage等開源專案 。再進行預處理,包括二值化處理、噪聲去除處理、傾斜校正處理等。

證件識別技術,即OCR識別技術

身份證識別

對於現在標準化的證件而言,證件識別核心SDK裡面先對各類證件定義了不同的版式,二代身份證、護照、駕駛證、行駛證、回鄉證、臺胞證等有效身份證件都會有不同的模板;證件圖片被上傳後,預處理後,同時會根據證件的製作工藝或證件號等資訊,來進行判別證件型別;再對證件圖片文字進行分割處理,將相應的欄位資訊一一對應切割提取出來。

證件識別技術,即OCR識別技術

駕駛證識別

作為高階的OCR識別技術,還得具有對識別結果進行後處理,即校正功能。畢竟OCR識別技術有自己的侷限性,即會出現識別錯誤現象存在的。那麼我們的OCR識別技術有獨有的校正功能,如身份證中地址的欄位,由於地址欄位五花八門,且比較長,就會容易出錯;因此我們對地址欄位進行了校正,因為省市縣(區)是全國正規的轄域名稱,若對這些文字識別錯誤的話,則可以根據若干字再到資料庫進行比對,從而給出機率最大的文字。

以上就是證件識別技術,即OCR識別技術的原理,您聽懂了麼?

證件識別技術,即OCR識別技術

文字識別