當前位置╃↟: 首頁>關於我們>光虎新聞

OCR光學字元識別技術

  • 作者╃↟:

  • 來源╃↟:光虎光電科技(天津)有限公司

  • 訪問量╃↟:377

  • 釋出時間╃↟:2022-06-13 08:47:25

什麼是OCR光學字元識別•◕•?


OCR (Optical Character Recognition✘•·,光學字元識別)是指電子裝置(例如掃描器或數碼相機)檢查紙上列印的字元✘•·,透過檢測暗·✘▩、亮的模式確定其形狀✘•·,然後用字元識別方法將形狀翻譯成計算機文字的過程·│₪☁•。衡量一個OCR系統性能好壞的主要指標有╃↟:拒識率·✘▩、誤識率·✘▩、識別速度·✘▩、使用者介面的友好性✘•·,產品的穩定性✘•·,易用性及可行性等·│₪☁•。


在工業領域✘•·,光學字元識別 (OCR) 是一項機器視覺任務✘•·,包括從影象中提取文字資訊·│₪☁•。

OCR是高精度文字識別技術✘•·,並且對中等顆粒圖形噪聲無懈可擊·│₪☁•。它們還適用於識別使用點陣列印機制作的字元·│₪☁•。該技術為部分遮擋或變形的字元提供了令人滿意的結果·│₪☁•。


識別過程的效率主要取決於文字分割結果的質量·│₪☁•。大多數識別案例都可以使用提供的一組識別模型完成·│₪☁•。在其他情況下✘•·,可以輕鬆準備新的識別模型·│₪☁•。


OCR光學字元識別技術步驟


為了實現最準確的識別✘•·,有必要進行仔細的文字提取和分段·│₪☁•。從影象獲取文字的總體過程包括以下步驟╃↟:


從影象中讀取文字


壹 |
貳 |
叄 |
肆 |
伍 |

獲取文字位置

從背景中提取文字

分段文字

使用準備好的OCR模型

字元識別




獲取文字位置


文字的位置是固定的✘•·,它由稱為掩碼的框描述·│₪☁•。例如✘•·,個人身份證是按照正式規範製作的·│₪☁•。每個資料欄位的位置是已知的·│₪☁•。經過良好校準的視覺系統可以拍攝文字位置幾乎恆定的影象·│₪☁•。

 




文字位置不是固定的✘•·,但它與輸入影象上的特徵元素或特殊標記(光學標記)相關·│₪☁•。要獲取文字的位置✘•·,必須找到光學標記·│₪☁•。這可以透過模板匹配·✘▩、1D 邊緣檢測或其他技術完成·│₪☁•。


未指定文字的位置✘•·,但可以透過影象閾值輕鬆地從背景中分離字元·│₪☁•。然後可以使用 Blob 分析技術找到正確的字元·│₪☁•。

 




從背景中提取文字


文字提取過程中的主要複雜情況可能是光線不均勻·│₪☁•。某些技術(如光規範化或邊緣銳化)有助於查詢字元·│₪☁•。




原始影象

 

光規範化後的影象 



使用 Fourier 變換進行低頻影象阻尼後的影象


 


使用不均勻的光線取樣圖

經過光規範化處理的不均勻光線影象


此時✘•·,已提取的文字區域已準備好進行分段·│₪☁•。



分段文字


文字區域分割是將區域拆分為行和單個字元的過程·│₪☁•。只有當每個區域包含一個字元時✘•·,識別才可能實現·│₪☁•。

 


使用區域形態過濾器將文字拆分為行的過程


當文字文字行分開時✘•·,每行必須拆分為單獨的字元·│₪☁•。



使用拆分割槽域得到多個字元的字元分割


接下來✘•·,提取的字元將從圖形表示形式轉換為文字表示形式·│₪☁•。


呼叫OCR模型庫


透過呼叫OCR模型庫✘•·,使識別到的字元以文字形式與模型庫進行比對✘•·,匹配資料最相似的模板✘•·,得出準確的字元資訊·│₪☁•。


字元識別


通常來說需要選擇適當的字元規範大小✘•·,來分類字元的大小·│₪☁•。





【來源╃↟:光虎光學內部培訓資料】
                                                                                         

光虎光學專業生產由德國設計的工業鏡頭·│₪☁•。
以高精度雙遠心鏡頭為核心✘•·,涵蓋高效能FA定焦鏡頭·✘▩、變倍鏡頭等產品·│₪☁•。
可實現為客戶定製化研發生產·│₪☁•。光虎光學還代理歐美日機器視覺全系列產品·│₪☁•。
如面陣與線掃工業相機·✘▩、智慧相機·✘▩、3D相機·✘▩、紅外與紫外相機·✘▩、光源·✘▩、影象採集卡·✘▩、機器視覺軟體及其他周邊產品·│₪☁•。


男吃女下面玩高潮视频,精品国产香蕉伊思人在线,国产黄三级高清在线观看播放,国产又色又刺激高潮视频