一種基于神經網絡的智能病案文字識別的方法

Submitted by neurta on Thu, 02/06/2020 - 11:12
ocr

頤保醫療科技有限公司

權力要求書

?

一:1.一種基于神經網絡的智能病案文字識別的方法,其特征在于,包括以下步驟:

S1、取病案文本行數據進行標注,標出每個文本行里面所包含的文字,得到病案訓練數據:

S2、將標注病案訓練數據與已有的通過通用文字識別方法識別的文字檢測數據一起作為訓練數據,并將已有的文字檢測數據按照98:1:1的比例分成訓練集、測試集和驗證集;

S3、將訓練數據按32*280*3的圖片進行灰度處理轉換成32*280*1的灰度圖,并輸入卷積神經網絡模塊中進行圖片的特征提取,生成4*35*192的特征圖,然后將特征圖進行維度交換35*4*192,再將最后兩個維度進行合并35*768的特征圖轉入雙層雙向循環神經網絡做特征提取,得到特征圖的35個切片;

S4、利用文本識別模型對特征圖的35個切片分別進行分類預測得分;

S5、取每一個切片預測得分最高的分類,該分類對應的字即為所預測的字,最后將35個切片的相同字符進行合并,得到10個字符。

2.根據權力要求1所述的一種基于神經網絡的智能病案文字識別的方法,其特征在于,在步驟S1中,每張病案訓練數據長寬相同并包含10個文字。

3.根據權力要求1所述的一種基于神經網絡的智能病案文字識別的方法,其特征在于,在步驟S3中,所述特征圖的35個切片為35個字或字符的數量。

4.根據權力要求1所述的一種基于神經網絡的智能病案文字識別的方法,其特征在于,在步驟S4中,文本識別模型采用CTC作為損失函數,采用Adam梯度下降優化器進行模型的反向傳播,調整神經網絡模型參數。

有益效果是:

(1)數據集增加醫學用詞及醫學用詞訓練數據,增加了醫學用詞的預測能力;

(2)由真實病案數據制作的數據集,能夠有效的消除背景的影響

(3)通過新設計的卷積神經網絡模塊和雙層雙向神經網絡的結合,使得本專利在通用文本及病案文本的識別準確率上顯著提高,特別是比現有的ocr識別病案的準確率高,準確度達到98.3%

冯仰妍破处门