農林漁牧網

您現在的位置是:首頁 > 林業

OCR識別技術,讓AI更貼近K12教育

2022-11-28由 有道智雲 發表于 林業

ocr識別是人工智慧嗎

伴隨著人工智慧的浪潮,OCR識別也從幕後來到臺前。針對於掃描文件的OCR識別技術已經非常成熟,而自然場景下文字識別(Scene Text Recognition,STR)由於包含豐富的場景資訊,且受到複雜的背景、文字的模糊與形變、不可預測的光照、字型的多樣性等干擾,一直是計算機視覺領域研究的熱點和難點。

有道依靠豐富的產品矩陣和數以億計的活躍使用者積累了大量且優質的真實資料,透過有道眾包資料平臺根據不同任務需求進行大規模資料標註,以主流深度學習和神經網路技術為基礎,分析各個應用場景的特性,自研了基於文字語義方向的文字檢測演算法和全語種混合識別的文字識別演算法。透過文件平面實時檢測與矯正、場景分析、360全形度影象糾偏、文件結構化分析等多個前後處理模組,進一步最佳化OCR系統端到端的效果。目前有道OCR系統已支援橫豎斜混合排版識別、手寫識別、簡繁公式識別、中英日韓等26主流文字的混合識別,平均識別率高達96%以上,同時對身份證、票據等垂直場景也能輸出結構化的識別結果。這一系列能力在金融、物流、教育、政府等領域都有廣泛的應用。

有道以通用OCR技術為基礎,針對K12教育場景,研發了一套完整的OCR智慧教育解決方案。除已有的通用功能外,有道OCR引擎還支援題目精準切分、少兒手寫識別、公式識別、拼音識別、超模糊文字高精度識別、加點字識別等多種特殊場景需求。其中精準題目切分準確率高達90%以上,少兒手寫識別準確率高達85%以上,公式識別準確率高達88%以上,其他各個特殊場景平均識別準確率高達 93%以上。

一、

題目精準切分

K12教育場景的精準題目切分服務不僅支援整頁題目切分,還支援特定場景下返回使用者目標題目等特色功能,在各個複雜場景下的平均切分準確率高達90%以上。

輸入圖例:

OCR識別技術,讓AI更貼近K12教育

二、

少兒手寫識別

針對K12使用者(尤其是少兒使用者)高難度手寫場景進行最佳化,解決文字粘連、書寫不規範等問題,為後續的作業批改等特色功能提供可靠輸入。其識別準確率高達85%以上,並且可以和其他OCR場景完全相容。

輸入圖例:

OCR識別技術,讓AI更貼近K12教育

識別結果:

年月日 第 頁

tāntāntān sōu sōusōu

灘灘灘沙灘 艘艘艘一艘

jūn jūn jūn jiàn jiàn jiàn

軍軍軍(軍人) 艦艦艦(軍艦

fān fān fān dào dào dàn

帆帆帆(風帆 稻稻稻稻香)

yuán yuán yán kǒng kǒng kǒng

圓圓圓花圓) 孔孔孔大孔)

cuì cuì cuì duì duì duì

翠翠翠翠竹 隊隊隊隊伍

tóng tóng tóng hào hào hào

銅銅銅銅號 號號號號角

11。8 優

wú wú wú tóngtóng tóng

梧梧梧(梧桐) 桐桐桐油桐

三、

公式識別

支援公式轉為latex功能,準確率高達93%。可同時對題目中的普通文字和公式文字進行精準檢測與區分。

輸入圖例:

OCR識別技術,讓AI更貼近K12教育

識別結果:

OCR識別技術,讓AI更貼近K12教育

四、

拼音識別

業內唯一支援K12場景拼音識別的OCR服務,識別準確率高達92%以上,可與其他OCR場景完全相容,無需使用者區分使用。

輸入圖例:

OCR識別技術,讓AI更貼近K12教育

識別結果:

一 、我的書寫最漂亮。(6分)

léi fēng wēn nuǎn

gān tián cài zhī

bō wén jǐng sè

(2分)

二、用“√”

選擇正確的讀音。(10分)

四處(

種子(zhǒng zhòng)

2。例:戀戀不捨(AABC式)

3。例:又細又長(含加點字)

五、詞語巧搭配。(6分)

晶瑩的 細雨

濛濛的 小路

彎彎的 露珠

碧綠的 景色

五、

超模糊文字識別

業內首家支援超模糊文字識別的提供商,針對文字密集且清晰度極低的文字區域進行識別最佳化,識別準確率為95%以上,可用於攝像頭精度不夠或拍攝環境惡劣的場景。

輸入圖例:

OCR識別技術,讓AI更貼近K12教育

識別結果:

探究創新全練>思維開放天天向上

1。研究發現:人在飲酒後駕車的應急反應時間是未飲

酒時的2-3倍。反應時間是指司機從看到意外情

況到探劑車需要的這段時間;在反應時間內汽車要

保持取速前進一段距離,這段距離叫反應距離。如

圖2-3-13所示,某人酒後駕車沿馬路直線行駛,

車頭中央題馬路邊沿3m,車在到達某位置時,發現

一人正從路邊出發閱紅燈過人行橫道,此時汽車的

速度為15m/。,距離入的行走路線為30,若該司

六、

加點字的識別

目前業內唯一支援加點字識別的OCR服務(識別結果中帶有加點資訊),識別準確率達到95%以上,其他OCR場景完全相容,無需區分使用。

輸入圖例:

OCR識別技術,讓AI更貼近K12教育

識別結果:

欲墜呢!漸漸地我的眼睛模糊了,我好像看見無\dot數\dot螢\dot 第

火\dot蟲\dot在\dot我\dot的\dot周\dot圍\dot飛\dot舞\dot。

老師來指導 細讀這兩組 是加點的 組

部分,我們就會發現,這兩組句子中 這個字,根

據句意分析,這兩組句子都運用了 方法。根

據這一特點,我們找到句中的本 允不難分出

哪部分是作者看到的,哪部分是

答案供參考 第一絲 者看到了火

燒雲變成馬跪著的形狀,聯如 等著人騎上

它的背

七、

強幹擾文字識別

針對少兒讀物的強幹擾文字進行識別最佳化,識別準確率為95%以上。同時與其他OCR場景完全相容,無需區分使用。

輸入圖例:

OCR識別技術,讓AI更貼近K12教育

識別結果:

xuǎn zé zhèng què de dú yīn bìng tú shàng yán sè

一、選擇正確的讀音並塗上顏色。(8分)

查 所 遲 共

cá chá suǒ shuǒ cí chí gòn gòng

臉 熊 注 準

liǎn niǎn xóng xióng zù zhù zǔn zhǔn