農林漁牧網

您現在的位置是:首頁 > 畜牧業

EMUI10滾屏翻譯:外文閱讀不間斷

2022-01-13由 砍柴網 發表于 畜牧業

怎麼滾屏翻譯

你好?Hello??こんにちは?Hola!

我們生活在不一樣的地方,用著不一樣的語言,是翻譯的出現,讓跨地區跨語言交流變為可能。為了方便交流,翻譯工具在不斷地升級換代,翻譯功能也越來越強大,從逐詞逐句的翻譯,再到網站、圖片甚至是文件翻譯。

超好用的翻譯服務萬里挑一

為提供更智慧和貼心的翻譯服務,讓使用者可以和更廣闊的世界交流,華為陸續推出了語音翻譯、AR翻譯、全屏翻譯。這一次,我們的目光聚焦在長文章翻譯上。寫論文的時候,外文參考文獻令人頭大?出國旅遊的時候,外文攻略看傻眼?想追個國外熱點,卻發現自己根本看不懂新聞?

EMUI10滾屏翻譯:外文閱讀不間斷

如果想要翻譯多屏內容,需要一次又一次進行全屏翻譯的操作。隨著內容長度的增加,操作的繁複會使閱讀的連貫性降低。面對這樣的場景,全屏翻譯變得“力不從心”,這時候,就需要滾屏翻譯來幫忙了。

EMUI10滾屏翻譯:外文閱讀不間斷

作為史上第一款系統級長文翻譯服務,滾屏翻譯支援各種應用、十種語言、多屏內容的翻譯。使用小藝語音口令“幫我翻譯螢幕”或雙指按壓螢幕,點選“全屏翻譯->滾屏翻譯”,即可觸發。接下來看看滾屏翻譯是怎麼樣來完成長文章翻譯的吧。

文字變圖片再變譯文的奇妙流水線

當你瀏覽一篇長文章需要翻譯時,系統會先將其滾動截圖,形成一張原文的長截圖,然後對長截圖進行切分、文字檢測、翻譯、排序、去重、拼接,最後以同樣的圖片和翻譯完成的文字,再次呈現在你的面前,這就是我們的滾屏翻譯。

在這一系列的步驟中,最為關鍵的是如何對長截圖進行初步處理。那利用什麼技術去進行處理呢?

那就不得不提到這裡面的關鍵技術——OCR技術了,那OCR是什麼?

光學字元識別(Optical Character Recognition)是指檢查字元,並對其進行檢測識別,然後再將其字元形狀轉換成計算機文字的過程。在這裡的應用,也就是對原來長文章形成的長截圖上的文字,進行識別提取,將它們提供給後續的機器翻譯環節使用,也就是完成了長篇源文字提取的過程。

EMUI10滾屏翻譯:外文閱讀不間斷

從技術原理上為檢測和識別兩段式演算法框架,涉及中、英、日、韓、俄、西、法、德、意、葡十種語言識別能力,包含多個運行於NPU(Neural-network Processing Unit,神經網路處理單元)的深度模型。

呼叫OCR演算法後,首先對影象做增強處理,將圖片適配至理想狀態後,採用多執行緒的方式同步執行深度模型以及後處理運算,最後藉助NLU(Natural Language Understanding,自然語言理解)校正輸出文字識別結果。

EMUI10滾屏翻譯:外文閱讀不間斷

翻譯的準不準,依賴於OCR識別的準確性;翻譯的快不快,依賴於OCR處理字元速度的快慢。將經過OCR處理的文字進行機器翻譯,重新對圖片進行排序、拼接處理,最後把翻譯好的長篇文章呈現在使用者面前。

這樣一套能把長文章中的文字變圖片再轉換成譯文的創新方案,現在已經申請了專利保護噢!

每一行字每一張圖都要完完整整

滾屏翻譯中還創新性地透過OCR文字行定位以實現智慧的圖片切分和拼接,巧妙地避免了在長截圖切分過程中文字或圖片被截斷的情況。

大家可能會有這樣的疑問,原文形成的長截圖直接翻譯不行嗎?為什麼還要做切分呢?

這是因為,當前的圖片翻譯只支援單屏內容的翻譯,長截圖會自動縮放成和螢幕等高進行翻譯,圖片被壓縮,文字大小自然也被壓縮了,這會極大地影響到翻譯結果的準確性。

EMUI10滾屏翻譯:外文閱讀不間斷

為了有效提高翻譯的準確性,那就把長截圖切分成多張短圖後再做翻譯吧。但如果直接按照螢幕高度對長截圖做簡單切分,很可能會出現一行文字被截斷或者一張插圖被截斷的情況。

EMUI10滾屏翻譯:外文閱讀不間斷

而滾屏翻譯,採用OCR技術,可以檢測出一行文字或圖片的位置座標,如果發現切分位置正好處在某行或某張圖片中間,則會向上移動到行間空白位置進行切分。

EMUI10滾屏翻譯:外文閱讀不間斷

以這種規則處理後的圖片寬度同螢幕一致,高度等於或略低於螢幕高度,每一行字和每一張圖都是完整的。這種方案巧妙實用,在速度快的同時,保證了使用者的使用體驗。

你可以在EMUI 10。0版本的華為手機上體驗滾屏翻譯功能,系統自動滾動形成長截圖進行翻譯,方便快捷,真正做到所見即所譯、滾動譯全文。下次面對看不懂的長篇外文時,記得首選滾屏翻譯來幫忙噢!