網易有道AI再發力 離線NMT離線OCR堪比聯網效果
繼去年4月推出有道神經網路翻譯,網易有道近日公布了又一AI大動作——推出離線神經網路翻譯(離線NMT)以及離線文字識別(離線OCR)。
據悉,有道是目前國內為數不多能夠實現離線NMT和離線OCR的公司,並且能夠在離線的狀態下,保持高質量的翻譯和識別效果。該技術已於有道翻譯官等產品中上線,能夠實現高質量的離線拍照翻譯,更好地解決出國旅行的語言翻譯問題。
離線NMT,翻譯效果依然準確
一般而言,離線翻譯相對於在線翻譯,最大的問題就是質量不高。為了攻克這個難題,有道技術團隊在離線模型、訓練數據方面做了大量的針對性的優化和調整,使得即使在沒有網路的情況下,仍然能夠保證高質量的翻譯。
目前有道離線翻譯仍採用神經網路翻譯模型,翻譯效果不僅高於在線SMT(統計機器翻譯),與同類競品的對比中,有道離線NMT翻譯質量處於領先。
以以下一段BBC news的一條新聞導語為例,原文是:
「More than a century ago, an antiquities dealer from Jerusalem claimed he had discovered an ancient version of the book of Deuteronomy. But was it a fake?」
通過有道離線NMT與其他離線NMT對其進行翻譯,對比顯示,有道離線NMT的翻譯結果更符合人類語言習慣,而且對於特殊地名、人名有道離線NMT也都能精準翻譯。
(有道與其他離線NMT翻譯結果對比.英譯中)
再以一段中文語料為例原文是:
「這幾年關於人工智慧的討論不絕於耳。人們一邊早已習慣了種種「黑科技」對生活潛移默化的影響,一邊對讓世界翻天覆地的人工智慧技術嘆為觀止。」
依然讓三款離線NMT進行翻譯,結果也顯示出,有道離線NMT的翻譯結果更加流暢、長短句斷句清晰、時態翻譯也更符合英文的語法習慣。
(有道與其他離線NMT翻譯結果對比.中譯英)
離線OCR識別 準確度堪比聯網效果
有道自主研發的文字識別OCR技術,是業內效果最好的文字識別技術之一,其對圖片中標準文字識別率達97%,對於圖片中特殊文字識別率也可達90%。
而有道近日推出的離線OCR,識別率依然很高,甚至由於在本地處理的優勢,離線OCR識別速度比聯網更快,不到1秒就能完成。而且對於斜體、曲面、摺疊等非平整的物體都能高質量識別,所支持的種類也達十幾種,包括中英繁、日韓、拉丁語(葡萄牙、義大利、西班牙、法語、羅馬尼亞、波蘭)、俄語、荷蘭、德語、挪威、丹麥、印地語等。
而離線NMT及OCR的推出,也第一時間應用在了有道旗下產品中,例如有道翻譯官的離線拍照翻譯功能,在即使沒有網路的情況下,依然實現高質量的拍譯效果。而該功能的使用場景十分廣泛,例如不少國人出國旅遊都會遇到網路不穩定或者沒有網路的情況,利用有道翻譯官離線拍照翻譯,就能很好的解決這一問題。
有道翻譯官離線拍照翻譯(曲面物體及日文)
有道翻譯官拍照翻譯(傾斜角度)
有道是國內最早進入機器翻譯領域的公司,十年來一直聚焦中文與其他語言之間的翻譯,通過不斷提升機器翻譯的質量,為用戶帶來高質量的翻譯體驗。自去年4月,有道神經網路翻譯上線後,其帶來的翻譯質量提升是過去十年的總和。
※樂唯科技榮膺第七屆中國公益節年度公益傳播獎
※蘋果進軍美劇界 聯手《愛樂之城》團隊打造新劇
TAG:Donews |