Facebook推出神經機器翻譯系統,日處理45億次
來源|Techcrunch
作者| John Mannes
編譯|大琴
微信公眾號ID|Xtecher
Facebook近期宣布,它們已經完成了向神經機器翻譯技術的轉移,啟用基於人工智慧的神經機器翻譯系統(NMT)——包括卷積神經網路(CNN)的移動和遞歸神經網路(RNNs),來翻譯Facebook上的帖子和評論。
從時間來看,Facebook上線神經機器翻譯技術的時間點略落後於谷歌和微軟。此前,Google和微軟已經於去年開始使用NMT。未來,Facebook將會很快把基於短語的機器翻譯模型拋棄。和傳統基於短語的機器翻譯模型相比,神經機器翻譯技術具有很多的優勢,但最根本的優勢是神經機器翻譯能產生更精確的譯文。
傳統的機器翻譯有一個相當明確的過程——依託重點短語,機器翻譯系統開始翻譯句子然後大致確定最終的翻譯。你可以將這個過程看成是「使用Rosetta Stone語言學習軟體來翻譯文本」。
與傳統機器翻譯相反,神經機器翻譯模型進行了層次更高的抽象化的處理,他們將句子的表達變成了多維向量表示的一部分。這意味著,神經翻譯系統將嘗試根據「上下文」,而不僅僅是通過短語來翻譯。
該神經機器翻譯模型並不是完美的,研究者們仍在探索,如何處理長期以來關係(比如,如何確保長文本中理解能力和準確性)。不過,這種方法仍然很有前景,截至目前為止,也帶來了不錯的結果。
2016年9月,谷歌宣布了向神經機器翻譯發展的第一步。兩個月後,微軟也宣布了類似的消息。Facebook在這方面(神經機器翻譯)也持續工作了約1年,而現在正在啟動技術的全面部署。今年5月,Facebook人工智慧研究部門(FAIR)於也發表了自主研發的結果,並在GitHub上開源了相關CNN模型。
Facebook語言技術團隊的工程經理Necip Fazil Ayan在接受採訪時表示:「我們的問題與大多數標準場合不同,這主要是由於我們在Facebook上看到的語言類型。我們看到了許多非正式用語和縮寫的俚語,這個語言的風格差異很大。」
利用新的神經機器翻譯技術,Facebook的翻譯質量提升了10%,同時,日翻譯數量超過 45 億次。
━━━━━
封面來源:網路 排版:陳光 校對:陳光
━━━━━
如果您有國內外科技行業新鮮資訊或獨到見解,歡迎與Xtecher聯繫
Xtecher官網平台現開通認證作者,
(添加好友請註明公司、職位、事由)
點擊展開全文
※Theranos陷入困境,給生物及醫療科技行業什麼警示?
※AI:社會的解構與建構
※Protocols.io:有效防止「韓春雨事件」再發生的科學社交平台
※Facebook否認AI失控;特斯拉Q2營收和虧損比預期好
TAG:Xtecher |
※207元 谷歌推出Pixel USB-C earbuds耳機:支持實時翻譯
※Deep Voice Report個人翻譯
※Second banana千萬不要翻譯為「第二個香蕉」
※又涼一個,微軟翻譯Windows 10 Mobile版即將下架
※NLP重磅!谷歌、Facebook新研究:2.26億合成數據訓練神經機器翻譯創最優!
※RaoTips翻譯 有關Batch Brew
※「I love you」的100種翻譯方法
※Facebook Messenger 將提供聊天翻譯功能
※Facebook Messenger迎來全新AR功能和M翻譯器
※Facebook開源多款AI工具,支持遊戲、翻譯
※Windows 10 Mobile微軟翻譯應用:卒
※通吃BERT、GPT-2,用TF 2.0實現谷歌破世界紀錄的機器翻譯模型Transformer
※Facebook 開源 ConvNet AI:重新定義在線翻譯!
※12頁《The Dark Knight》劇本翻譯
※大規模集成Transformer模型,阿里達摩院如何打造WMT 2018機器翻譯獲勝系統
※唯美英文翻譯句:I love you for my life past
※專訪 | 大規模集成Transformer模型,阿里達摩院如何打造WMT 2018機器翻譯獲勝系統
※翻譯們又要失業?Facebook最新無監督機器翻譯成果,BLEU提升10個點!
※Facebook Messenger更新:自動翻譯外語 引入AR體驗
※《sequence to sequence:video to text》視頻描述的全文翻譯