「熱點」谷歌騰訊FACEBOOK最新必爭之地:神經網路翻譯NMT
新智元編譯
學術界對神經機器翻譯(NMT)的研究興趣不減。今年到5月份為止,在開放存取論文網站 arXiv.org 上發表的有關 NMT 的研究論文數量幾乎相當於2016年全年的該主題論文數量。這個數字印證了我們在去年底預測的趨勢。
截至5月7日,arXiv.org 存儲庫中在標題或摘要中包含 NMT 的論文共有137篇,其中2014年發表的只有7篇,2015年增加到11篇。發生突破的是2016年,發表的論文達到67篇。
NMT,或稱基於神經網路的機器翻譯方法,被視為是基於短語的統計機器翻譯(SMT)和更早以前的基於規則的方法的一個突破。
雖然有許多研究和比較評估指出 NMT 在實現更流暢的翻譯結果方面有優勢,但該技術仍處於研究的初級階段,許多有趣的研究方向正在繼續展開。
大多數NMT研究者來自美國
到本文發布為止,2017年提交到 arXiv 的 NMT 主題下的論文的作者涉及全球範圍的173名研究者,其中大多數(63名)來自美國的大學或研究機構。
最高產的作者是 Kyunghyun Cho,紐約大學計算機科學系,庫朗數學研究所的助理教授。去年一年,Cho 的淪為得到14次引用。
Cho 作為共同作者的論文一共三篇,分別是:《Nematus:一個神經翻譯工具包》,《學習句法分析和翻譯改進 NMT》,以及《可訓練的NMT的貪婪解碼》,協作者包括來自愛丁堡大學,海德堡大學和歐洲蘇黎世大學的研究人員, 東京大學和香港大學, 以及土耳其中東技術大學。
除 Cho 之外,還有62位來自九所美國大學的研究人員在 arXiv 公布了他們在 NMT 方面的研究,這九所大學分別是:加州大學伯克利分校,CMU,紐約大學,麻省理工學院計算機科學與人工智慧實驗室,劍橋大學,斯坦福大學,喬治亞理工學院,約翰霍普金斯大學,以及哈佛大學。
來自歐洲的61位研究者也在這一主題下發表了大量論文,作者的國籍包括:英國(18),德國(11),愛爾蘭(13)和荷蘭(7)。
來自亞洲的有58篇NMT主題的論文,主要來自中國(包括香港和台灣)31篇,日本22篇,韓國3篇以及新加坡2篇。
來自美國科技巨頭的研究團隊,例如 Facebook Research、谷歌大腦、IBM Watson、英偉達(NMT 運行於其 GPU 晶元之上)以及機翻技術先驅SYSTRAN 也一直在向 arXiv 貢獻研究成果。
例如,來自谷歌大腦研究人員的論文提供了有關構建和擴展 NMT 架構的洞見,並提供了一個開源的 NMT 框架來驗證結果。
哈佛和 SYSTRAN 的研究者介紹了一個開源的 NMT 工具包 OpenMT,它提供了一個用於訓練和部署神經機器翻譯模型的庫。他們表示,該工具包將進一步發展,「在研究前沿保持強大的 MT 成果」,為產出類應用提供了穩定的框架。
NMT,數學遇見語言
Facebook 於2017年5月9日宣布,正在開源其 NMT 模型,並有一篇關於論文 發在 arXiv 上。 該論文以《神經機器翻譯學習聯合多語言句子表徵》為題(Learning Joint Multilingual Sentence Representations with Neural Machine Translation),由其 AI 研究團隊的兩名成員與 the Informatics Institute – University of Amsterdam 和 the Middle East Technical University 的其他兩位研究人員合作撰寫。
在亞洲,中國互聯網供應商騰訊今年有兩篇論文貢獻出來。 一篇來自其深圳的 AI Lab(《神經機器翻譯源句法建模》(Modeling Source Syntax for Neural Machine Translation)); 另一篇,來自騰訊移動互聯網部門(《使用線性關聯單位的深度神經機器翻譯》(Deep Neural Machine Translation with Linear Associative Unit)),這是和蘇州大學、中國科學院及都柏林大學的聯合研究。
北京的微軟亞洲研究院今年也開始進行 NMT 方面的研究。本月剛上傳了兩篇論文(《對抗神經機器翻譯》(Adversarial Neural Machine Translation)和《MAT:圖像字幕多模態轉換器》(MAT: A Multimodal Attentive Translator for Image Captioning))。
微軟自己的研究人員與中國科技大學、台灣中山大學,廣東省信息安全技術重點實驗室,清華大學,UESTC 和 Johns Hopkins University 等科研人員展開了研究合作。
附:
谷歌論文:https://arxiv.org/abs/1703.03906
哈佛大學論文:https://arxiv.org/abs/1701.02810
Facebook 論文:https://s3.amazonaws.com/fairseq/papers/convolutional-sequence-to-sequence-learning.pdf
騰訊論文:https://arxiv.org/abs/1705.01020
中國移動論文:https://arxiv.org/abs/1705.00861
微軟論文:https://arxiv.org/abs/1704.06933
新智元招聘
職位:客戶總監
職位年薪:30 - 60萬(工資+獎金)
工作地點:北京-海淀區
所屬部門:客戶部
彙報對象:COO
下屬人數:8 人
年齡要求:25 歲 至 40 歲
性別要求:不限
工作年限:5 年
語 言:英語 + 普通話
學歷要求:全日制統招本科
職位描述:
熱愛人工智慧,在行業內有一定的人脈資源和影響力;
為客戶制定媒體關係策略和公關活動策劃,達成客戶的市場或傳播目標;
負責監督公關項目的計劃和實施,使項目能按期在預算內完成;
積極拓展客戶資源,開發公司業務,與既有客戶保持緊密的業務聯絡和溝通;
監督、管理及考核客戶服務團隊,全面提升公司客戶服務質量;
理工科背景優先,有知名企業或知名媒體機構工作經驗者優先。
應聘郵箱:jobs@aiera.com.cn
HR微信:13552313024
新智元歡迎有志之士前來面試,更多招聘崗位請點擊【新智元招聘】查看。
※「最新」IBM 深度學習框架PowerAI,將訓練時間從幾周變成幾小時
※蘋果2億美元收購「黑暗數據」公司萊迪思,DeepDive 系統用AI推理引擎結構化數據
※2020年全球醫療市場 AI 地圖:落地、技術、應用、終端用戶產業及地理分布
※「榜單」世界級機器學習專家都有誰?有關 AI 你不能不知道的6個人物
※新智元專訪CVPR2019程序主席微軟華剛:arXiv讓雙盲評審形同虛設,單純刷分把研究機械化,暴力化
TAG:新智元 |
※【TalkOP漢化】海賊王資料集生命卡ONE PIECE圖鑑全圖翻譯(東海的猛者們+超新星集結)
※CMBYN翻譯序言
※為什麼說FORTNITE翻譯 堡壘之夜那麼受熱愛
※Pchy P寶採訪NBA美食家視頻翻譯
※海賊王資料集生命卡:《VIVRE CARD》全書情報+翻譯(上)
※CATTI考前12小時,翻譯思路熱熱身
※翻譯報好消息Dopa疑似復出,李哥迎來新的勁敵?網友:SKTT1 Dopa
※玩 High API 系列之:拍照翻譯
※LOL:洲際賽LCK遇到語言障礙怎麼辦?三國翻譯Doinb即刻上線
※POLA大人気な商品ご紹介(中文翻譯)
※BATI大佬雲集智博會,訊飛翻譯機獲選黑科技產品TOP10
※【官方】海賊王資料集生命卡ONE PIECE圖鑑全圖翻譯(一)
※NCB:一種新的m6A閱讀器!可促進mRNA翻譯和穩定性
※《名偵探柯南BLACK PLUS 超級摘要書》官方時間線!銀色子彈字幕組翻譯!
※【翻譯組】INS怎樣征服NBA
※INTERFACE | 從技術到產品,搜狗為我們解讀了神經機器翻譯的現狀
※INTERFACE#4 解讀搜狗機器翻譯技術,體驗搜狗旅行翻譯寶產品
※[MD PHOTO]韓國藝人 劉海鎮首爾出席代言翻譯軟體宣傳活動
※通吃BERT、GPT-2,用TF 2.0實現谷歌破世界紀錄的機器翻譯模型Transformer
※耳機中的翻譯機,TOPPERS智能耳機E1測評