從現在起 你再也不能嘲笑別人的翻譯是「機翻」了
相比下棋下贏人類,AI能聽懂人話、看懂人寫的文字意義明顯重要太多,當AI能把握人類說話意思的時候,人們肯定會驅使通曉各國語言的它去嘗試挑戰打破自然語言間的隔閡。繼通過語音識別測試和機器閱讀測試之後,微軟成功讓自己研發的AI又通過了機器翻譯測試newstest2017,經雙語語言顧問評估,翻譯出來的新聞文本已經媲美人類譯員的水平。
(微軟技術院士黃學東先生,負責微軟語音、自然語言和機器翻譯工作)
懂得自然語言翻譯的人都很清楚,翻譯是沒有標準答案的,表達同一個句子的「正確方法」不止一種,信達雅原則很大程度上受人主觀因素影響。能讓機器翻譯和人工媲美,其中關鍵相信很多人都猜到了——微軟所藉助的技術是深度神經網路而非傳統的統計式機翻。
在此處,對偶學習和推敲網路等AI新研究成果發揮了大作用,如一條中文新聞里的句子,讓它把英文翻譯結果再譯回中文,然後與中文原文比對,從比對結果里總結反饋,修正機器翻譯模型;推敲網路則是模仿人類撰寫文字時的反覆推敲修改過程,通過多輪翻譯,檢查和完善結果,從而使譯文的質量得到大幅提升。
另外,微軟的AI機翻模型里還加入了聯合訓練和一致性規範,聯合訓練的具體做法是把翻譯的句子作為反向翻譯的訓練數據,一致性規範則要求機翻系統不論從左到右還是從右到左進行翻譯,最終生成的翻譯結果都應一致。
如果你很好奇它究竟能翻得多好,可以點擊這裡去親自調戲一下微軟的機翻AI。不過要先提醒的是,微軟機翻AI所通過的測試是新聞內容的翻譯:不帶感情,客觀陳述事實的翻譯。一旦把不確定性極高的人類情感也摻雜在語言中的話,對AI來說翻譯難度會提升n個維度,而且更不用提網路發達之後所產生的各種網路體句式和非正規用法,要讓AI也學會人類操作模因(meme)的方式,目前看來是沒什麼可能性的。
但是微軟這次通過newstest2017的意義仍然非凡,就如前面所說,翻譯沒有標準答案,讓AI能接受和掌握這種有多個答案的工作方式,比在海量的選擇之中暴力運算篩選出最優解來說強多了。如此的AI,肯定會擁有更廣闊的應用空間。
※從CMOS感測器角度看 2018年我們能買到什麼新相機
※2018北美車展其實是半個消費電子展?
TAG:愛活網 |