當前位置:
首頁 > 最新 > 谷歌的「末日翻譯」預示基督再臨?

谷歌的「末日翻譯」預示基督再臨?

選自MotherBoard

作者:Jon Christian

烏鎮智庫編譯

用過谷歌翻譯的人都知道,翻譯出來的結果本來就是不管中國人和外國人都聽不懂。不過如果你在谷歌翻譯里連續輸入19次「dog」,選擇從毛利語翻譯成英語,會彈出一段亂碼式的「神諭」。

圖片|來自谷歌翻譯

「世界末日時鐘將在十二點零三分時敲響,我們在這世界上所經歷之種種,正預示著末日和耶穌基督的歸來審判愈發臨近。」(《聖經》馬太福音第24章第7節描述世界末日的前兆:「民要攻打民,國要攻打國,多處必有饑荒、地震」)

當然沒人迷惑我,也沒人迷惑谷歌翻譯,這只是Reddit和其他社交論壇上的用戶發現眾多谷歌翻譯出的奇奇怪怪又時而摻雜不祥厄運的隻言片語。例如,在選擇索馬利亞語翻譯英語時,「ag」這個字元串會被翻譯成「Gershon的兒子」,還會出現「name of the LORD」(以耶和華之名)和一些聖經術語,諸如「cubits」(肘尺,聖經中的計量單位,自肘至中指段)或「Deuteronomy」(申命記,聖經舊約中的一卷)。

谷歌搜索八年前退出中國,谷歌翻譯去年悄咪咪的回歸大陸,這個運營超過十年的產品如今已經支持超過100種語言。

圖片|來自谷歌翻譯

不少人在推特上說,這都是幽靈和惡魔作祟。一個叫「翻譯門」的子版塊上有一個用戶推測,這些奇怪翻譯可能是提取了我們郵件或私密文檔中的一些文本信息。

谷歌發言人賈斯汀·伯爾(Justin Burr)在一封電子郵件中說:這種言論純粹是無稽之談甚至有些陰謀論,谷歌翻譯的機器學習演算法只從網上翻譯的例子中學習,不使用個人的隱私信息,系統也沒有許可權訪問這些內容,這些只是無意義的輸入產生的無意義輸出罷了。

谷歌翻譯的神奇輸出有幾種可能性,有可能是來自一些心懷怨念的谷歌員工的報復,或者是惡作劇用戶濫用「建議編輯」(suggest an edit)按鈕,這個按鈕的作用是如果用戶對提交的文本有更好的翻譯,可以向谷歌翻譯提供建議。

圖片|谷歌翻譯神經網路訓練

來自谷歌在iResearch發布的文章

哈佛大學助理教授,研究NLP和計算機翻譯的安德魯·拉什(Andrew Rush)認為,內部的質量filters可能會捕捉到這種操作,更有可能的是,這些奇奇怪怪的翻譯跟谷歌翻譯近幾年啟用「神經網路機器翻譯」(neural machine translation)技術有關。

拉什說,在這項技術中,系統被一種語言的大量文本信息訓練,翻譯成對應的另一種語言,但是如果輸入無意義時,系統會被允許輸出「幻覺式」的胡言亂語。跟大多數的訓練實例相同,模型就是一個黑盒子,它被訓練的結果就是要不惜一切代價地輸出看起來更像人類語言的東西,但是如果你輸入一些你自己也看不懂的火星文,產出的最佳翻譯依然是看上去流利的文字,但是跟輸入內容八竿子也打不著邊。

BBN科技公司(BBN Technology)的高級科學家肖恩·科爾巴斯(Sean Colbath),多年來從事機器翻譯工作,他也認為這些奇怪的輸出是谷歌翻譯的演算法試圖在混亂的輸入文本中尋找規律,同時他還指出,產生奇怪翻譯的索馬利亞語、毛利語、夏威夷語等,文本數據量比英語或者中文這些使用廣泛的語言少太多,所以谷歌翻譯可能會使用聖經這樣被翻譯成多種語言的宗教出版物作為語言訓練模型,所以才產生了宗教內容。

拉什也同意肖恩的觀點,如果谷歌使用了聖經作為文本訓練模型,可以解釋那些「神諭」一般的奇怪翻譯。事實上,索馬利亞語里的「神翻譯」里類似舊約里的段落,出埃及記第27章第18節提到了「100肘尺」(a hundred cubits),民數記第3章第18節也提到了「Gershon的兒子」(the sons of Gershon)。

谷歌發言人伯爾則孤零零的拒絕透露谷歌翻譯的培訓材料是否包括宗教文本。

圖片|來自谷歌翻譯

儘管看起來像開玩笑,演算法好像是指引著一道不可思議的光,教你寧可失去百體中的一體,不叫全身丟在地獄。

畢竟谷歌翻譯用索馬利亞語解釋了「w hy ar e th e tran stla tions so wei rd」(為毛這翻譯這麼奇怪):

「It is a great way to make it so much better」

烏鎮智庫 資訊推薦


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 烏鎮智庫 的精彩文章:

Google打造「死亡演算法」

TAG:烏鎮智庫 |