當前位置:
首頁 > 科技 > 機器的「無限有趣空間」:人類將無法理解機器的崛起

機器的「無限有趣空間」:人類將無法理解機器的崛起

編者按:人工智慧的一些表現令人讚歎。但是它們是如何實現這些成就的過程在人類眼裡卻是個黑箱。技術作家及藝術家James Bridle最近出版了一本反映機器崛起的新書,《New Dark Age(新黑暗時代)》。其中對機器如何思考的探討令人感到氣餒——借用科幻作家Iain M. Banks的話來說,在超智機器的腦子裡有一個無限有趣的空間,這個地方是人類永遠也無法進入的。

1997年,紐約,現任國際象棋世界冠軍卡斯帕羅夫在跟深藍對陣,後者是IBM專門設計用來擊敗他的計算機。上一年在費城舉行的一場類似比賽中,卡斯帕羅夫以4:2獲勝,這位被廣泛視為有史以來最偉大的國際象棋大師對獲勝很有信心。所以當輸掉比賽時,他宣稱深藍的其中一些走法太過智能且富有創意了,所以一定是有人干預的結果。不過我們知道為什麼深藍會走出那些下法:它選擇下法的過程其實是一種暴力破解,由14000顆定製設計的國際象棋晶元組成的大規模並行架構,每秒鐘能夠分析2億種盤面狀態。比賽那時候,它在地球最強大計算機的排名是第259位,而且純粹是為國際象棋設計的。在選擇下一步怎麼走的時候它腦子裡可以計算更多的結果。卡斯帕羅夫不是思路不夠,只不過是被火力壓制住了。

相比之下,當Google Brain驅動的AlphaGo軟體擊敗圍棋世界冠軍李世石時,情況變了。在5番棋的第二局,AlphaGo走出了一步令李世石和觀眾感到震驚的棋,它把一顆子下到了棋盤的遠端,似乎要中途退賽的感覺。一位評論說:「這是非常奇怪的一步,我認為這是個錯誤,」另一個人說。樊麾,另一位經驗豐富的圍棋選手,6個月前不幸成為了第一個輸給AlphaGo的職業棋手,他對此的評論是:「這步棋不是人走的。我從來沒見過人有這種下法。」他還補充說:「下得太漂亮了。」在這項有2500年歷史的遊戲里,還沒人會這麼下過。AlphaGo後來勢如破竹,不僅贏下了這場比賽,也包括後來的系列賽。

AlphaGo的工程師開發該軟體是靠這個,一個含有專業棋手數百萬下法的神經網路,然後讓它左右手互搏數百萬次,從而形成了超越人類棋手的策略。但是它的這些策略的表現是很難辨認的:我們能看到它的下法,但看不到它是如何做出決定的。AlphaGo的各個部分之間互搏時下出來的步法,其複雜性也不是我們能想像得到的,但我們不大可能看得見和欣賞它們;想要對這種複雜性進行量化也不可能,它只有取勝的直覺。

傑出的科幻作家Iain M. Banks把這些招式的發生地稱為「無限有趣空間(Infinite Fun Space)」。在Banks的科幻小說里,他的《文明》裡面的文明是由仁慈、超智的AI來管理的,這種AI就叫做Mind。儘管這些Mind原先是由人創建的(或者至少是一些生物性的碳基實體),但很久以前它們就已經超越了自己的創建者,然後對自己進行重新設計和建造,不僅變得高深莫測而且無比全能。除了控制飛船和星球,指揮作戰,照顧數十億人類以外,Mind也有自己的樂趣,其中就包括超出人類理解範疇的推測計算。由於能夠在自身想像中模擬整個宇宙,一些Mind永遠地撤到了這個無限有趣的空間,這是一個只有元數學可能性的領域,只有超級人工智慧才能進入。至於剩下的我們,如果我們摒棄那道拱門的話,留給我們的只有有限樂趣,徒勞地分析機器做出的、超出我們理解的決定。

如果不是被迫要將自己的夢展示給我們看的話,機器就會進一步深入到自己的想像空間,進入我們到不了的地方。

不過一些機器智能的操作並不局限在無限有趣空間裡面。相反,它們在我們的世界上創造出一種未知(unknowingness):新的圖像;新的面孔;新的、未知的或者假的事件。就像語言可以充當他人意思的無限網格一樣,同樣的做法也可應用到一切可用數學表示的地方——也就是多維空間裡面的一個由加權連接組成的網路。從人體得到的詞仍然有聯繫,即便被剝奪了人類的意思,根據那個意思的數字就可以進行計算。在語義網路中,力線——向量——定義了單詞「皇后」與那些閱讀次序為「皇帝 - 男人 + 女人」的單詞是一致的。按照此類向量的路徑,這種網路能夠推斷出「皇帝」與「皇后」之間存在著一種性別關係。對於人臉也能做同樣的事情。

對於給定的一組人的圖像,神經網路可以執行一種新的計算,這種計算不僅僅會按照這些力線的路徑去走,還會生成新的結果。就像2015年Facebook研究人員發表的一篇論文所展示那樣,微笑的女性、不笑的女性以及不笑的男性的一組照片經過計算可以得出微笑男性的全新圖像。利用一項大規模圖像識別挑戰超過300萬張卧室圖片的數據集,他們的網路生成了新的卧室:那些顏色和傢具的布置在現實世界裡是找不到的,那是卧室向量的交集:牆,窗戶,羽絨被以及枕頭。機器夢想出了做不出夢來的夢幻房間。不過令人印象深刻的是那一張張類似我們的臉:這些人是誰,他們笑什麼?

當機器夢想出來的這些圖像開始跟我們的記憶交織在一起時,事情開始變得更加奇怪。2014年從法國家庭度假回來時,倫敦大學學院人工智慧研究人員Robert Elliott Smith帶回來了滿滿一手機的照片。他把其中一些上傳到了Google+上,好跟妻子一起分享,但是在瀏覽照片的時候他發現了一些異常。在其中一張照片中,他看到自己跟妻子坐在一家飯店的桌子旁對著鏡頭笑。但是他印象中自己從來沒拍過這張照片。一天午飯,他父親按住iPhone的按鈕稍微久了一點,結果就得出了相同場景下的一系列照片。Smith將其中2張上傳,想看看妻子更喜歡哪一張。其中一張是他笑妻子不笑,另一張是妻子在笑但他沒笑。通過這兩張照片,Google的排序演算法只需幾秒鐘就召喚出了第三張:雙方均笑得「最好」的合成照片。該演算法是名為AutoAwesome(後來改名為「Assistant」)的軟體包的一部分,它會對上傳的照片進行一系列的調整,讓它們看起來更加「出色」——其中應用了懷舊的濾鏡,將其變成迷人的動畫等等。但這一次,結果是一張從未發生過的定格照片:一次雪茄的記憶,一個重寫的歷史。

照片的修復是一項跟這種媒介本身歷史同樣悠久的活動,但這一次的操作是自動進行的,在個人記憶的產物中是不可見的。儘管如此,我們從中還是能學到一點什麼:這說明了圖像其實永遠都是假的,人為的片刻之間的快照從來都無法從多維的時間洪流中剝離出來,作為奇點而存在。不可靠的記錄;相機與注意力的合成。這些不是世界和存在的人為產物,而是記錄過程的產物——而這個過程作為一種虛假的機制,是永遠也無法逼近現實本身的。只有當捕捉和和存儲的過程用技術具體化時,我們才能精確地感受到它的不真實,才能感受到它與現實的差異。這是我們可以從夢想機器中吸取到的教訓:不是說它們重寫了歷史,而是歷史本來就不是可以可靠地敘述的東西,因此,未來也是如此。通過人工智慧向量映射而來的照片構成的不是一份記錄,而是一種持續的重新想像,一種不斷變化的曾經發生過什麼以及將會發生什麼的可能性。這個可能性的雲,永遠的因情況而異以及朦朧性,對於現實而言,其實是比任何物化的斷言都要好的模型。而這朵雲是由技術來披露的。

由機器來闡明我們的無意識的最佳示例也許是Google機器學習研究的另一項怪異的結果:一個叫做DeepDream的程序。DeepDream這東西的目的就是為了更好地說明高深莫測的神經網路的內部機制。為了學會識別對象,需要灌輸給神經網路數百萬的有關事物的標籤圖像:樹木、汽車、動物、房子等。系統接觸到一幅新的圖像時,會對圖像進行過過濾、拉伸、拆分和壓縮以便進行分類:這是一棵樹,這是一輛汽車,這是一個動物,這是一棟房子。但DeepDream顛倒了這個流程:它先是在網路的末梢輸入一幅圖像,然後激活受訓識別特定對象的神經元,它問的不是這幅圖像是什麼,而是網路希望在裡面看到什麼?這個過程類似於在雲彩當中看到一張張臉一樣:視皮質因為對刺激的渴望,會在雜訊中產生出有意義的模式。

DeepDream的工程師Alexander Mordvintsev是在凌晨2點的時候開發出該程序的第一個迭代版本的,當時他因為做噩夢被驚醒了。他灌輸給神經網路的第一幅圖像是一隻小貓坐在樹樁上,輸出是一頭可怕的怪物:有很多雙眼睛,腳上長著濕鼻子的貓狗混種。2012年,Google首次發布一個基於1000萬隨機YouTube視頻的未經訓練的分類器網路時,在沒有任何提示的情況下它學會識別的第一個東西就是一張貓臉:這是互聯網的靈獸。Mordvintsev的網路因此夢想出了它知道的東西,也就是更多的貓和狗。進一步的迭代產生耶羅尼米斯·博斯地獄逃亡式的無限結構,是被激活的神經元而定,裡面有拱門、塔、橋等分形的層層推進。但DeepDream的創作自始至終有一點是不變的,那就是眼睛——狗的眼睛,貓的眼睛,人的眼睛;網路本身無所不在的時刻盯住你的眼睛。漂浮在DeepDream的天空中的眼睛讓人想起了敵托邦宣傳裡面的全視之眼:Google自身的無意識,由我們的記憶和行動組成,被不斷的分析處理,為了公司利潤和私營情報而跟蹤。DeepDream天生就是一台偏執狂機器,因為它出現的地方就是一個偏執狂世界。

與此同時,在不需要被迫將它們的夢境展現給我們看時,機器會進一步深入到自己的想像空間,那是我們無法進入的地方。Walter Benjamin在《譯者的任務》裡面的最大希望,是語言之間的傳輸過程會催生出一種「純語言(pure language)」——全世界所有語言的混合物。正是這種語言才能充當譯者的翻譯介質,因為它揭示的不是意思而是說話者的思維方式。根據2016年Google Translate神經網路的激活方式,研究人員意識到這個系統能夠翻譯的不僅僅只是語言之間的兩兩互譯,而是所有語言之間的互譯;也就是說,它可以直接在兩種自己從未明確比較過的語言之間進行翻譯。比方說,基於日英互譯和英韓互譯語料受訓的網路可以生成日韓互譯而不需要經過英語。這叫「零數據(zero-shot)」翻譯,這意味著「中介語」表示的存在:一種內部的由跨語言共享概念構成的元語言。

無論從哪一方面來說,這幾乎就是Benjamin的純語言;是這種架構無意義的源語言。通過將該網路及其向量的結構可視化為各種顏色和線條,就有可能看到多種語言的句子聚合到一起。其結果是一個語義化的表示,而這種表示是由網路演變而來,而不是設計進網路裡面的。但再次地,我們對它的理解只能取決於我們能多靠近地一窺那無限樂趣之地——那個我們永遠也無法拜訪的地方。

編譯組出品。編輯:郝鵬程。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 36氪 的精彩文章:

資本在自動駕駛領域正在變得越來越重要
余寧加入蔚來資本任管理合伙人,曾主導汽車行業重要併購

TAG:36氪 |