當前位置:
首頁 > 科技 > 深度學習不是魔法妖怪,只是數學計算而已

深度學習不是魔法妖怪,只是數學計算而已

Oren Etzioni 是西雅圖艾倫人工智慧研究所(Allen Institute for Artificial Intelligence)的 CEO,同時也是華盛頓大學的計算機科學家。此文為他在 Wired 上發表的一篇有關深度學習的文章。他認為:深度學習在對象識別、特徵提取等包含一定模式的任務中有著魔法般優異的表現,但在擁有更大可能性空間的真正世界任務中,深度學習往往捉襟見肘——所以別再害怕了,深度學習不是我們打開魔瓶放出的無所不能的魔法妖怪。


深度學習正迅速「侵蝕」人工智慧領域,但不要因此就誇大這項人工智慧優勢技術的內涵。著名作家 Arthur C. Clarke 曾寫過這樣一句話:「Any sufficiently advanced technology is indistinguishable from magic(任何非常先進的技術,初看都與魔法無異)。」深度學習可以用來識別照片中的物體和人臉、辨認說話內容、翻譯語言、甚至擊敗古老圍棋遊戲的世界高手。深度學習固然屬於先進技術,但離魔法還差得遠。


谷歌、Facebook 和微軟等科技巨頭接二連三地將深度學習技術投入線上業務——世人對谷歌圍棋超級機器 AlphaGo 的讚歎聲連綿不絕——常有專家稱深度學習是對人類大腦的一種模仿,但實際上它只是大規模執行的數學計算。

特別地,深度學習是一種基於數據對神經網路進行「調製」的計算方法。這是什麼意思?神經網路是一種由大量非常簡單的互連元素構成的計算機程序,其受到了大腦結構的一點點啟發。每個元素都會對自己接收的輸入數值進行簡單的函數計算(比如求和函數等)。這些元素比神經元要簡單得多,元素和元素之間的連接的數目也比大腦中神經元和突觸數目要小几個數量級。深度學習的作用只是強化這種網路中的連接。


深度學習是機器學習的分支學科,而機器學習則是人工智慧( AI )領域中一個生機勃勃的研究領域。理論上來說,機器學習是一種基於一系列數據點的函數逼近方法。比如,給定序列「2,4,6......」,機器可能會假定在該序列的行為符合函數 2 乘以 X ,其中 X 指序列中元素的位置;然後預測第 4 個序列元素為 8,第 5 個為 10。這樣的範式很常見,並已在無人駕駛汽車、語音識別、預測機票價格波動等領域取得了巨大的成功。


某種程度上,深度學習不是唯一的機器學習系統。任何機器學習系統 ,無論深度與否,都有以下幾個基礎組成部分:


執行單元:這是系統中在世界中採取行動的部分(如:在圍棋中走子);

目標函數:被學習的函數(如:圍棋中棋盤位置和走子選擇的映射);


訓練數據:用來逼近目標函數的有標籤數據點的集合(如:棋盤位置的集合,其中每一個位置都標註了人類專家在該位置選擇的走子);


數據表徵:每個數據點通常會被表示為一個預先確定的變數的向量 (如:棋盤上每個棋子的位置)


學習演算法:基於訓練數據計算目標函數的近似的演算法;


假設空間:學習演算法可能考慮的函數的空間。

該架構能獲取從簡單的線性回歸方法到複雜的深度學習演算法等機器學習方法的全域(Full Gamut)。從技術上看,我們指的正是監督學習(supervised learning),其中每一個數據點都有通常人類所作的標籤。當數據沒有標籤時,就是無監督學習或聚類,其處理就困難得多。只有部分數據有標籤時,就是半監督學習。統計學家把基於因變數估計自變數的值的過程稱為回歸(regression)。


要認識到機器學習架構的這五個部分是人工輸入的,這點非常重要;人類程序員建構了其中每個元素,但卻無法控制該機器學習程序。事實上,程序員通常會分析這個學習程序的行為,知道到它不是完美的,然後手動修改其中一個或多個元素。這項工作非常艱苦,在實現期望的性能水平之前需要重複多次,常常要花上一年或者更多的時間。


幫助人類


我們可以看到,一個學習程序的能力受到了這種架構的嚴格限制。詳細來說:


程序無法修改這個架構的任何部分

程序無法自我修改


程序無法「學習」其自身假設空間之外的函數


因此,一個 AlphaGo 這樣的學習程序在沒有人力的幫助下無法學會國際象棋或跳棋。此外,如果沒有大量的專門訓練,大多數程序員不能成功修改機器學習系統。即便是訓練有素的數據科學家也需要大量時間和資源才能成功建立系統。


沒有人力的協助,AlphaGo 這樣的學習程序無法搞定象棋

AlphaGo 系統的設計和實現需要 3000 多萬個從互聯網上挑選的訓練樣本,以及一個龐大的研究者和工程師團隊的多年努力。事實上,僅僅是將 AlphaGo 擊敗歐洲圍棋冠軍樊麾的水平提升到擊敗李世石的水平也需要好幾個月的緊張工作 。


AlphaGo 也會利用一類被稱為「強化學習」的機器學習方法來學習如何不斷選擇動作並觀察結果,從而獲得最大的贏面。 AlphaGo 會不斷重複選擇各種走法並觀察結果。在強化學習中,訓練數據不是預先標註的輸入。相反,該學習程序被提供了一個「獎勵函數(reward function)」——該函數將獎勵分配給了該世界的不同狀態。雖然強化學習方法通過執行某些動作並觀察結果來獲得訓練數據,但本文中的機器學習分析同樣也適用於強化學習——該方法仍然受限於其目標函數、數據表徵和假設空間等等。


可能性空間


進化通常被援引為學習的不受控制的力量產出了顯著結果的案例,但了解自然選擇的進化過程和計算機程序模擬過程之間的區別是至關重要的。計算機中嘗試模擬進化過程的程序被稱為遺傳演算法,但該方法目前還未取得特別的成功。


遺傳演算法修改了「生命體」的定義,而它涵蓋的範圍是非常大的。比如,人類基因估計包含了超過 10 億比特的信息。這意味著人類 DNA 序列的可能數量是 2 的 10 億次方。探索這麼大的空間所需的計算成本非常高昂,根本不可行。然而,這個空間的拓撲結構讓它無法找到合適的演算法從而找到解決方案的「容易捷徑」。相比之下,圍棋定義的可能性空間就小得多,而且這個空間也可以更容易地使用機器學習方法進行探索。


我們為了成功定義能將真實世界任務簡化為一個優化問題的目標函數,計算機科學家、運籌學研究者和統計學家在解決這樣的問題上已經花了十年的時間(或早或晚一點)。但是,許多問題在它們被表徵為機器可以操作的形式之前甚至還需要額外的分析。比如,我們怎麼以機器可以理解的語言寫下單個句子的含義?正如 Gerald Sussman 說的那樣:「你不能學習你無法表示出來的東西。」在這種情況下,選擇合適表徵的問題都還沒得到合適的定義,更不要說解決了。


因此,深度學習(和廣義上的機器學習)已被證明是一類強大的人工智慧方法,但目前的機器學習方法需要大量的人工參與才能將一個機器學習表示出來,還需要大量的技巧和時間重複迭代問題的表示,直到其被機器解決。最重要的是,這個過程被限定在很窄的範圍內,從而只給機器提供了很低程度的自主權;和人不一樣,人工智慧不會產生自主性。


機器學習遠不是一個將從魔瓶里衝出來橫行霸道的「妖怪」。相反,它只是理解智能和構建人類水平的人工智慧的數十年(或也許數個世紀)研究之路中的一步。


請您繼續閱讀更多來自 機器之心 的精彩文章:

人工智慧會將管理變成藝術與科學的複合體!
斑馬條紋怎麼形成的?60多年前的圖靈早已洞悉一切!
機器人大軍如何助力亞馬遜帝國攻城略地?
挑戰Minecraft任務,探索AI系統認知能力!
"發現引力波"背後最完整的內幕故事!
您可能感興趣

不讀書不識字的妖怪不是好妖怪
這三種女人不是妖怪,但不碰,更不能結婚!
人脈拼不過,能力也不是對手,悟空就是被這個妖怪活活氣哭的!
是人是鬼是妖怪,不過是,心有魔債!
階層固化這個怪圈,不僅高考解決不了,神仙和妖怪也走不出去!
月經不是妖怪,影響不了哺乳
悟空:是人是鬼是妖怪,是對是錯是好壞,六塵不改皆是魔債一念間
三层口红两层眼线?画不好是妖怪,画好了就是石原里美
日漫里的狐妖不是一般多,妖怪漫沒有狐狸都不好意思出來!
如來佛害怕的不是妖怪,而是妖怪後面的主人
西遊記中法力最強妖怪,不是大鵬鳥,而是它,主人更不為人知
她是唯一不把如來佛放在眼裡的妖怪,最後死得不明不白
妖怪們總吃不了唐僧並不是孫悟空保護有力,而是唐僧有兩件法寶?
有個不會拍照的男票多可怕?不小心就全變妖怪
難怪妖怪就算抓到唐僧也吃不了唐僧肉,真相竟然是這樣?
他是西遊中最勢利無恥的妖怪,難怪唐僧師徒死活都不幫他
這個妖怪沒有法寶,卻能夠打傷如來,觀音見了都害怕
孫悟空為什麼打不過取經路上的妖怪?不是法力變弱
西遊記唐僧師徒遇到最大磨難不是妖怪,是美人計!