DeepMind巨額虧損的背後，今天的AI是否選對了方向？

知識 08-17

機器之心報道

參與：張倩、杜偉

前段時間，英國公司登記處的一份文件披露了 DeepMind 2018 年的財務狀況：這家 AI 科技公司的凈虧損由 2017 年的 3.41 億美元增加至 2018 年的 5.72 億美元，今年到期的債務高達 12.656 億美元。如此巨額的虧損引起了廣泛關注，也引發了人們對於 AI 前景的質疑。近日，紐約大學心理學和神經科學教授 Gary Marcus 就在《連線》上撰文表達了對於 DeepMind 虧損狀況、深度強化學習現狀以及 AI 未來走向的深度思考。

DeepMind 可能是全世界最大的專註於科研的 AI 公司，但它正在遭受巨額虧損，過去三年的虧損超過 10 億美元，而且未來 12 個月還有超過 10 億美元的債務需要償還。

這是否意味著 AI 正在分崩離析呢？

事實並非如此。做研究需要花錢，DeepMind 每年都在做更多的研究。這家公司的確花了很多錢，而且可能比以往任何 AI 研究公司都要多。但與科學界那些大型項目相比，DeepMind 花的錢還遠遠算不上史無前例。例如，大型強子對撞機每年可能要花費 10 億美元，而發現希格斯玻色子的花費估計超過了 100 億美元。當然，實現電影里那種真正的機器智能（即 AGI）要花費的還遠不止這些。

儘管如此，DeepMind 的巨額虧損（從 2016 的 1.54 億美元到 2017 年的 3.41 億美元再到 2018 年的 5.72 億美元）還是值得我們反思。在我看來，這其中有三個核心問題：

DeepMind 是否選對了方向？

從谷歌母公司 Alphabet 的角度來看，這種規模的投資是否合理？

這種虧損會對 AI 的整體發展產生什麼影響？

對於第一個問題，我們有理由持懷疑態度。DeepMind 將大部分人力和財力投入到了深度強化學習的技術研究中。該技術結合了深度學習和強化學習，前者主要用於模式識別，後者則是以獎勵信號（如遊戲中的得分或勝負）為基礎的學習。

深度強化學習技術是 DeepMind 在 2013 年提出的，他們在一篇名為《Playing Atari with Deep Reinforcement Learning》的論文中展示了單個神經網路系統如何玩轉各種雅達利遊戲，如打磚塊（Breakout）、太空侵略者（Space Invaders）等，而且證明神經網路的表現優於人類。

這篇論文稱得上一篇工程傑作，可能也是 2014 年穀歌收購 DeepMind 的關鍵催化劑。這項技術的持續發展推動了 DeepMind 在圍棋和《星際爭霸》遊戲對抗中取得成功。

但問題是，這項技術的適用範圍非常狹窄。以打磚塊遊戲為例，輕微的改變（如將拍子往上移動幾個像素）就會導致網路性能大幅下降。DeepMind 的《星際爭霸》AI 也非常受限，只有在單一地圖上選擇某種角色才會達到超越人類的水平，但隨著地圖和角色數目的增加，該 AI 的性能也大幅降低。要轉換角色，你需要從頭訓練整個系統。

從某些方面來說，深度強化學習是一種渦輪增壓式的記憶方式：使用該技術的系統能夠完成令人驚嘆的壯舉，但它們對自己在做什麼知之甚少。因此，現有的系統缺乏靈活性，也就無法在現實世界發生變化時做出補充（DeepMind提前 48 小時預測急性腎損傷的 AI 系統也受到了這種質疑）。

深度強化學習還需要大量數據，如 AlphaGo 的訓練需要完成數百萬次自我博弈，這一訓練量遠遠大於人類成長為世界級棋手所需的訓練量。這就需要谷歌級別的算力，也就意味著在現實世界中，多數用戶僅僅因為算力開銷就會望而卻步。據估算，AlphaGo 的訓練花費了 3500 萬美元，這相當於 12760 個人腦三天三夜不眠不休所消耗的能量。

但這還只是經濟方面的考量。正如我和 Ernest Davis 在即將出版的新書《Rebooting AI》中所談到的，真正的問題在於可靠性。迄今為止，深度強化學習還只能在控制良好、很少出現意外的環境中進行。圍棋就是一個完美的環境，其規則和棋盤兩千年來都未發生變化，但在現實世界的許多場景中，你不會想要依賴這項技術。

商業變現能力有限

出現上述問題的部分原因在於，只有極少數的現實世界問題像 DeepMind 所研究的遊戲那樣受到各種限制，DeepMind 還未發現深度強化學習的任何大規模商業應用場景。Alphabet 對 DeepMind 的投資已經達到了 20 億美元左右（包括 2014 年收購時所花費的 6.5 億美元）。相比之下，DeepMind 創造的直接經濟回報卻少得可憐，2018 年只有 1.25 億美元，其中包含利用強化學習幫助谷歌降低伺服器冷卻開銷所縮減的費用。

DeepMind 用來解決圍棋問題的那一套技術可能無法用來解決現實世界中需要用 AI 來解決的問題，如癌症治療和清潔能源。對此，IBM 已經在 Watson 項目中經歷了慘痛的教訓。Watson 在某些情況下表現良好，但在其他情況下並不好用，出現了心臟病漏診等問題，而一年級的醫學生都不會犯這種錯誤。

當然，這也許只是時間問題。DeepMind 至少從 2013 年就開始了深度強化學習的研究，也許他們需要更長時間，很少有科學進展能夠在一夜之間實現商業化。DeepMind 或其他公司可能會通過結合其他技術開發出更深層次、更穩定的深度強化學習系統，也可能不會。

深度強化學習最終可能會成為另一個「晶體管」，走出實驗室並最終改變世界，也可能只是一種學術好奇心，John Maynard Smith 曾經將這種好奇心描述為「尋找問題的解決方案」（solution in search of problem）。我個人猜測，深度強化學習會介於兩者之間，它會成為一種有用並被廣泛採用的工具，但不會改變世界。

沒有人可以將 DeepMind 排除在外，儘管其現有的戰略不像許多人期望的那樣豐富。深度強化學習可能並非是通向通用人工智慧的坦途，但 DeepMind 自身是一個令人敬畏的公司，它組織嚴密、資金充足，擁有數百名博士。在圍棋、《星際爭霸》上取得的成功令其獲得了更多的曝光，越來越多的人才加入其中。如果 AI 的風向發生變化，DeepMind 很可能會轉向另一個方向。顯然，DeepMind 是無可匹敵的。

對於期望過高的擔憂

最後一個問題是關於 DeepMind 的財務狀況會對 AI 總體發展產生怎樣的影響，這個問題很難回答。如果炒作大於產出，就容易帶來另一個「AI 寒冬」，到時即便是支持者也不會願意投資。投資界也會注意到這種巨額損失；如果 DeepMind 的損失每年翻一番，即使是 Alphabet 也會被逼退。這不只是錢的問題。目前為止還看不到切實的財務成果。在某個時候，投資者可能不得不重新調整他們對於 AI 的熱情。

迄今為止，通用人工智慧還停留在炒作的層面，實現起來還很困難。儘管我們已經在廣告、語音識別等幾個有限的領域取得了重大進展，但 AI 無疑還有很長的路要走。對大數據集進行合理分析所帶來的好處是不可否認的，即使只是以有限的形式，AI 已經成為一種有力的工具。業界對 AI 的熱情可能沒那麼高了，但他們也不會徹底退出。

我想給出以下預測：

十年後，我們將得出結論：深度強化學習在 2010 年代後期被高估了，其他許多重要領域則受到了忽視。我們在強化學習上每投入一美元，在其他領域就少投入一美元，比如可能產生有價值洞見的人類認知科學。

機器學習領域的研究者現在經常會問，「兒童學習語言、理解世界所需的能量和數據比現有的 AI 系統要少得多，他們是如何做到的？」如果花更多時間、金錢和精力去解決後面這個問題，我們也許能早點實現通用人工智慧。

https://www.wired.com/story/deepminds-losses-future-artificial-intelligence/

本文為機器之心報道，轉載請聯繫本公眾號獲得授權。

------------------------------------------------

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 機器之心 的精彩文章:

※1900頁數學基礎：面向CS的線性代數、拓撲、微積分和最優化
※「一鍵脫衣」之後，弗吉尼亞州將deepfake濫用列入非法範疇

TAG:機器之心 |