從識別貓到廚房機器人:探究英偉達的人工智慧之路
英偉達位於加州聖克拉拉的總部。
英偉達位於西雅圖的1200平米人工智慧機器人研究實驗室里,一小群研究人員正在努力開發人工智慧,驅動公司的未來。廚房工作台旁的一隻機械手臂正舉起一罐食品把它放進抽屜里。
除此之外,它還學會了如何清潔餐桌,如果你請求恰當,它甚至可以幫你做飯,而這些都是英偉達雄心勃勃的人工智慧總體規劃的第一步。
進軍人工智慧領域
英偉達的人工智慧機器人實驗室於今年年初成立,目前擁有28名員工,共可容納50名研究科學家、教師顧問和實習生。著名機器人專家、英偉達機器人研究高級主管、華盛頓大學教授迪特爾·福克斯(Dieter Fox)領導的實驗室旨在開發能夠與人類安全合作的下一代機器人,並有望改變製造、物流和醫療保健等行業。機器人領域也是人工智慧面臨的眾多重大挑戰之一。在那些暢想未來的科幻小說中,機器人不僅擅長完成非常具體的任務,而且能夠表現得像人類一樣。
但實驗室的這種機器人所展現的也是一種複雜的屈伸運動。這是一個引人注目的演示,有效展示出英偉達的硬體和軟體當前能夠完成哪些功能以及未來能做什麼。從另一方面說,這也是該公司期望在人工智慧技術競爭日趨激烈情況下領先一步的最新決策。
自2005年起,英偉達開始優化用於人工智慧的GPU,這是科技硬體歷史上最明智的商業決策之一。但現在面對日益激烈的市場競爭,鞏固這一領先地位將是英偉達25年來面對的最艱難考驗之一。
英偉達的最新實驗室配備了機器人有可能在現實世界中遇到的各種設備和現實環境。第一個場景是一個簡單的廚房,機器人廚房助手結合人工智慧和深度學習技術檢測和跟蹤物體,了解門和抽屜的相對位置,還能夠打開和關閉它們從而取放物體。福克斯說:「過去機器人技術研究的重點是小型獨立項目,而不是完全集成化的系統。」「我們現在正組建一個由機器人控制和感知、計算機視覺、人機交互和深度學習等領域專家組成的跨學科合作團隊。」
西雅圖的研究小組得到了來自英偉達在聖克拉拉、馬薩諸塞州西部、多倫多和特拉維夫所設其他研究中心的大約60名研究人員的協助。這種多學科的研究方式有一個極其困難的目標:英偉達試圖展示其人工智慧硬體和軟體可以將機器人從現在這種可以按照嚴格指令操作的精確定位機器轉變為動態和靈活的機器,能夠安全地與人類一起工作。
谷歌駐柏林的人工智慧研究員薩米姆·瓦格納(Samim Wagner)認為,英偉達之所以要自行開展研究,主要原因之一是打造更好的人工智慧硬體,然後再賣給其他人。他表示:「為了給機器學習開發可行且具有競爭力的硬體,英偉達在戰略上被迫進行高質量的機器學習研究。該公司與遊戲和娛樂行業的一貫聯繫,為其機器學習研究提供了一個焦點,這也是成功的關鍵。」這也從一方面解釋了為什麼在英偉達的研究實驗室里會有這麼多奇怪的實驗。
英偉達首席科學家兼高級研究副總裁比爾·戴利(Bill Dally)在談到廚房機器人助手時表示:「現在我們正在進行深入研究,讓機器人與環境進行互動成為可能。」「既然我們可以打造感知系統,就可以打造定位靈活的機器人。」
與英偉達的機器人實驗一樣,深度學習讓人工智慧系統能夠解決以前不可能解決的問題。通過反覆試錯,其已經在數字助手、計算機視覺、語言翻譯、聊天機器人、人臉識別等領域取得了突破性進展。而且,就像人工智慧領域的許多突破一樣,這些突破在很大程度上依賴於英偉達的GPU。
關於如何識別貓的賭
英偉達的人工智慧研究始於2010年加州帕洛阿爾托的Joanie "s Café餐廳。戴利說:「我們是在和人工智慧專家吳恩達開完早餐會後進入人工智慧領域的。」在那次早餐會上,吳恩達解釋了谷歌是如何在16000個CPU幫助下,訓練人工智慧系統去識別貓的照片。當時吳恩達正在谷歌合作打造人工智慧項目Google Brain。由於意識到幾乎沒有人有16000個CPU可供使用之後,戴利提出了一個挑戰。「我打賭我們可以用更少的GPU做到這一點,」他對吳恩達說。
會面後不久,戴利請英偉達的研究人員布萊恩·卡坦扎羅(Bryan Catanzaro)與吳恩達合作研究。戴利說:「我們用48個GPU實現的功能和他們用16000個CPU達到的效果差不多。」「當時我非常清楚,這將改變一切。」
英偉達的人工智慧業務在一場關於識別貓的賭注中出現爆炸式增長。該公司沒有透露其在人工智慧領域投入了多少,但相關文件顯示英偉達上一財年在研發上一共開支了18億美元,而其中的關鍵領域是遊戲、人工智慧和汽車。其開發的GPU在人工智慧項目上的有效性在競爭對手中引發了一場混戰,英特爾、谷歌甚至Facebook都投入了巨額資金試圖迎頭趕上。
2018年7月,谷歌宣布正在開發用於設備機器學習的人工智慧晶元。谷歌押注一種新型晶元,這是專為神經網路機器學習設計的張量處理單元。在軟體領域,另一場同樣重要的競爭也正在展開。英偉達的代碼庫還面臨著與谷歌Tensorflow或Facebook的PyTorch等競爭對手框架的競爭。儘管困難重重,英偉達仍保持著自己的領先地位。
正如識別貓的挑戰所展現的,GPU在處理人工智慧任務方面非常出色。主要是因為在運行與人工智慧相關的並行計算問題時,GPU比CPU更好,因為人工智慧中的許多計算是同時進行的。並行計算在神經網路中尤其流行,其工作方式與動物大腦類似,可以像動物大腦一樣同時或並行執行許多任務。最終,英偉達希望自己能夠成為在每一部手機、每一台電腦、每一個機器人和每一輛自動駕駛汽車中都植入人工大腦的公司。
2005年,在首席執行官黃仁勛的領導下,該公司搶佔了人工智慧熱潮的先機。當時該公司開發了一款軟體,使其GPU能夠處理現代人工智慧最終需要的數百萬個微計算。英偉達的GPU現在分布在世界各地的數據中心,為數以千計的企業提供人工智慧服務。2014年至2018年間,該公司數據中心優化晶元的營收增長了524%,有效提振了該公司的業績。
「我們是全世界的供應商,」戴利說。「每個人都通過英偉達的GPU訓練他們的深度神經網路。」他補充說該公司的T4晶元被廣泛用於推理任務。Facebook和谷歌使用英偉達平台為其平台上的人工智慧功能提供支持。幾乎所有的自動駕駛汽車公司都在使用英偉達的技術。英偉達還與騰訊、阿里巴巴和百度簽署了合作協議。
與廚房中的機器人一樣,英偉達的其他人工智慧實驗也顯得兼收並蓄。它開發了一個創造性的生成對抗網路,非常擅長創造超逼真的人臉圖像。在2018年12月發表的一篇論文中,該公司展示了最新生成的人臉圖像與四年前相比有多麼逼真。
逼真面容並不是英偉達的生成對抗網路能夠創造的唯一東西。英偉達還開發了一個轉換網路,可以將冬天拍攝的照片轉換成美麗的夏日景色。你有婚禮當天遇到下雨的照片嗎?英偉達的人工智慧可以讓它變成晴天。去年年底,英偉達還展示了全球首款使用人工智慧生成圖形的視頻遊戲演示。這個演示是一個駕駛模擬器,它是通過將人工智慧生成的視覺效果與標準視頻遊戲引擎相結合而構建的。
前進道路上的坎坷
英偉達暗示未來的道路會更加艱難。今年年初,Nvidia被迫將其第四季度營收預期調減了5億美元,此舉導致其股價暴跌近18%。2018年數字貨幣市場的一路下行也不斷挑戰著英偉達能夠承受打擊的底線。
就目前而言,英偉達GPU的適應性使其相對於競爭對手具有更多優勢:它們是數據中心、自動駕駛汽車、研究實驗室、數字貨幣挖掘平台不可或缺的組成部分。只要你能想到的設備都會有一個GPU。但這種情況可能很快就會改變,這正會是英偉達的人工智慧機器人實驗室發揮作用的地方。
「現在有很多新的人工智慧硬體初創公司,」人工智慧研究顧問斯蒂芬·梅里蒂(Stephen Merity)說。「他們對於英偉達來說很可能是一個威脅,但這是一個巨大的開放性問題,我無法想像這些初創公司能在早期實現大規模發展。」
其中之一就是英國的創業公司Graphcore,其在寶馬、紅杉資本以及谷歌DeepMind創始人的資助下,現在公司估值超過10億美元。Graphcore稱,其智能處理單元尚未投入大規模生產,處理速度比現有系統快100倍。對於英偉達來說,這可能會帶來比數字貨幣市場崩潰更令人頭疼的財務問題。
「我不知道人工智慧硬體生態系統的最終狀態是什麼樣子,」梅里蒂表示,「如果終極狀態是雙方擁有相同的硬體,那麼英偉達就有優勢。如果它分成『用於訓練人工智慧的硬體』和『在現實世界中使用的硬體』,那麼Graphcore和其他類似初創公司可能會做得很好。」
※李想澄清當年「被趕出汽車之家」:這個污點我不背
※全球40歲以下白手起家富豪榜出爐:黃錚僅次於扎克伯格
TAG:鉛筆道 |