當前位置:
首頁 > 新聞 > 提問黃仁勛:5年內GPU定會贏過TPU,中國計算機產業已居世界一流

提問黃仁勛:5年內GPU定會贏過TPU,中國計算機產業已居世界一流

不少人評論稱,黃教主又有了新的信仰——開源。

新智元報道

【新智元導讀】英偉達創始人黃仁勛在9月26日GTC北京的主旨演講中,隆重介紹了NVIDIA Tensor RT 3。今天英偉達的官方博客則著重介紹了NVIDIA深度學習加速器(NVDLA)這一免費開源架構。在會後新智元對黃仁勛的專訪中,黃仁勛談到了谷歌TPU與Tensor RT 3 的區別,並表示中國整個計算機產業的技術水平已經是世界一流。

GPU 不光能做 Tensor 的處理,還能做很多其他任務

2017年5月GTC 美國的大會上,黃仁勛宣布,將開源 Xavier DLA 供所有開發者使用、修改。初期版本將在 7 月開放,完整版本將於 9 月公開。9月26日GTC 北京,黃仁勛只提到了Xavier但是沒有提到DLA,但是27日,英偉達官方博客就介紹了DLA,並且將代碼都公布到了Github上。

NVIDIA深度學習加速器(NVDLA)是一個免費開源架構,可以促進深度學習加速器設計方法的標準化。通過其模塊化架構,NVDLA具備可拓展性、高度可配置性,可簡化集成和便攜度。其硬體可支持各種loT設備。作為英偉達Open NVDLA許可證下的開源項目,所有的軟體、硬體、文檔都可在GitHub上找到。

詳細介紹地址:http://nvdla.org/primer.html

開源地址:https://github.com/nvdla

不少人評論稱,黃教主又有了新的信仰——開源。

9月26日GTC 北京首場演講,黃仁勛賺足了票房,被大家稱為英偉達最稱職的推銷員。

黃仁勛在主旨演講中隆重介紹了NVIDIA Tensor RT 3——這是一款可編程的AI 推理加速器。支持所有的框架,比如Caffe,Pytorch和TensorFlow。

在會後的專訪環節,接受媒體專訪的黃仁勛比上午演講時更為放鬆和自然。他首先問了大家一個問題:「在國內大家是不是都叫我老黃」?

「破冰」問題之後,黃仁勛開始與眾多媒體同仁暢聊起來。不可避免地,他被要求對CPU進行評價。「狡猾」的「老黃」解釋說,其實GPU不會替代CPU,只是加速器,但在專門問題上性能超過CPU十倍甚至百倍。他也認為,最完美的架構是CPU+GPU。在現場他也承諾,英偉達不會做通用處理器,但是會在某些專門領域,將GPU性能做到極致。

在回答記者提問的大部分時間中,黃仁勛都保持上圖的坐姿,期間會偶爾坐進沙發中。新智元提問:谷歌的TPU與英偉達的Tensor RT 3 有何區別?聽到這一問題後,也許是為了顯示出更強大的氣場,黃仁勛從沙發中重新坐到了旁邊的扶手上。

黃仁勛嚴肅地說:「首先現在世界上只有一款TPU,就是谷歌的,它只能做TensorFlow,Tensor的處理。而我們的GPU不光能做Tensor的處理,我們還能做很多其他的任務。所以比如說視頻的編解碼,還有一些圖像的處理等等,我們都可以做。」

他說:「我給你舉一個例子吧,比如說今天上午我演示的在《權利的遊戲》這個電視連續劇裡頭我們的GPU就可以做視頻的解碼,並且進行推理,推理之後做搜索。所以我們GPU能做的事情遠遠多過TPU。正是因為我們有TensorRT3,我們GPU的架構又是完全靈活的可編程的,所以我們可以支持世界上任何一種人工智慧框架,比如說亞馬遜的,或者百度的Paddle Paddle,還有Facebook用的touch,以及微軟用的CNTK。如果讓我做一個長遠的預測的話,我們認為,事實上,能夠針對深度學習進行優化的GPU是能夠獲得最大成功的。」

為什麼是GPU會獲得最大的成功?黃仁勛解釋說:「這是因為,它是非常靈活的,因為它的靈活,所以它的市場機會就會多,因為市場機會多,所以研發的預算也多,整個生態系統也就有錢了。 所以再舉一個例子,大家還記得以前我們用的傻瓜型的手機嗎?現在的智能手機相比誰更成功呢?其實從它們的功能角度你就可以看到,這也就是TPU和GPU的比較。智能手機的價值非常高,有了智能手機,事實上它不光有電話的功能,它還有照相機的功能,甚至對某些人來說還可以像電腦一樣使用,可以當做錄音筆等等。但是如果是通用型的話,這就更難了。因為你要看一下它電池的續航的壽命,它的尺寸的問題,不能做的太大,價格又不能定的太高,通話質量要一定好。但是如果以上的問題都能解決的話,通用型的手機肯定是更好的。」

隨後,在回答新智元的第二個問題:「怎樣看未來5到10年在人工智慧時代,華人和華人企業所扮演的角色」時,黃仁勛說:「中國的計算機科學的技術水平,是全球一流的。我認為在中國,騰訊它不光是一家優秀的中國的互聯網公司,它也是世界一流的公司。像阿里巴巴也是如此。百度我們也不認為它只是中國的一家搜索的公司,它是世界一流的公司。前面提到的李飛飛也是我的好朋友,在我的眼裡,我絕對不把她局限為一個優秀的華人AI科學家,我認為她是世界頂級的人工智慧的科學家。還有像陸奇。所以,其實中國的計算機整個產業的技術水平,已經是世界一流了,所以已經不是局限於某一個國別的範圍了。

詳解 NVDLA 五大特點

詳細說來,這一開源架構有以下五個特點:

開源:在Github上進行開發,鼓勵開發者參與。

完整的解決方案:擁有全套的 Verilog 和 C-model, Linux 驅動, test 基準 和 test 工具, kernel- 和 user-mode 軟體 以及軟體開發工具包。 便於其他操作系統採納。

可擴展: 非常適合擴展到大範圍的IoT設備上。

標準的硬體架構:基於Xavier,也就是英偉達為自動化產品和其他更多業務設計的世界上第一個自動處理器。

深度學習理解力:智能、高效,準備好與大量英偉達支撐的解決方案共同工作。

深度學習推理的大部分計算工作是基於數學運算的,其中大部分可以分為四個部分:卷積,激活,池化,和歸一化。這些操作具有一些特點,使它們特別適合於專用硬體實現:它們的存儲器訪問模式是高度可預測的,並且它們很容易並行化。

NVIDIA深度學習加速器(NVDLA)項目推動了一種標準化的開放架構,以解決推理的計算需求。 NVDLA架構既可擴展又高度可配置,模塊化的設計保持了靈活性並簡化集成。標準化的深度學習能加速推動大多數深度學習網路的互操作性,有助於規模化地推動機器學習的統一增長。

NVDLA硬體提供了一個簡單,靈活,強大的推理加速解決方案。它支持各種水平的性能表現,並可輕鬆擴展應用範圍,從較小的,成本敏感的物聯網(IoT)設備到更大的、性能導向的IoT設備。 NVDLA將作為基於開放行業標準的一組IP核模型提供:Verilog 模型是RTL形式的綜合和模擬模型,TLM SystemC 模擬模型可用於軟體開發,系統集成和測試。 NVDLA軟體生態系統包括一個設備內軟體堆棧(部分開放源代碼版本),一個完整的訓練基礎架構,用於構建包含深度學習的新模型,以及將現有模型轉換為可由設備使用的形式的解析器軟體。

硬體架構

NVDLA架構可以在兩種工作模式下進行編程:獨立模式和融合模式。

1. 獨立。當獨立運行時,每個功能塊都配置為執行的時間和任務,每個塊都在其分配的任務上工作(類似於深度學習框架中的獨立層)。獨立操作開始和結束,分配的塊執行存儲器到存儲器操作,進出主系統存儲器或專用SRAM存儲器。

2. 融合。融合操作類似於獨立操作,但是一些塊可以組裝成管道。通過繞過存儲器的往返來改善性能,而不是通過小型FIFO來相互通信(即,卷積核心可以將數據傳遞到單個數據點處理器,該數據點處理器可以將數據傳遞給平面數據處理器,反過來交叉通道數據處理器)。

【號外】新智元正在進行新一輪招聘,飛往智能宇宙的最美飛船,還有N個座位

點擊閱讀原文可查看職位詳情,期待你的加入~


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

黃仁勛北京演講:GPU帝國啟幕,發布可編程AI 推理加速器TensorRT 3
英特爾研發神經元晶元,模擬人腦自學習能效提升1000倍
「黃仁勛北京演講」GPU帝國啟幕,發布可編程AI 推理加速器TensorRT 3(PPT實錄)
自然語言處理終極方向:深度學慣用於自然語言處理的5大優勢
「遷移學習」6張圖像vs13000張圖像,超越2013 Kaggle貓狗識別競賽領先水平

TAG:新智元 |