專訪NovuMind周斌:AI晶元彎道超車,架構和算力沒有任何取巧之道
文 | 任然
來自雷鋒網(leiphone-sz)的報道
2018全球人工智慧與機器人峰會(CCF-GAIR)在深圳召開,峰會由中國計算機學會(CCF)主辦,雷鋒網、香港中文大學(深圳)承辦,得到了寶安區政府的大力指導,是國內人工智慧和機器人學術界、工業界及投資界三大領域的頂級交流盛會,旨在打造國內人工智慧領域最具實力的跨界交流合作平台。
7月1日下午的AI晶元專場大咖雲集,圓桌討論環節,深圳鯤雲信息科技有限公司創始人兼CEO牛昕宇、天數智芯創始人兼CEO李雲鵬、NovuMind中國區總裁周斌、AVSdsp CEO沈聯傑四位來自AI晶元領域的重磅嘉賓,在華登國際投資總監蘇東的主持下,就「中國芯的新機會:AI晶元如何實現彎道超車」這一話題展開交流。
圓桌討論結束後,雷鋒網就相關問題對NovuMind中國區總裁周斌進行採訪。
算力是一切演算法的基礎
在圓桌討論中周斌曾提到,大概3~5年後,在有限場景、受限場景的自動駕駛會成為比較現實的事情。
然而據雷鋒網(公眾號:雷鋒網)觀察,眼下有一些面向自動駕駛領域的AI晶元,其規格往往集中在功耗15~30瓦、算力30~40Tops這個區間內,號稱可實現L4級自動駕駛能力。並且在雷鋒網的觀察中,某些AI晶元公司在介紹其晶元性能時,只說每秒能處理多少幀畫面、每幅畫面包括多少對象,而對底層算力指標避而不談。
對於這種行為,周斌認為「就像某人只說自己能舉重100次一樣無聊,脫離杠鈴重量怎麼能看出實際能力?就算要宣傳圖片和對象的處理速度,也要講清畫面解析度、視角大小、識別距離、對象尺寸等相關參數,要麼就老老實實亮出實際的算力有多少。」他表示,40Tops只能勝任L2.X級輔助駕駛(ADAS)系統,想實現L3.X級自動駕駛都是不夠的。
從雷鋒網了解的信息來看,L4級自動駕駛要求平均每10萬英里才需要一次人工干預,目前世界上還沒有任何自動駕駛系統能達到這個指標,即便目前表現最好的谷歌Waymo也只做到了平均5000英里一次人工干預,而特斯拉Autopilot在官方定義中只是L2.X級。
周斌根據目前的情況推算,L3.X級自動駕駛大約需要80Tops的算力,而L4級自動駕駛的門檻至少有100~200Tops之高。在NVIDIA的路線圖中,甚至使用了一套包含兩顆GV100 GPU、算力320Tops、功耗高達500瓦的平台進行L4級自動駕駛的研發,高級別自動駕駛所需的算力指標之高可見一斑。
他表示,算力是支撐一切演算法的硬指標,沒有任何捷徑可走。即便演算法再怎麼神奇,40Tops算力下所能做的事也是有上限的,「用十分之一功耗實現十倍性能」完全是天方夜譚。
如何與CUDA同台
NVIDIA自2006年推出G80架構以來,一直在不遺餘力的推廣其CUDA通用計算平台。時至今日CUDA已經非常成熟,形成了強大的生態系統,這也為NVIDIA擴展其它基於GPU的事業提供了先天便利。事實上,在AI大潮來臨後,NVIDIA確實在AI演算法訓練上獲得了很大優勢。
NVIDIA的強大之處,身為中國唯一NVIDIA CUDA Fellow及NVIDIA DLI認證講師的周斌再清楚不過了。但他卻做起了反向思考:CUDA生態過去的強大,在面對AI運算的新任務時,是否能為其創造不可逾越的壁壘?
周斌認為答案是未必。在前不久的CCF-GAIR峰會上他曾講到,他親歷了深度學習的風口過程,在2008年利用CUDA做通用計算時就開始用一些不同的處理器架構來解決新的問題。那時他發現,新的深度學習架構對於新的數據模式、新的數據結構以及數據量,對GPU體系結構產生了非常大的挑戰。
AI晶元是處理AI任務的,任務在不斷的變化,其變化本質、數學模型是什麼,哪些是變的、哪些是不變的,這是任何做AI晶元的公司必須首先認可領悟和理解的。晶元中哪些可以固定下來。卷積層是否存在?深度網路的主流是什麼,是CNN還是RNN?下一代Sparking能否用起來?只需要關注深度學習最核心、最本質的地方,剩下的都可以不管。
周斌稱,NovuMind並沒有發明新的晶元模式,而是在GPU的基礎上去掉了所有和深度學習無關的單元。這樣的設計既可以讓晶元高效進行深度學習計算,又避免了直接將演算法固化成ASIC晶元應用範圍狹窄的問題。
脫離架構研發的「超車」都是幻想
全美達(Transmeta)Crusoe、Intel安騰(Itanium)、龍芯。
這些處理器的名字看起來毫不相干,之所以列出來,是因為它們之間有一個共同點:本身不是基於X86指令集,但可以通過Emulation技術兼容X86代碼。
近來,隨著「彎道超車」的聲浪越來越高,又有人開始鼓吹Emulation技術,認為這樣可以規避處理器架構方面的弱點,只需設計一個精簡且高效的計算內核,然後套上Emulation層不就計劃通了?
然而對於這種言論,周斌的看法非常簡單:「這一定是行不通的」。他表示,全美達Crusoe、Intel安騰和龍芯,在商業上都失敗了。這些使用了Emulation技術實現X86兼容的處理器,執行X86代碼時的效率都是極其低效的。
以Intel安騰處理器為例,其內核結構為VLIW超長指令字體系,在使用Intel御用Emulation層的情況下,運行X86代碼的效率也不過50%。即便是目前基於驍龍835/845平台的Win10 PC,也依然沒能改變效率低下的老問題。
「晶元是個非常講究經驗積累和傳承的領域,架構設計不是一天兩天的問題。在大型應用領域,必須要在架構設計上下功夫。」周斌對雷鋒網說到,「現在鼓吹Emulation技術的人,都是想在架構研發上偷懶的人,想靠這個實現『超車』純屬幻想。」
回歸價值投資的本質
很多人都聽過「當風很強的時候,連火雞都能飛起來」這句洗腦名言,而在AI這個風口下,也的確有一些公司或團體,僅憑一句AI、一個口號就能拿到大筆融資。
作為旁觀者,我們不免擔心,在浮躁的資本市場中,這些濫竽充數者分流掉的資源會對那些務實的團隊造成怎樣的影響?
在周斌看來,投資是一個優化資源配置的過程,雖然在風口到來時,市場上不可避免的出現了許多投資泡沫,但所有項目都必須在市場上證明其價值,才能獲得成功。一些跟風的投資人,資金投到垃圾項目上,他們損失的將是真金白銀。
他認為,投融資應該是一個雙向選擇的過程,不管是市場成長期還是洗牌期,都是真正的大浪淘沙,把真正有價值、有核心技術、有成長性、有未來的公司選出來,資源會向這樣的公司聚集。「炒快錢的創業公司和投資人一定會被市場淘汰,只有真正能夠發覺價值並與公司互相認可的投資人,才能為公司帶來生命力。」
現在隨便弄幾個人說句AI、喊個口號就能拿到投資的事不存在了,在團隊和市場層面上,有紮實內容、能賺錢的公司反而成為市場的香餑餑,這個洗牌期會逼著洗牌人看清楚這家公司是否有價值。投資人們開始認認真真的看技術,他們關注處理器內核、做IP競調、做專利競調,這個趨勢非常喜人,投資將回歸到價值投資的本質,通過資本市場的力量促成技術到市場的轉化,從而共享收益。
- END -
關注雷鋒網(leiphone-sz)回復2加讀者群交個朋友
※區塊鏈「脫虛向實」之後,數據上「鏈」的喜與憂
※全球計算機科學家排名更新,在 CCF-GAIR 可以見到 top10 中國學者中的 6 位
TAG:雷鋒網 |