專訪NovuMind周斌：AI晶元彎道超車，架構和算力沒有任何取巧之道

最新 07-24

文 | 任然

來自雷鋒網（leiphone-sz）的報道

2018全球人工智慧與機器人峰會（CCF-GAIR）在深圳召開，峰會由中國計算機學會（CCF）主辦，雷鋒網、香港中文大學（深圳）承辦，得到了寶安區政府的大力指導，是國內人工智慧和機器人學術界、工業界及投資界三大領域的頂級交流盛會，旨在打造國內人工智慧領域最具實力的跨界交流合作平台。

7月1日下午的AI晶元專場大咖雲集，圓桌討論環節，深圳鯤雲信息科技有限公司創始人兼CEO牛昕宇、天數智芯創始人兼CEO李雲鵬、NovuMind中國區總裁周斌、AVSdsp CEO沈聯傑四位來自AI晶元領域的重磅嘉賓，在華登國際投資總監蘇東的主持下，就「中國芯的新機會：AI晶元如何實現彎道超車」這一話題展開交流。

圓桌討論結束後，雷鋒網就相關問題對NovuMind中國區總裁周斌進行採訪。

然而據雷鋒網(公眾號：雷鋒網)觀察，眼下有一些面向自動駕駛領域的AI晶元，其規格往往集中在功耗15~30瓦、算力30~40Tops這個區間內，號稱可實現L4級自動駕駛能力。並且在雷鋒網的觀察中，某些AI晶元公司在介紹其晶元性能時，只說每秒能處理多少幀畫面、每幅畫面包括多少對象，而對底層算力指標避而不談。

對於這種行為，周斌認為「就像某人只說自己能舉重100次一樣無聊，脫離杠鈴重量怎麼能看出實際能力？就算要宣傳圖片和對象的處理速度，也要講清畫面解析度、視角大小、識別距離、對象尺寸等相關參數，要麼就老老實實亮出實際的算力有多少。」他表示，40Tops只能勝任L2.X級輔助駕駛（ADAS）系統，想實現L3.X級自動駕駛都是不夠的。

從雷鋒網了解的信息來看，L4級自動駕駛要求平均每10萬英里才需要一次人工干預，目前世界上還沒有任何自動駕駛系統能達到這個指標，即便目前表現最好的谷歌Waymo也只做到了平均5000英里一次人工干預，而特斯拉Autopilot在官方定義中只是L2.X級。

周斌根據目前的情況推算，L3.X級自動駕駛大約需要80Tops的算力，而L4級自動駕駛的門檻至少有100~200Tops之高。在NVIDIA的路線圖中，甚至使用了一套包含兩顆GV100 GPU、算力320Tops、功耗高達500瓦的平台進行L4級自動駕駛的研發，高級別自動駕駛所需的算力指標之高可見一斑。

他表示，算力是支撐一切演算法的硬指標，沒有任何捷徑可走。即便演算法再怎麼神奇，40Tops算力下所能做的事也是有上限的，「用十分之一功耗實現十倍性能」完全是天方夜譚。

NVIDIA的強大之處，身為中國唯一NVIDIA CUDA Fellow及NVIDIA DLI認證講師的周斌再清楚不過了。但他卻做起了反向思考：CUDA生態過去的強大，在面對AI運算的新任務時，是否能為其創造不可逾越的壁壘？

周斌認為答案是未必。在前不久的CCF-GAIR峰會上他曾講到，他親歷了深度學習的風口過程，在2008年利用CUDA做通用計算時就開始用一些不同的處理器架構來解決新的問題。那時他發現，新的深度學習架構對於新的數據模式、新的數據結構以及數據量，對GPU體系結構產生了非常大的挑戰。

AI晶元是處理AI任務的，任務在不斷的變化，其變化本質、數學模型是什麼，哪些是變的、哪些是不變的，這是任何做AI晶元的公司必須首先認可領悟和理解的。晶元中哪些可以固定下來。卷積層是否存在？深度網路的主流是什麼，是CNN還是RNN？下一代Sparking能否用起來？只需要關注深度學習最核心、最本質的地方，剩下的都可以不管。

周斌稱，NovuMind並沒有發明新的晶元模式，而是在GPU的基礎上去掉了所有和深度學習無關的單元。這樣的設計既可以讓晶元高效進行深度學習計算，又避免了直接將演算法固化成ASIC晶元應用範圍狹窄的問題。

這些處理器的名字看起來毫不相干，之所以列出來，是因為它們之間有一個共同點：本身不是基於X86指令集，但可以通過Emulation技術兼容X86代碼。

近來，隨著「彎道超車」的聲浪越來越高，又有人開始鼓吹Emulation技術，認為這樣可以規避處理器架構方面的弱點，只需設計一個精簡且高效的計算內核，然後套上Emulation層不就計劃通了？

然而對於這種言論，周斌的看法非常簡單：「這一定是行不通的」。他表示，全美達Crusoe、Intel安騰和龍芯，在商業上都失敗了。這些使用了Emulation技術實現X86兼容的處理器，執行X86代碼時的效率都是極其低效的。

以Intel安騰處理器為例，其內核結構為VLIW超長指令字體系，在使用Intel御用Emulation層的情況下，運行X86代碼的效率也不過50%。即便是目前基於驍龍835/845平台的Win10 PC，也依然沒能改變效率低下的老問題。

「晶元是個非常講究經驗積累和傳承的領域，架構設計不是一天兩天的問題。在大型應用領域，必須要在架構設計上下功夫。」周斌對雷鋒網說到，「現在鼓吹Emulation技術的人，都是想在架構研發上偷懶的人，想靠這個實現『超車』純屬幻想。」

作為旁觀者，我們不免擔心，在浮躁的資本市場中，這些濫竽充數者分流掉的資源會對那些務實的團隊造成怎樣的影響？

在周斌看來，投資是一個優化資源配置的過程，雖然在風口到來時，市場上不可避免的出現了許多投資泡沫，但所有項目都必須在市場上證明其價值，才能獲得成功。一些跟風的投資人，資金投到垃圾項目上，他們損失的將是真金白銀。

他認為，投融資應該是一個雙向選擇的過程，不管是市場成長期還是洗牌期，都是真正的大浪淘沙，把真正有價值、有核心技術、有成長性、有未來的公司選出來，資源會向這樣的公司聚集。「炒快錢的創業公司和投資人一定會被市場淘汰，只有真正能夠發覺價值並與公司互相認可的投資人，才能為公司帶來生命力。」

現在隨便弄幾個人說句AI、喊個口號就能拿到投資的事不存在了，在團隊和市場層面上，有紮實內容、能賺錢的公司反而成為市場的香餑餑，這個洗牌期會逼著洗牌人看清楚這家公司是否有價值。投資人們開始認認真真的看技術，他們關注處理器內核、做IP競調、做專利競調，這個趨勢非常喜人，投資將回歸到價值投資的本質，通過資本市場的力量促成技術到市場的轉化，從而共享收益。

- END -

關注雷鋒網（leiphone-sz）回復2加讀者群交個朋友

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！