當前位置:
首頁 > 科技 > PPT下載後摩爾時代,半導體的新戰場與新機會

PPT下載後摩爾時代,半導體的新戰場與新機會

7月19日,智東西公開課推出的AI晶元系列課完結第五講,華登國際合伙人王林就主題《人工智慧帶來半導體的又一波創新浪潮》進行了一場系統且深入的講解。在此番講解中,王林認為,「隨著技術推動力——摩爾定律,受到越來越大的挑戰,而應用的最大推動力——智能手機,也遇到了非常大的增長瓶頸」,全球半導體行業已經進入後摩爾時代與後智能手機時代。他判斷,在後摩爾+後智能手機時代,神經網路/深度學習已經成為半導體的新戰場。

在行業應用層面,深度學習在快速變革傳統行業並帶來非常多新的應用,比如無人駕駛、醫療影像分析、工業自動化,FinTech。尤其是汽車,已經變成非常巨大的半導體應用平台。「全球所有頂尖的半導體公司都在圍繞汽車來做未來的產品規劃,希望其能夠成為智能手機之後,對全球半導體行業有巨大推動力的推手。」而在處理器或架構層面,圍繞深度學習訓練與推理二個維度的加速需求,尤其是雲端訓練與推理、以及終端推理,出現非常多的晶元層面實現加速的創新方法或技術。結合有代表性的AI加速晶元產品或案例,就其中存在的創業機會與投資機會,他進行了深入的介紹和分析。

全文共計7980字,預計閱讀需要10分鐘。以下是此次講解的提綱:

1、集成電路發展歷史回顧;

2、後摩爾/後智能手機時代集成電路發展瓶頸;

3、深度學習帶來的應用變革與技術驅動力;

4、深度學習加速晶元實現路徑與關鍵技術;

5、深度學習加速晶元現狀。

主講環節

王林:大家晚上好,我是華登國際的王林,很高興今天晚上有機會在智東西公開課的AI晶元社群跟大家做一些交流。其實今天晚上的演講壓力還是很大的,因為我看到群里有很多我的老朋友,都是晶元或者AI領域的高手。

平時演講我都是盡量在懂晶元的人面前講AI,在懂AI的人面前講晶元,但是今天就沒辦法這麼做了,因為群里有很多晶元和AI領域的高手。我盡我所能,如果有說的不對或者不太好的地方,還請大家多多包涵,主要是能有這樣一個跟大家交流的機會確實非常難得。

今天來講AI加速晶元還是一個挺應景的事情,因為昨天深鑒科技宣布被Xilinx全資收購。這也是我們能夠看到近期少有的中國高科技公司被美國半導體公司併購的案例,以前我們更熟悉的是聽到中國資本去海外併購一些科技公司或者半導體公司。深鑒科技在這方面做了一個很好的範例。從另一方面也說明我們中國的AI晶元在全球也處於比較領先的地位,當然也證明了AI晶元方面的創業還是挺有前(錢)景的。

講到半導體,不得不從摩爾定律說起。我相信群里半導體從業人員對摩爾定律已經非常熟悉了,從Intel創始人戈登·摩爾提出摩爾定律到現在已經53年了。過去的53年中,半導體行業一直受著摩爾定律的指導。晶元越做越小,單位面積的晶體管越來越多,功耗越來越低,價格越來越便宜,也使得這個行業過去五十多年來一直保持不錯的增長趨勢。

我想給大家看下這張圖。其實過去在投資界有一個共識,大家都認為半導體投資是非常不划算的事情,風險高、投資大、回報相對來說又比較低。所以,風險投資對半導體行業的投資在過去十來年一直不溫不火,甚至是持續下降的趨勢。當然半導體行業的增長也基本上印證了這樣一個理念,也就是從前些年來看,全球半導體行業並沒有一個非常大的增長幅度。

從右邊這張表可以看到2016年全球半導體的增長率也就7%,很多時候半導體的增長率可能只有2%-3%。但是,很奇怪的是2017年全球半導體有了一個跳躍式增長,達到20%。這是過去十年來半導體行業從來沒有看到過的事情,大家都瞠目結舌。所以,大家是否也有這樣一個疑問:為什麼2017年的增長這麼大?

還有一個比較值得關注的點,歐美的半導體行業已經持續呈衰退狀態,但是2017年,其增長甚至比中國還要高,儘管中國一直維持著半導體高速增長的趨勢。從全球來看,中國市場仍然是增長最顯著的動力源,也是一個非常耀眼的明星。

其實半導體的增長和集成電路晶元的應用息息相關。不得不說過去十年半導體的增長,一定依賴於智能手機行業的爆髮式增長。可以說,到目前為止可能全球有一半的晶元是為了智能手機生產和使用的。所以說,智能手機一定是過去十年集成電路行業發展非常大的推動力。

但這裡又不得不說,到現在為止我們已經到了後智能手機時代。這裡摘錄了一些新聞,通過標題大家就可以看到從2016年開始,整個智能手機的增長相比之前是非常緩慢的。相信大家日常生活中應該也能明顯感受到,手機上的創新越來越少,換機的動力也越來越小,所以整個市場的增長持續一個很平靜的狀態。

同時,從技術角度來看,摩爾定律近期也受到了非常大的挑戰。雖然我仍然堅信摩爾定律至少在近些年會持續演進下去,但是不得不說,隨著工藝節點的越來越小,也會帶來成本的顯著性提高。我相信,未來7nm、5nm、3nm量產的日子一定會到來,但是也許到了那天可以用上或者說用得起那麼先進工藝的晶元公司也寥寥可數。業界目前有這樣一個共識:28nm應該會是一個長期存在的工藝節點,其性能、成本是一個比較合理的均衡狀態。

對於半導體行業從業人員來說,這是一個很悲催的事情。技術的推動力——摩爾定律,受到越來越大的挑戰,而應用的最大推動力——智能手機,也遇到了非常大的增長瓶頸。從技術推動力和應用兩大層面來說,半導體行業都遇到了很大的問題。所以,這也進一步印證了為什麼前幾年投資界對半導體行業這麼悲觀,從某種程度上來說也是有一定道理的。

當然,我們不能不承認,敢從事半導體方面的人員一定是非常值得尊敬的,都是敢啃硬骨頭的。從我發的這張圖可以看到,其實工業界已經在嘗試用多種方法盡量去使摩爾定律能夠更長期的延續下去,或者能夠以更低的成本延續下去,包括大家所知道的FinFET、FD SOI,都是業界正在推動的一些主流技術路線。EUV光刻技術,三維封裝等都是能夠使摩爾定律長期維持下去的一個非常有效的手段。

從我個人來看,如果半導體行業仍然要像過去智能手機時代一樣飛速成長,一定要找到下一個應用推手,也就是說一定要找到後智能手機時代什麼應用才是對我們半導體行業有巨大推動力的應用。我們來看下戈登·摩爾怎麼說,他五十三年前提出摩爾定律的時候,同時做了一個預言。大家可以看下上圖右上角用紅色字體標註的這段話。

其實戈登·摩爾在五十三年前已經說了「集成電路會帶來家用電腦或者至少是和中央電腦所連接的終端設備、自動駕駛、個人便攜通訊設備等」。看到這裡,我們就應該清楚戈登·摩爾在五十三年前所做的預言,到今天為止已經基本上都實現了。也就是說,其實戈登·摩爾已經看到了集成電路的發展會帶來非常多的新應用,而這些新應用反過來會成為集成電路發展的巨大推動力。

說到這裡,讓我們來看,在後智能手機時代,什麼才是集成電路行業的最大推動力呢?

人工智慧的出現讓業界眼前一亮,或者是讓半導體行業找到了新的方向和推動力。當然,很多人會說,深度學習也好、神經網路也好,只是一個技術,為何能夠成為從應用角度去推動集成電路發展的一個推手呢?

很明顯,到現在為止,大家耳熟能詳的從「互聯網+」到「AI+」可以看到深度學習的出現,給非常多的傳統行業帶來翻天覆地的變革機會,甚至帶來一些新的應用。我覺得,這是深度學習所帶給我們的廣闊天地。大家比較熟悉的AlphaGo下圍棋,包括戈登·摩爾所說的無人駕駛汽車,其背後不得不說是深度學習的出現才帶來了這樣巨大的、有前景的應用。當然,還有醫療影像分析,GE、飛利浦、西門子這三家巨頭在他們最新的醫療影像設備上,其實已經集成了非常強大的人工智慧演算法來輔助醫療影像科的醫生去更快更好更準確的做診斷;工業自動化領域,半導體生產製造、封裝測試領域帶有機器視覺功能的機器已經非常多了,當然還有FinTech。深度學習給各行各業帶來的變革已經非常明顯。

我們應該感謝深度學習給集成電路行業的發展帶來這麼多新的應用機會。但是反過來,沒有集成電路行業的有力支持,深度學習也不可能達到今天這樣令全球矚目的地位。

上面這張圖展示的是四代AlphaGo所使用的硬體平台。第一代AlphaGo Fan是跑在176個GPU上,打敗李世石的第二代AlphaGo Lee當時是跑在48個第一代Google TPU上,打敗柯潔的第三代AlphaGo Master跑在4個Google第二代TPU上,包括前不久出現的使用對抗神經網路等演算法的AlphaGo Zero仍然是跑在4個TPU上。

大家還是否記得一開始我說的為什麼去年歐美半導體的增長這麼大?在這裡想跟大家說一下,我覺得AI是一個非常大的推動力,帶來的更多是雲端的一些需求,對數據和算力上的創新需要大量的存儲、更快的光通信等,同時對工業和汽車領域也帶來了非常多新的機會。

不得不說,歐美的半導體廠家在伺服器、工業、汽車領域仍然擁有很強大的不可撼動的優勢和地位。如果說這三大領域得到了非常快速的應用增長和半導體晶元需求的增長,那麼首先得益的肯定是歐美半導體公司。這也是為什麼歐美的半導體公司在2017年能夠有這麼耀眼的成績。

正如戈登·摩爾所說,集成電路的發展帶來了無人駕駛汽車,在這裡也要感謝深度學習演算法的出現,毫無疑問汽車已經變成了一個非常巨大的半導體應用平台。可以說全球所有頂尖的半導體公司都在圍繞著汽車來做未來的產品規劃,希望其能夠成為智能手機之後,對全球半導體行業有巨大推動力的推手。當然這個行業也在經歷著巨大的變化,就是要實現汽車行業的四個現代化:新能源化、智能化、共享化、互聯網化。

從智能化的角度來說,沒有深度學習的出現,智能化的到來將是遙不可及的事情。但也正是因為智能化的出現,給了汽車非常多的賣點,使得消費者願意去選擇更智能、更具有吸引力的汽車,也使得汽車行業的增長帶來了集成電路行業這樣一個巨大的應用平台。

這張圖非常有意思,我經常喜歡跟朋友們分享福特、通用和特斯拉這三家車廠最近的一些變化。通過這張圖大家可以看到汽車行業正在經歷著巨大的變化,一方面是因為汽車的半導體化電子化,另一方面也是因為深度學習帶來的汽車智能化。大家可以看到擁有電子化和智能化的特斯拉的市值已經和通用、福特到了一個相同的位置。但是從出貨量和成立時間來看,特斯拉跟這兩位老大哥的差距其實還很大。

前面講了一些應用以及半導體行業的一些發展趨勢,我覺得現在有必要再和大家探討一下,深度學習到底給我們帶來了什麼?帶給半導體行業的創新點到底是什麼?因為我是學工科出身的,其實對於學工科的學生來說,一開始接觸到深度學習會帶來一個非常大的思維障礙。因為對於我們來說,以前學習的理論或者定理,總是要知道來龍去脈,不僅要知其然,還要知其所以然。但是對於深度學習來說,其實我們很難把他搞得這麼清楚。

打一個不恰當的比方,深度學習更像中醫,可能更多的是憑經驗或者感覺,其實很多時候對我們來說深度學習就像一個黑盒子或者灰盒子的狀態,我們沒辦法也沒能力去把這麼龐大的神經網路裡面的運算規律搞清楚。

但是不管怎樣,深度學習帶給我們的結果大家是看得到的,深度學習我們使用的時候需要做訓練,然後反過來需要推理,這樣的過程我們已經做得非常熟了,所以在以後工程化應用過程中,已經沒有理論上的一些障礙了。

深度學習也確實給工業界帶來了巨大的效率提升,雖然我這裡只是列了一些比較老的數據,但其實96.4%的準確度已經已經超過了人類的水平。

那麼深度學習要選擇處理平台或者什麼樣的架構來做運算呢?其實很自然的一個想法就是,既然神經網路是從人腦來模擬和模擬出來的,那麼我們是不是應該有一個類腦運算平台或者類腦晶元呢?其實業界也有非常多的公司在做這方面的探索。

在這裡我就列了兩家做公司做的類腦晶元:IBM的Truenorth和高通的Zeroth,都是比較典型的類腦晶元。不知道大家是否有印象,大概一兩年前,國內曾有報道稱浙江大學發布了應該是國內第一款基於SNN(脈衝神經網路) 的類腦晶元。

因為負責這款晶元開發的教授正好是我浙大的師兄,所以看到這個新聞之後,我也跟他做了一些溝通,就是基於SNN的類腦架構在理論水平和晶元水平上到底是什麼層次?可以看到趨勢還是很明顯的,至少在工程上已經得到了實現的可能性驗證,他們在OCR的識別上應該有達到70-80%的準確度。但是,很遺憾的是SNN一直沒有非常合適運算平台,造成SNN從理論、演算法的基礎研究上是嚴重滯後於深度學習的科研水平。

不管怎樣,我認為類腦晶元還是非常值得我們關注的一個未來趨勢。但是,短期來看還是基於深度學習演算法和運算平台更值得工業界去關注和探索。

這裡我們不得不提到另外一個人——馮·諾依曼。他在1946年提出的馮諾依曼架構一直指導著我們計算體系架構的發展。絕大多數的體系架構創新都是基於馮諾依曼架構的,都沒有超出他的框架範圍。馮諾依曼提出所有的計算機的都由存儲、控制、邏輯運算、輸入和輸出五部分組成。

我大致做了一個歸類,不知道是否準確,只是說在我做投資和分析的時候給我一些指導,可能對我個人有些幫助。我把馮諾依曼架構的五大組成部分分為三類,輸入輸出歸類於交互,控制和邏輯歸類於計算,存儲單獨列為一類,也就是交互、計算和存儲三部分。我覺得深度學習對這三方面都提出了非常多的創新要求,也使我們看到了非常多創新的機會。

大家都在說深度學習三要素:演算法、算力和數據,從某種程度上跟我之前總結出來的交互、計算和存儲三大計算機體系組成是一一對應、息息相關的。後面我也會從算力和存儲的方向,闡述下我個人認為創新的點和需要攻克的難點到底在哪裡。

深度學習到目前為止可以說是兵家必爭之地,包括我們現在看到深鑒科技被Xilinx收購。其實國內還有很多企業在做深度學習加速的研究。國際上,高通投資了商湯,Intel投資了地平線,華為海思的麒麟970裡面集成的深度學習加速IP來自北京的寒武紀科技。其實可以看到,不管是創業公司還是國際上的大公司,深度學習都受到非常多的關注。

雖然都是深度學習的加速,但是在不同的應用領域,我們還是要分別來對待。包括深度學習的訓練和推理,晶元的應用場景,比如雲端和我們所謂的終端,我認為在不同的晶元裡面,對於加速的要求還是不太一樣的。

對於終端的訓練來說,我還沒有看到太多的機會或者應用場景,包括從功耗的角度是否存在這樣的可能性,也值得大家去探討和思考。

但是在雲端訓練的角度來看,GPU是佔有絕對優勢的,當然FPGA的加速卡、包括Google在做的TPU用來做訓練的ASIC也都在顯示自己的威力;我覺得終端inference,會是一個更加廣闊的應用場景。對於終端來說,從功耗、成本的角度來考慮,ASIC是更加值得大家去關注的一個趨勢。

接下來我來給大家分享一些比較主流的深度學習在晶元層面實現加速的方法。我相信有更多的專家在這方面會講出更值得大家去思考和探討的內容。

脈動陣列並不是一個新鮮的辭彙,在計算機體系架構裡面已經存在很長時間。大家可以回憶下馮諾依曼架構,很多時候數據一定是存儲在memory裡面的,當要運算的時候需要從memory裡面傳輸到Buffer或者Cache裡面去。當我們使用computing的功能來運算的時候,往往computing消耗的時間並不是瓶頸,更多的瓶頸在於memory的存和取。所以脈動陣列的邏輯也很簡單,既然memory讀取一次需要消耗更多的時間,脈動陣列儘力在一次memory讀取的過程中可以運行更多的計算,來平衡存儲和計算之間的時間消耗。

上面這張圖非常直觀的從一維數據流展示了脈動陣列的簡單邏輯。當然,對於CNN等神經網路來說,很多時候是二維的矩陣。所以,脈動陣列從一維到二維也能夠非常契合CNN的矩陣乘加的架構。

我們還可以從體系架構上對整個的Memory讀取來做進一步的優化。這裡摘取的是寒武紀展示的一些科研成果。其實比較主流的方式就是盡量做Data Reuse,減少片上Memory和片外Memory的信息讀取次數,增加片上memory,因為片上數據讀取會更快一點,這種方式也能夠盡量降低Memory讀取所消耗的時間,從而達到運算的加速。

還有就是大家比較熟悉的剪枝技術。這也是深鑒科技當時出來創業賴以成名的絕技。對於神經網路來說,其實很多的連接並不是一定要存在的,也就是說我去掉一些連接,可能壓縮後的網路精度相比壓縮之前並沒有太大的變化。基於這樣的理念,很多剪枝的方案也被提了出來,也確實從壓縮的角度帶來了很大效果提升。

需要特別提出的是,大家從圖中可以看到,深度學習神經網路包括卷積層和全連接層兩大塊,剪枝對全連接層的壓縮效率是最大的。下面柱狀圖的藍色部分就是壓縮之後的係數佔比,從中可以看到剪枝對全連接層的壓縮是最大的,而對卷積層的壓縮效果相比全連接層則差了很多。

所以這也是為什麼,在語音的加速上很容易用到剪枝的一些方案,但是在機器視覺等需要大量卷積層的應用中剪枝效果並不理想。我相信這也是未來很好的創業和搞科研的方向。

對於整個Deep Learning網路來說,每個權重係數是不是一定要浮點的,定點是否就能滿足?定點是不是一定要32位的?很多人提出8位甚至1位的定點係數也能達到很不錯的效果,這樣的話從係數壓縮來看就會有非常大的效果。從下面三張人臉識別的紅點和綠點的對比,就可以看到其實8位定點係數在很多情況下已經非常適用了,和32位定點係數相比並沒有太大的變化。所以,從這個角度來說,權重係數的壓縮也會帶來網路模型的壓縮,從而帶來計算的加速。

當然,一個不能迴避的問題是計算和存儲之間的存儲牆到現在為止依然存在,仍然有大量的時間消耗在和存儲相關的操作上。

一個很簡單直觀的技術解決方式,就是堆疊更多更快速更高效的存儲,HBM孕育而生,也即在運算晶元的周圍堆疊出大量的3D Memory,通過通孔來連接,不需要與片外的介面進行交互,從而大大降低存儲牆的限制。

更有甚者提出說,存儲一定要和計算分離嗎,存儲和運算是不是可以融合在一起,PIM(Processing in Memory)的概念應運而生。我覺得,這也是一個非常值得大家去關注的領域。我知道,群里有些朋友也在PIM領域做一些創業的嘗試。

當然,除了前面說到存儲內置,以及存儲與運算的融合,有沒有一個更快的介面能夠加速和片外Memory的交互也是一個很好的方向。其實上面這個概念是NVIDIA提出來的interface(介面),叫做NVLink。下面的表展示的是NVLink和PCIe Gen3的對比。大家平時看到跟存儲相關的的PCIe卡可能是PCIe Gen3 by 4,只有4個lanes和Memory對接,但是NVLink與有16個PCIe的lanes的PCIe Gen3對比,速度也有很大的提升,可以看到NVLink在速度層面是一個非常好的interface。

前面講了一些在我看來比較經典的加速方法。下面我會分享幾個已經存在的AI加速晶元的例子,相信這樣會更加直觀。

第一個是Google的TPU。從右邊的晶元框圖可以看到,有一個64K的乘加MAC陣列對乘加運算進行加速。從論文中可以看到裡面已經用到了脈動陣列的架構方法來對運算進行加速,另外也有我們前面提到的大量的片上Memory 這樣的路徑。上面藍色框圖中大家可以看到有一個24MiB的片上Memory,而且有兩個高速DDR3介面能夠與片外的DDR做交互。

上圖展示的第二代TPU。從圖中可以很直觀的看到,它用到了我們前面所說到的HBM Memory。從其論文披露的信息也可以看到,二代TPU在第一代的基礎上增加了我們前面說到的剪枝,權重壓縮等方面做了很多嘗試,也是一個非常經典的雲端AI加速晶元的例子。

這家公司叫SambaNova,不知道大家有沒有聽說過,是我們和Google Venture投資的一家做雲端AI加速晶元的矽谷公司。他們更多是想要挑戰NVIDIA在雲端訓練的地位。前面提到的很多加速的方法他們都會去做嘗試,包括片上Memory、HBM等。其實更值得一提的是SambaNova非常強大的軟體實現的團隊力量。其實大家現在看到的一些加速晶元所支持的框架,可能更多是TensorFlow、Caffe這兩個比較流行的框架。但是,他們開始支持微軟和Facebook發布的框架Onnx。在他們看來,Onnx是通用性和兼容性更好的一個框架。

接下來跟大家分享幾個終端做Inference的例子。第一個是Rokid和杭州國芯共同打造的一顆針對智能音箱的SoC,AI加速只是裡面的一個功能。通過右邊的框圖可以看到裡面集成了Cadence的DSP,還有自己設計的語音加速硬體IP——NPU。這款晶元還集成了一些實現智能音箱必要的interface,最值得一提的是在SiP層面封裝了Embedded DRAM,可以更好的在系統層面實現數據的交互,實現存儲和運算的加速,也實現了AI加速的功能。

最後說一款華為海思最新的IP Camera晶元——3559A,也是我個人比較喜歡的一款晶元。從集成度以及整個設計的均衡性來說,都令人眼前一亮。可以看下右上角幾個藍色的標準模塊,裡面集成的是海思自主研發的做推理的IP——NNIE,同時還集成了Tensilica DSP,在靈活性和擴展度上做了一個非常好的補充。

今天不光講了創業的機會、投資的機會,我認為也正是因為中國有了現在非常好的產業政策,不管是人才還是市場,都是一個很好的創業土壤。我覺得AI加速方面創業和投資的機會依然存在,也希望和有志於在AI領域創業的朋友多多交流。謝謝大家,我的分享到這裡就結束了。

Q&A環節

問題一

何偉-靈汐科技-總監

1. 為了達到更好的能耗比,往往需要將演算法固化在晶元上,但晶元的開發周期較長,演算法更在不斷演進,如何有效降低產品風險?

2. 對於現在的加速器,主要的技術門檻在哪裡?差異化將體現在哪裡?

王林:1,我認為演算法仍然在不斷演進,晶元一旦做死其實就沒有那麼靈活了,我覺得首先要支持主流的AI框架,晶元的編譯器或者模擬一定要支持caffe、TensorFlow等主流框架;另外在晶元層面,異構是很有必要的,一款做死的硬體加速IP是否可以配備一個相對靈活的DSP等,這樣從加速層面,可擴展性和靈活性也是一個均衡。

2,技術門檻我的理解是可以有以下幾個方面,比如feature map的稀疏化,怎麼避免不必要的計算和存儲的內存讀取,以及計算資源和帶寬的平衡等,因為在卷積層和全連接層不同的地方可能需要使用不同的策略,這些是我目前考慮到的技術層面需要解決的方向;我覺得差異化肯定是體現在整個晶元系統的架構設計,從非馮諾依曼架構來看空間還是很大的,大家可以各顯神通,做好自己的晶元的差異化呈現。

問題二

文良-三星電子-AI工程師

1.AI晶元的基本計算單元與傳統CPU的加法乘法器不同有哪些?

2.AI晶元的內部分布小存儲區如何高效解決大數據體量時跨計算單元的高效數據調度;

3.對外介面是否可以理解為降低頻率增加位寬來提升吞吐能力?

王林:1,CPU里的運算單元一般叫做ALU,AI晶元的運算單元一般叫PE,但是PE裡面也是有ALU存在的,我覺得二者只是計算的側重點不同而已。其實CPU裡面有很多種計算單元,比如乘法器、加法器、與非門等,做一些常用的加法,乘法,異或,數據移位等常規運算;而PE內部的ALU,可能會做一些MAC陣列的乘加運算,比如還有一些深度學習演算法相關的運算,比如ReLU等,我覺得這是一些不一樣的地方。

2,我理解這個問題是指任務分割,在我看來還是要依靠片上Memory或者板級的片外Memory來做。

3,我覺得不能這樣理解,因為速度仍然非常重要,對於介面來說,首先數據包的格式一定要高效。另外從晶元的層面來看,一定要有非常高速的SerDes,就是模擬電路方面要有非常高的功力才能做這樣的事情。

問題三

王紹迪-知存科技-CEO

1 當前有很多創業公司在做伺服器端深度學習晶元,當前深度學習雲端晶元的創業機會在哪?

2 邊緣端深度學習晶元的創業公司應該做晶元提供商還是紮根應用,拿自己的晶元做解決方案,哪種做法更有市場?

3從投資退出角度,如何看待深度學習晶元創業公司的未來。更有可能獨立上市還是被上下游大公司收購

王林:1,雲端晶元的創業機會我覺得是三個字,叫做「傍大款」,就是光靠創業公司其實挺難的,一定找一個大款去傍,比如說去服務BAT中的一家,先讓自己活下來比較重要。

2,我認為晶元和應用是不能獨立開來的,不管現在叫邊緣晶元還是終端晶元,我覺得一家好的終端晶元公司往往是一個非常牛的做系統或者做方案的公司。大家可以想一下Intel,其實Intel不光做CPU,他們對PC系統的設計也是非常領先的。比如台灣的MTK,其之所以能夠有今日的地位,是因為他們對手機系統的理解非常深入,可以提供turnkey solution,當然,他們的晶元也能夠把他們對手機系統的理解呈現出來,所以我認為一家好的晶元公司一定非常懂應用,賣晶元的同時,一定要去賣方案。

3,從退出的角度來看,我覺得還是要看創業公司的側重點是什麼,如果只是針對深度學習加速本身,我覺得更多要定位為演算法公司或者IP公司,那麼其是很難獨立存在的,被收購的幾率非常大;但是如果說是深度學習加速和好的應用相結合,或者做一個非常好的終端晶元,還是會有非常廣闊的獨立發展的天地的,至少獨立上市這個路還是可以看得到的。

問題四

徐元-華夏幸福-產業研究員

1.現有AI初創企業較多,基本都是具備較強的演算法基礎和一定的IC設計能力,那麼在投資過程中,重點看中標的企業的哪方面優勢:產品應用領域、團隊履歷、流片經驗、技術路線等。

2.ASIC領域看,未來的趨勢可能在於邊緣計算和終端AI處理能力增強,沿著這個邏輯,現有AI晶元企業未來的發展方向是與Sensor/MCU/AP哪個產品領域結合?

3.應用領域而言,請嘉賓談談未來滲透較快的領域包括?金融、教育、交通、醫療?

4.技術領域看,機器學習、自然語言處理、模式識別哪塊會在近期迎來爆發?

王林:1,其實投資的理念基本是相通的,不管投資什麼方面,首先要看市場有多大,團隊有多強,這也是我們非常關注的兩個點。

2,因為Sensor的範圍特別廣,而且很多Sensor還是受制於一些特別的工藝和材料,所以我覺得很難去跟CMOS工藝做整合,也很難跟AI加速的東西去整合,但是MCU和AP都是很好的結合方向,尤其是找到一個大的應用市場,所以我覺得AI加速和MCU或AP結合做SoC結合才是更好的一個產品定位。

3,我個人 比較關注智能終端、汽車和智能家居三個方面,其實前面也說了FinTech、醫療的應用也是非常明顯的。

4,至少目前從自然語言處理和計算機視覺的角度來看,都已經有了非常大的應用,比如智能音箱其實近兩年已經迎來了一個爆發。

問題五

翟雲-北京君正-總監

如何看待加速晶元在training及inference端的生態問題,生態問題主要會出現在哪些點上?

王林:這個問題非常好,我覺得生態非常重要,大家都知道NVIDIA的GPU,其實NVIDIA的CUDA就是非常好的生態,它有非常完整的底層函數庫,這樣開發者用起來非常的方便。其他的是否有這麼好的生態不太好說,比如Google的TPU自己用是比較封閉的,可能他也確實沒有考慮過要做一個生態。其他的比如FPGA,光是從編程的角度要用Verilog,其實懂深度學習演算法的人員有多少是懂Verilog的呢?其實我覺得用起來還是比較困難的。同時也提出了另一個問題,加速晶元不光有晶元,其實相應的軟體,完備的指令集和強大便利的編譯器,都是讓AI加速晶元成功非常重要的點。

問題六

鄒浩-康佳集團-半導體事業部產品總監

ai晶元的大數據特徵就必然是互聯網巨頭的菜,請問終端ai晶元的機會點在哪裡?

王林:毫無疑問,終端AI晶元的機會肯定在應用,我覺得其實互聯網公司未必懂應用,比如說阿里現在正在進軍安防領域,但是BAT會比海康大華更懂安防嗎,我覺得這是一個見仁見智的事情,因為安防行業有很多臟活累活,和很多偏細節的問題,所以我認為終端AI晶元肯定不是做平台的大一統,而是需要結合非常細化的場景,所以我說終端晶元的機會在於應用。

問題七

朱方-中興通訊-視覺人工智慧產品首席架構師

人工智慧晶元現在百花齊放,特別是國內,但無論從國外還是從國內,晶元構架,ISA,編譯技術,新的工藝方法都是少數人的遊戲。投資人如何看待,領域創新又應該如何踏實展開?

王林:其實是這樣的,因為晶元的架構、指令集、新的工藝方法確實現在懂的人並不多,所以門檻越來越高,也確實是少數人的遊戲。但是從另一個角度說明,產業鏈的分工越來越細,很難在晶元領域找到一個全棧的工程師什麼都懂。但是產業鏈分工很細說明我們是可以整合的,只要我們能夠整合到足夠的資源,把我們需要的環節整合起來,從這裡看,晶元的門檻其實是越來越低的,所以我覺得還是有很多機會的。在我看來領域的創新其實是很簡單的,就是要看到釘子再找鎚子,而不是拿著鎚子找釘子,還是要找到一些問題點,用我們的技術、實力去克服,我覺得這會是一個非常好的創業機會。

問題八

陳超-滴滴戰略部-戰略經理

1. 在AI時代,會形成像PC時代WinTel,移動時代的安卓iOS和ARM那樣的生態體系嗎?

2.怎樣看待未來國內晶元行業的發展和走勢?

王林:1,我覺得形成少數寡頭壟斷的生態在未來還是有很大機會的。因為從社會效率和資源分配上來看形成了一個穩定的聯盟,對社會效率和社會資源的節約是一個很好的事情,包括ARM,下個月ARM會發布深度學習加速IP,那麼其是否能夠形成CPU領域的IP壟斷地位呢,大家拭目以待。但是從AI OS的角度來看,其實AI時代的OS到底是什麼呢?我覺得這是一個特別大的問題,我也沒想清楚。

2,國內晶元行業的發展,在我看來是不需要存在任何懷疑的。從全球來看,財力物力人力包括全球頂級的客戶在中國越來越多,尤其從人才的角度來說,中國現代晶元人才方面,現在年輕人讀晶元、讀工科的人才比例,在我國晶元行業已經有了一個很好的基礎,未來一定是一個很光明的行業。

課件獲取

第一講,聯發科計算與人工智慧本部總監張家源主講,主題為《如何基於 NeuroPilot平台打造手機AI》

第二講,深思考人工智慧CEO楊志明主講,主題為《醫療影像專用AI處理器的機遇與挑戰》

第三講,觸景無限CEO肖洪波主講,主題為《玩轉模塊化AI 讓智能更簡單》

第四講,靈汐科技首席架構師馮傑主講,主題為《類腦晶元的架構演進》

第五講,華登國際合伙人王林主講,主題為《淺談AI帶來的集成電路領域創新與投資機會》

第六講,澎峰科技聯合創始人趙華龍主講,主題為《如何從0到1搭建RISC-V處理器》

掃描下方二維碼關注智東西公開課服務號,回復關鍵字「AI晶元」獲取往期課件


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 智東西 的精彩文章:

智能音箱界又添一員!三星推出Galaxy Home,音質很好但有點「傻」
蘋果市值突破9900億美元 特斯拉Q2虧損7.43億美元

TAG:智東西 |