當前位置:
首頁 > 科技 > 思考:利用雲上EDA設計晶元,行得通嗎?|半導體行業觀察

思考:利用雲上EDA設計晶元,行得通嗎?|半導體行業觀察

來源:內容來自「StarryHeavensAbove」,作者: 唐杉 ,謝謝。

Google的TPU晶元專門為雲端AI應用設計,可謂是為雲而生。而TPU的設計過程又越來越多的利用了雲的優勢,可謂是生於雲中。TPU所帶來的創新,不僅僅是晶元架構,還反映在整個晶元研發的思路,方法,甚至是「文化」,而後者可能對整個產業都會帶來更為深遠的影響。

傳統的晶元公司做晶元,目標是規模量產和銷售,第一個風險就是晶元的規格不能滿足市場需求,做出來也沒用。有了規格之後,我們考慮的最多的就是成本(PPA和研發成本)和Time to Market,這讓我們在做trade-off的時候束手束腳。如果不用擔心難伺候的客戶,不用擔心規格不對,而成本和ToM也不是最重要的因素,我們是不是終於可以大展拳腳了呢?

我們在研發一款晶元的過程中,從架構設計到物理實現,需要很多步驟,其中的很多工作,比如模擬驗證,需要大量的計算資源。而在現實中,計算資源總是有限的,我們要麼Delay,要麼放棄對驗證質量的追求。如果計算資源是「無限」的,我們還需要做這種無奈的取捨嗎?

當看到[1]中的如下文字,我一下就想到了上述兩個場景,進而非常理解Daniel Nenni所形容的在Google做晶元就像「小朋友進了糖果屋」的感覺。

「A friend of mine now works for Google designing chips. Can you imagine what it is like designing chips for a company that does not sell the chips (cost and delivery are not the driving factor) and has a massive cloud at their disposal? To put it bluntly my friend was like a kid in a candy store. He can now design a much better quality chip without having to worry about lengthy simulation and verification runs. To be clear, you can bet Google chip designers get silicon right the first time, absolutely.」

Google TPU我介紹的很多了,2017年Google公布了第一代TPU的架構,之後基本是每年更新一代,可以說迭代速度非常之快。大家看TPU的論文,都會感覺它的架構和設計似乎並不複雜,但我相信離開了Google,沒人能做到類似的成功。因為TPU的設計反映的是Google在Cloud/Data center軟硬體體系上的強大經驗和實力,它放在Google Cloud上就是合適。我最近的文章討論了Tesla的FSD晶元,它的前提也是這個晶元就是自己用的,不用考慮別人的需求。在這種情況下,我們來對比評價它的架構設計就顯得沒什麼意義了。Google不只做TPU,還有不少晶元項目。Apple早就把自研晶元作為最核心的研發了。其它能數得上的科技巨頭也無一例外的都在自研晶元,很多現在還不是巨頭的系統公司和應用公司也開始自研晶元。這個趨勢會給整個半導體行業帶來很多變化,商業模式,生態和產業鏈,技術趨勢,研發模式,設計方法,甚至是」文化「。

而晶元研發模式的變革就引出了本文的第二個問題:雲上的晶元設計。還記得在17年我參加阿里雲棲大會的一個討論,被問就是關於在雲上用EDA工具做晶元的問題。應該說,當時這種模式不論是在技術上還是商業模式上都還在探索階段。到現在再回看,這個探索到實用的過程似乎並不太長。在今年的DAC(Design Automation Conference,EDA界的盛會)上,Google和eSilicion有個聯合talk,」Doing EDA in the Cloud ? Yes, it』s possible !「[2]。」We often hear that the EDA industry is not yet ready for the cloud, usually due to objections about the nature of cloud-native technologies. However, the cloud seems like the ideal place to run chip designs: flexible compute resources available on demand, nearly infinite storage, and a pricing structure that avoids costs for idle resources. 「可惜我沒有看到具體的材料(歡迎讀者留言分享相關信息)。

實際上,Google在去年DAC上就做了名為」Google: Moving EDA to the Cloud - a Google-on-Google story「報告(這個可以在網上找到)。當時就提到,在做TPU的過程中很自然的想到了利用雲資源的優勢。其實也不難理解,晶元設計中大量的時間是花在模擬驗證上的,而這些模擬驗證又很容易並行執行。如果能在一段時間內提供大量運算資源,就可能大大減少總的驗證時間,或者在有限時間內做更充分的驗證。由於這種需求是突發性的,一般的晶元設計公司不可能自己建立這樣的能力來滿足短暫的峰值需求。但對Cloud來說,這就不算問題了。所以才說Google可以在需要的時候把」無限「的資源投到晶元設計,實現快速迭代(他們的原話是」敏捷開發「),同時更容易實現高質量驗證並保證一次投片成功。下圖是Google Could支持晶元驗證的架構,其中就明確提到了」Unlimited Simulations Running in Parallel「。

思考:利用雲上EDA設計晶元,行得通嗎?|半導體行業觀察

打開今日頭條,查看更多圖片

source: Google blog

當然,Google這麼做可以說非常自然,但對第三方晶元公司來說,要利用這樣的平台,還需要考慮很多因素的,比如數據安全的問題。上述talk中也提到了這個話題,認為安全性本身就是雲廠商重點關注的問題,它們在安全性上的投入比一般公司大得多,因此在雲上的安全性比本地的安全性更高。晶元項目的數據和IP是晶元公司的最核心資產,大家對安全性的關注當然很高。不過隨著這種模式越來越完善,相信這些障礙都是可以解決的,剩下的可能真是」文化「的問題了。」雲上做晶元「可以算是晶元研發模式的重要創新,沿著這個思路,也可以引出很多有趣的話題,有機會我們進一步討論吧。

最後,在Daniel的文章中,他提出了一個很有意思的問題,大家可以也思考一下。

「For new chip design companies the cloud is an easy decision. For the older fabless companies that have years and years of non-cloud culture and non-cloud infrastructure it is a very difficult change. The question I have is how are they going to compete with the natural born cloud chip designers?

此外我再加個題目:」獨立的晶元設計公司怎麼和Google們競爭?

Reference:

[1] Daniel Nenni, "56thDAC Las Vegas Trip Report", https://semiwiki.com/events/259652-56thdac-las-vegas-trip-report/

[2] David Marshall, Guilhem Tesseyre, "Doing EDA in the Cloud ? Yes, it』s possible !", DAC 2019

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 半導體行業觀察 的精彩文章:

這家AI晶元初創公司憑啥獲得分析師青睞?|半導體行業觀察
首家登陸科創板的半導體企業,安集微是幹嘛的?

TAG:半導體行業觀察 |