華為鯤鵬920是在重複IBM掉進的大坑 商業前景一般
日前,華為發布了ARM伺服器晶元鯤鵬920,以及搭載鯤鵬920的ARM伺服器。總的來說,這款晶元的設計思路和高通/華芯通、飛騰等ARM陣營IC設計公司是類似的,那就是「單核性能不夠,核心數來湊」,依靠比Intel CPU更多的核心數量獲得強悍的多核性能。從華為公布的數據來看,多核性能強悍,但由於單核性能和Intel有一定差距,以及ARM在生態上的差距和晶元成本問題,單靠純粹商業化運作,不依賴政府和國企的幫助,前途是比較一般的。另外,一些媒體鼓吹的說辭也存在值得商榷的地方。
打開今日頭條,查看更多圖片鯤鵬920 Base on A76?
根據華為官方消息:
鯤鵬920是目前業界最高性能ARM-based處理器。該處理器採用7nm製造工藝,基於ARM架構授權,由華為公司自主設計完成。鯤鵬920主頻可達2.6GHz,單晶元可支持64核。該晶元集成8通道DDR4,內存帶寬超出業界主流46%。晶元集成100G RoCE乙太網卡功能,大幅提高系統集成度。鯤鵬920支持PCIe4.0及CCIX介面,可提供640Gbps總帶寬,單槽位介面速率為業界主流速率的兩倍,有效提升存儲及各類加速器的性能。典型主頻下,SPECint Benchmark評分超過930,超出業界標杆25%。同時,能效比優於業界標杆30%。鯤鵬920以更低功耗為數據中心提供更強性能。
由於飛騰的FT2000和鯤鵬920同屬ARM陣營,且都是64核晶元,那麼,就對比一下兩者的SPEC06測試成績。
先要說明的是,FT2000是飛騰在2016年的晶元,工藝為28nm,相對於2018-2019問世,採用7nm工藝的鯤鵬920在製造工藝和時間上先天處於劣勢。這裡僅拿飛騰做一個參照。
根據業內人士告知,FT2000在2G主頻,編譯器為GCC4.8的情況下,SPEC2006測試單核成績為定點12.4,浮點11.3,多核成績為定點570,浮點482,這個成績與Intel Xeon E5-2695v3相當。
由於不清楚鯤鵬920的具體測試條件,就假定於FT2000相當好了。
鯤鵬920的定點成績為930,相對於FT2000的570提升了約60%,這既展示出華為的實力,也是兩年時間技術進步的體現。
由於鯤鵬920與FT2000都是64核,假定華為的多核擴展做的和飛騰差不多,那麼鯤鵬920的單核成績應當在20分左右。由於鯤鵬920的主頻為2.6G,換算一下就是接近8/G,內核性能大致與ARM Cortex A76相當,或略強於ARM Cortex A76,與AMD的Zen,Intel的skylake還是有不小的差距。
這與此前一位海思大佬宣稱的這個10.8/G有不小差距。除非華為在多核擴展方面做的比較差,與飛騰存在較大差距,導致性能損耗太大,否則就很難自圓其說了。就這個角度看,雖然華為自稱是自主完成設計,但以目前公開的遊戲信息,恐怕很難打消外界鯤鵬920是Base on A76的猜測。
另外,業內人士表示:
技術只能迭代演進,如果不是耗費十多年時間從零開始技術積累,每一代CPU的進步,代碼替換量不會超過25%,因而,像Intel、ARM這麼牛逼,CPU也是迭代演進的,不存在一步登天的情況。如果一款號稱「自主研發」的CPU一問世就一步登天,性能牛逼、可靠性、穩定性、兼容性好,軟體生態完善,那這款CPU的自主性就要打一個問號了。
還有業內人士表示:
即便是技術引進消化吸收,也是需要站在巨人肩膀上的,必然保留大量「巨人」的源代碼。
從實踐上看以蘋果來說,在收購了PA這樣的IC設計公司後,又高薪挖了很多大牛,也是拿Cortex A8、A9、A15改了三代,也就是A4、A5、A6處理器,至於在「幽靈」和「熔斷」爆發的時候,ARM宣布,因為Cortex A8、A9、A15存在漏洞,所以蘋果的數款CPU也存在漏洞……之後設計CPU也存在「高度借鑒」前人設計的情況,美國法院就判決,蘋果的處理器侵權,並命令蘋果公司支付5.06億美元賠償。
此外,華為雖然開發過Hi1610、Hi1612、HI1616,看起來是演進了四代CPU,但實際上,Hi1610、Hi1612是買A57做集成,HI1616是A72做集成,華為做的只是SoC的設計,內核迭代完全依賴從ARM買新一代內核。
因此,在此前並沒有獨立開發過CPU核的情況下,突然冒出一個Zen級別的內核(海思大佬的說法),或A76級別的內核(根據華為公開數據對照FT2000推算),而且全部源碼100%自己寫,就有違技術發展規律了。
有鑒於如今凡是做CPU的,無論是買IP做集成也好,還是拿洋晶元穿馬甲也罷,都自我標榜自主研發,自主知識產權,以及華為曾經把買A57做集成宣傳為「完整自主知識產權」,並將A57、A72作為自主可控產品打入中央機關政府採購名錄,對於華為官方的宣傳自主研發,大家別急著給華為背書,還是留給時間來檢驗。
媒體報道應實事求是
在鯤鵬920亮相後,媒體讚美之詞不絕於耳,不過,一些報道是值得商榷的。
有文章聲稱,鯤鵬920把計算帶入多核異構的多樣性時代。但是異構計算早就不是什麼新鮮事物,在超算上,特別是TOP500排名靠前的超算上,大多都是異構計算,即便是伺服器CPU,Intel在收購阿爾特拉之後,也拿出了CPU+FPGA的異構計算產品。相比之下,華為鯤鵬920隻是一款ARM伺服器CPU,沒有實現片上異構。
鐵流猜測,文宣聲稱鯤鵬920把計算帶入多核異構的多樣性時代,估計想表示鯤鵬920的一些介面能夠支持CPU+GPU,CPU+NPU,只不過文宣想表達的雞血一點,然後宣傳過頭了。
還有鼓吹鯤鵬920性能的,但是標杆的選擇有些問題,原文是:
典型主頻下,SPECint Benchmark評分超過930,超出業界標杆25%。同時,能效比優於業界標杆30%,此前的紀錄保持者是富士通的7納米A64X,每個晶元最高可達每秒2.7萬億次浮點運算(2.7 teraflops)。
首先,SPEC測試和浮點運算次數根本不是一回事。科學運算看重雙精浮點性能,而對PC和伺服器而言,SPEC測試更具借鑒意義。像一些專門針對科學運算的CPU,會出現浮點運算性能牛逼,但SPEC測試成績很一般的情況,最典型的例子就是龍芯3B1500。
其次,是對比的參數有問題,文章在把富士通的ARM晶元(應當是A64FX,不是文宣寫的A64X)做對比時,舉的例子是富士通ARM晶元的浮點性能,而拿鯤鵬920的數據用的是定點性能,然後把富士通ARM晶元的浮點性能作為鯤鵬920定點性能的標杆......
最後,富士通的那款ARM晶元和鯤鵬920應用場景完全不同。富士通那款ARM晶元是超算晶元,計劃應用於日本的E級超算,設計思路是類似SW26010的片上異構的眾核方案。而華為的鯤鵬920就是伺服器CPU,兩款晶元根本不是一路貨,根本談不上誰是誰的標杆。
另外,還有把鯤鵬920與5G,以及萬物感知、萬物互聯、萬物智能等概念進行關聯的修辭方式也值得商榷。誠然,5G正當風口,萬物感知、萬物互聯、萬物智能看起來高大上,綁在一起可以大幅增加「逼格」。
只不過,5G其實是商業概念,根本不是技術迭代,全球通信廠商把一大堆零增益、負增益的技術塞進5G標準,整個系統效率基本沒有提升,完全靠建設5倍的基站和消耗20倍的帶寬提升網速,而且藍圖裡的URLLC場景現在的5G技術根本實現不了,mMTC場景2G、4G都能做,現在最大的物聯網應用就是刪減版的4G,恰恰是華為和電信搞出來的。前不久運營商採購物聯網晶元,用的也是2G。因此,5G和萬物互聯進行捆綁完全是謊言。
另外,萬物感知相關聯的是感測器,萬物智能相關的是AI晶元,萬物互聯關聯的是各類通信晶元,鐵流實在看不出來,介紹一款伺服器CPU為何一定要把萬物感知、萬物互聯、萬物智能綁在一起的。
ARM伺服器商業前景不佳
前些年,ARM宣布進軍伺服器CPU,高通、AMD、博通、凱為、華為、飛騰等一大批國內外廠商跟隨,炒作的熱度比起現在被熱炒的RISC-V有過之無不及。
然而,ARM伺服器CPU沒有像當年預估的那樣大紅大紫,反而在商業市場折戟沉沙。AMD、Marvell已經相繼退出,高通QDT大裁員,甚至連QDT技術副總裁、高通Falkor ARM伺服器架構設計的靈魂人物Bhandarkar都離職了。高通ARM伺服器項目的最大支持者,高通創始人之子保羅·雅各布也被趕出公司。
在這種情況下,有業內人士依舊看好ARM伺服器,理由如下:
業界有一種說法,即只要擁有20%的成本優勢,就有動力更換處理器架構。各大牛企都在看ARM伺服器,因為Intel壟斷太厲害,大家都希望找一個取代Intel的CPU。
然而,很多企業想把Intel換掉,是因為Intel壟斷價格太貴,結果伺服器廠商、互聯網廠商的很多利潤變相被Intel拿走了。因此,把Intel CPU換掉的前提是,新的CPU必須物美價廉,這樣才能省錢,各大牛企才有動力去換。
現在的情況是,ARM伺服器CPU性能不如X86,特別是單核性能明顯不如X86,在生態上被X86秒殺,在價格上更貴——由於目前的ARM伺服器CPU走的都是「單核性能不夠,堆核心數來湊」的路線,往往用48核、64核去戰Intel 24核、28核,存在晶元面積偏大的問題,加上比較有限的產量,成本會非常高。
因此,由於在性能、生態和價格上ARM伺服器CPU對比X86 CPU都處於劣勢,因而互聯網巨頭只會買一些測一測、試一試,不會現在就海量採購大規模部署替換X86的情況。這也是高通、AMD等巨頭先後拋棄ARM伺服器CPU業務的原因所在。
至於BAT這些公司「自帶乾糧」去做移植軟體,這也未免一廂情願。國內ARM陣營廠商不是BAT的股東,BAT也不是國內ARM陣營廠商的股東。BAT是非常商業化的公司,BAT只是對投資人和股價負責,而不是對國內ARM陣營廠商負責。
BAT幾萬名軟體工程師放下手頭的工作,去給國內ARM陣營廠商移植軟體,工資誰出?國內ARM陣營廠商給錢?還是BAT給自己的員工發工資?
幾萬名軟體工程師放下手頭的工作去移植軟體,耽誤掉的工作怎麼辦?帶來的經濟損失,國內ARM陣營廠商會補貼么?
BAT犧牲自己的利益去成全國內ARM陣營廠商,BAT腦子進水了么?
何況個別國內ARM陣營廠商已經是國內ICT行業很多企業的競爭對手,敵人多於朋友,和BAT已經在一些領域中存在競爭了。比如在雲計算上,就華為和阿里搶政府訂單打的頭破血流,阿里還為此還向相關部門投訴華為不正當競爭。
在發布會上,阿里高管直接給華為雲、騰訊雲安上「拿來主義的雲」標籤,以顯示阿里飛天雲「自主可控」,高華為雲一等,彼此間的暗戰和矛盾顯而易見。
在這種情況下,要讓阿里做出巨大犧牲去扶持自己競爭對手的ARM伺服器的可能性並不高,特別是阿里麾下的中天微已經押寶RISC-V,扶持中天微完善RISC-V的生態顯然比扶持競爭對手更符合阿里的商業利益。
5年後會怎樣,鐵流不敢說,至少在當下,一些媒體無限吹捧ARM伺服器CPU的商業前景是非常不客觀的。
從市場反應來看,真正衝擊Intel的並非是各路ARM,還是同屬X86陣營的AMD,原因就在於之前提到的三個因素:性能、價格、生態,AMD達到了門檻,而華為等ARM陣營廠商還遠未能及格。
華為ARM伺服器可能會走IBM大機器的商業模式
關於高通ARM伺服器業務大裁員,有網友表示,高通直接賣晶元,華為既做整機,又賣晶元,可以像麒麟晶元和手機業務那樣起到相輔相成的作用,所以高通會失敗,華為能成功。
不知道是不是高通手機晶元業務直接賣晶元讓人先入為主了,其實,高通的ARM伺服器業務並非像Intel、AMD那樣直接賣散片,也是定做主板後整機出售這種模式。
另外,麒麟晶元能夠起來的關鍵是安卓有完善的生態,而且可以從ARM那裡買到非常具有市場競爭力的CPU和GPU。但在ARM伺服器方面,ARM自己的IP相對於Intel不具備競爭力,在生態上也被X86秒殺,ARM的生態只局限於嵌入式、智能手機,華為要推ARM伺服器,就要自建生態,難度遠非在做手機晶元可比。
而且即便做成了,也存在一個悖論,那就是既然自建生態,那麼為何不做中國版Wintel,反而給ARM打工,為ARM做嫁衣?
何況,現階段的ARM伺服器CPU本身就是缺乏市場競爭力的,正是因此,在政府採購名錄中,可以看到各種ARM伺服器的身影,華為在將買A57做集成和買A72做集成的晶元打入政府採購名錄後,鯤鵬920有可能也將進入政府採購名錄。
從實踐上看,RISC伺服器中的Alpha、SPARC、PA-RISC等基本消亡了,如今還有聲響的就是IBM的伺服器,而IBM的大機器是高度依賴美國政府等對價格極度不敏感的客戶訂單來維繫的。在商業市場上,面對廉價的X86伺服器,IBM的機器缺乏競爭力。面對困境當年郭士納的改革就是「砍砍砍、賣賣賣」,裁員、砍研發、砍機構,賣業務、賣技術、賣大樓,如果不是價格太貴,沒有客戶願意買,差點就搶在索尼和AMD之前實現了超級企業賣大樓。在砍掉很多業務後,郭士納選擇了購買X86晶元做伺服器,也是就是後來聯想從IBM買來的業務。
可以說,歷史已經證明了X86的橫向整合模式在成本上相對於IBM、SUN、惠普、SGI、DEC的垂直整合模式具有天然的成本優勢,華為如今的做法無非是重走一次IBM、SUN、惠普、SGI、DEC走過的大坑,順帶把自己的資金和國家資源拉過來填坑。
時至今日,IBM的Power越來越被邊緣化。正是因此,IBM搞了OpenPower,但還是無法逆襲。可以說,華為的ARM伺服器CPU未來幾年的商業模式會和IBM的大機器類似,高度依賴政府、國企等受政策指令因素影響極大,且對價格不敏感的客戶的訂單。
ARM會扼殺中國版Wintel的成長
鐵流以前的文章中說過,黨政國企市場是中國版WIntel 的孵化池,最好是SW+自主內核的操作系統。由於現實中不存在自主內核的操作系統,那麼只能退而求其次,以SW+BSD/Linux構間中國版Wintel。
而一旦ARM大肆入侵,獲得國家資源傾斜,那麼就會擠壓中國版Wintel的生產空間。何況,ARM的安全風險不容小覷。
在2015年,集成電路大基金注資中興微電子24億人民幣,中興也喊出了「中興訊龍芯+中興OS」的口號,CPU上選擇加入ARM陣營,中興OS則選擇和谷歌合作開發。之後開發了好幾款集成了A53和A72的機頂盒晶元。
結果在2016年和2018年兩次制裁中,由於ARM加入制裁,台積電拒絕給中興的ARM晶元代工,然後中興把訂單給境內晶圓廠,但境內晶圓廠也不敢接單,據中興員工披露:當被中芯國際拒單時,才意識的問題的嚴重性。中興微電子的ARM晶元隨即休克。
前不久,日本軟銀封殺了華為的通信設備,由於日資企業唯美國政府馬首是瞻,當華為的ARM伺服器業務做到通信設備的市場地位之際,沒準軟銀又來一個封殺。
何況現在直接就上伺服器晶元,本身就存在問題。
業內人士表示:
國內晶元的商用發展應該是先做各種嵌入式芯、類手機等量大面廣的晶元,然後是類樹莓派等開發板晶元,然後是桌面,最後是伺服器晶元。現在一大堆公司,仗著國家政策和核高基補貼,直接就上伺服器CPU,力圖在這個領域和Intel在商業市場競爭,錯的太離譜了,實屬不智。
鐵流認為,當下發展國產CPU,就兩條路,一條是純自主路線,就是自主指令集,自主CPU,自建生態之路,典型的代表是SW。另一條是純粹技術引進路線,引進國外最頂尖技術,有完善生態,產品可以直接造血的路線,這條路線就像合資車廠,雖然對自主可控毫無意義,但至少能造血,是現金奶牛。
而像ARM這種折中路線,在實踐中會非常尷尬,就自主性而言,不能和SW比,而且始終存在安全風險,當年的「一芯一系統」變成「三芯多系統」就折射出相關部門對ARM的深切憂慮和不安。就商業市場而言,ARM路線又不具備造血能力,如果沒有國家兜底,純商業市場必然悲劇,高通就是前車之鑒。因此必須要政策、要扶持,要國家資源傾斜,而這時候又會有一個悖論,那就是與其用國家資源扶持ARM,為何不去扶持SW?
這裡再說明一下鐵流為何對ARM伺服器不看好:
1、ARM伺服器不像ARM手機晶元有完善生態,需要自己耗費巨資開荒,前期鐵定賠錢,即便做成了也是為ARM做嫁衣。就自建生態而言,為何不給SW建生態?
2、由於國內ARM伺服器CPU公司由很強的政商關係,可以拿核高基01專項,各種國家政策扶持和國企採購,這樣一來,等於是動用國家資源補貼ARM和軟銀建生態。
3、ARM具有很強的欺騙性。相對於X86這種明眼人一看就知道不可能自主可控的晶元,ARM被廣泛包裝和鼓吹為實現自主可控的有效途徑,而且已經打入政府採購,獲得越來也多的國家資源扶持,加上一些企業輿論引導很強,曝光率很高,ARM已經被包裝為自主可控的希望之光。一位業內人士就表示:華為造勢,XX立項,咱們跟上,分肉吃。相比之下,X86幾乎是過街老鼠,不具備欺騙性。鐵流不希望國家資源被一些廠商動用政商關係綁架,在ARM的歧路上一路狂奔。
4、按照現在的態勢,加上軟銀成立合資公司試圖在股市割韭菜並包裝為技術轉讓,ARM有可能成為事實上的國家指令集,中國版Wintel可能會被ARM這個特洛伊木馬扼殺於萌芽狀態。而且ARM既不安全,也不可控,中興前車之鑒歷歷在目,勿使後人復哀後人也。
※華為晶元研發麵廣 折射出華為的成功與短板
※鯤鵬920華為自主設計?還是基於ARM公版修改
TAG:鐵流 |