當前位置:
首頁 > 科技 > 科技年輪|縫縫補補又三年——聊聊AMD GCN顯卡架構史(下)

科技年輪|縫縫補補又三年——聊聊AMD GCN顯卡架構史(下)

上周五我們聊到了AMD是如何痛定思痛,大刀闊斧地改掉了沿用已久的VLIW架構,傾力研發出了「浪子回頭金不換」的GCN架構(戳我傳送),不過由於篇幅所限,只給大家分析了GCN1.0的架構以及相應的顯卡。那麼這周五,就讓我們繼續聊聊GCN接下來的三代吧~

還是老規矩,在梳理GCN歷代架構之前,先放匯總表:(感謝微信昵稱為emmmmmmm的粉絲補充的RX540)

科技年輪|縫縫補補又三年——聊聊AMD GCN顯卡架構史(下)

註:圖片較大,大家可以保存後查看。

(本表包含了HD7970以來的所有AMD GCN架構顯卡,截至Polaris架構RX系列。由於VEGA織女星架構至今只有VEGA64/56流出,本表將暫時不涉及,待VEGA系列全面鋪貨後再行更新。)

P.S:上一期GCN架構史發出來後,有粉絲補充RX540也是張馬甲卡,於是小天哥就去搜索了一番……結果就是AMD放著好好的Polaris12核心不動刀,非得把7年前的Cape Verde PRO再拿出來炒一次冷飯……於是就出現了RX550與RX540完全同規格(512SP 128bit)但是架構卻整整差了7年(14nm VS 28nm)的這一幕;當然Cape Verde PRO也終於將Pitcairn XT斬於馬下,「榮歸」AMD<史上最強馬甲>稱號。

- 3 -

GCN2.0:悄然發布,初見頹勢

▌「我們中出了一個叛徒!」

時間回到2012上半年,HD7970橫空出世,帶著GCN的輝煌一起走進了廣大玩家的視野。與此同時,HD7870/7850、HD7770/7750也紛紛登場,在不到半年的時間內就一鼓作氣從高端到低端迅速完成了市場布局。但是問題依然存在:HD7950的1792SP與HD7870的1280SP之間有較大的性能差距,這種差距同時也存在於HD7850的1024SP也與HD7770的640SP之間。半年過去了,2012下半年,GTX650Ti的發布像一把利刃,扼住HD7770的喉嚨的同時,也讓HD7850惶惶不可終日。終於,經歷了一年沉寂的AMD在2013年初搬出了HD7790,彌補了性能空檔,來應對GTX650Ti的攻擊。

但是緊接著,大家發現HD7790並不像之前的HD7890(HD7870XT)一樣,直接將高一等級的核心閹割一刀;而是一個全新的核心:Bonaire XT。

科技年輪|縫縫補補又三年——聊聊AMD GCN顯卡架構史(下)

從圖片上來看,好像HD7790跟GCN1.0核心的HD7970核心沒什麼不同,僅僅是閹割了顯存控制器以及幾組GCN單元而已——其實不然。HD7790畢竟是一個低端核心,要比也應該跟HD7770比較:

科技年輪|縫縫補補又三年——聊聊AMD GCN顯卡架構史(下)

從上兩圖的紅框中可以看出——原本應作為低端顯卡的HD7790,卻像HD7970一樣配備了雙發射的架構!僅僅這一點小小的改變,便註定了它與GCN1.0的不同,同時也預示著GCN2.0的完全體——R9 290X的恐怖:

科技年輪|縫縫補補又三年——聊聊AMD GCN顯卡架構史(下)

▌千呼萬喚始出來,可惜是個大火爐

沒錯,R9 290X果然延續了架構方面的準則,兩倍於R7 260X(HD7790),採用了四發射的架構。與此同時,引入許多新的功能性改變:例如全新的無橋交火引擎,使得從GCN2.0開始,交火不再受CFX金手指的約束;引入TrueAudio DSP單元,進一步深化了廣大玩家心中「A卡音質好」的印象。

特別注意到的是,在嘗到支持指令亂序執行的ACE單元帶來的甜頭後,AMD在GCN2.0中直接將ACE單元暴增至8個,每個單元可執行8個計算隊列;而上代的HD7970是2個ACE單元,每個單元可執行2個計算隊列。因此Hawaii每周期可執行的指令數目暴增至Tahiti的16倍之多。

科技年輪|縫縫補補又三年——聊聊AMD GCN顯卡架構史(下)

可惜由於採用了512bit的顯存位寬,公版散熱器並不能壓制其所帶來的巨大發熱,因此市場上不僅各種非公版三風扇大行其道,甚至眾多玩家拿到R9 290X的第一件事情便是上水冷改造。而半年後推出的R9 295X2也「不負眾望」地採用了公版水冷散熱的方案……這種巧合,真不知是該喜還是該憂啊。

▌「然後呢?」

2013年底,玩家們興沖沖的等到了R9 200的時代,卻失望的發現除了Hawaii核心的R9 290 / 290X,剩下的所有型號均是馬甲!R9 265 / 270(X)換了個核心名稱,本質還是GCN1.0;R9 280 / 280X更是連核心名稱都不換,直接披掛上陣;就算是GCN2.0的R7 260X,也僅僅是相對於HD7790加入了無橋交火等新功能而已。玩家們不禁在問:然後呢?

時間到了2014年初。旗艦級別的R9 290X,性能也僅介於GTX Titan與GTX780Ti之間。而NVIDIA卻發布了一個新的顯卡:採用GM107核心的GTX750(Ti)。大家意外的發現,NVIDIA新的Maxwell核心居然有著如此優秀的能耗比!大家不禁開始期待Maxwell的完全體。反觀AMD這邊呢?流處理器越來越多,註定要吃更多的顯存位寬;而512bit的位寬卻已經是板載顯存的極限,更快的下一代GDDR6又遙遙無期。在GCN主旋律不變的基礎上,如何才能進一步「堆料」,重新拿回單芯性能王座呢?

- 4 -

GCN3.0:時運不濟,命途多舛

▌出師不利——完整版Tonga胎死腹中

時間來到了2014下半年。距離R9 200系列全面補完已經過了小半年時間,沉寂已久的AMD感受到了來自即將發布的GTX980的壓力,搶先發布了R9 285顯卡,想搶佔一波甜點級顯卡的市場。1792個流處理器,256bit的位寬,像極了當年的HD7950——沒錯,基於新一代GCN3.0的Tonga核心,就這樣來到了我們的面前。

科技年輪|縫縫補補又三年——聊聊AMD GCN顯卡架構史(下)

可是從核心圖上,我們卻明顯看到了一些端倪:這完全不是完整版的Tonga嘛!而且下方的顯存控制器也告訴我們,它的完整版是一張384bit的顯卡,2048SP,3或6GB顯存——也就是HD7970最正統的後代!於是,廣大玩家抱著期待的心情,等著完整版Tonga加持的R9 285X——因為R9 285的出現,讓玩家們看到了GCN架構的潛力:經過優化後的架構不僅單位SP性能提升,功耗也降到了單卡190W,只需雙6pin即可滿足。

可就在大家幻想R9 285X的時候,GTX980 / 970橫空出世,強大的性能直接讓本想對位GTX970的R9 285,一夜之間放低了身段去打GTX960,還將將打了個平手。於是,完整版的Tonga XT(R9 285X)直接被AMD摁死在了工廠里——更多的顯存控制器雖然帶來了更高的帶寬,但也帶來更高的成本;相比較出一張打不過GTX970,成本卻和其相差不大的顯卡,還不如直接放棄。作為GCN3.0架構首次出師征戰的兩員大將之一,就這樣折戟沉沙了。

科技年輪|縫縫補補又三年——聊聊AMD GCN顯卡架構史(下)

▌番外:流產兩年!AMD R9 285X神奇復活

但是!就在大家已經淡忘這張顯卡的2016年底,AMD都已經進入北極星RX時代時,國外的網友曝光了一張R9 285X——2048SP、384bit、3G的規格與當年的HD7970一模一樣!PCB編號也是AMD從未使用過的C765,足以證明這是神奇復活的R9 285X!可惜AMD已經沒有將其重新發布的意義,這張卡也僅僅是從工廠中流出,PCB、散熱等也均是公版方案。

科技年輪|縫縫補補又三年——聊聊AMD GCN顯卡架構史(下)

但幸運的是!小天哥在萬能的某魚收到了一塊,上面的GPUZ圖就是小天哥手裡這張R9 285X的圖。等VEGA32/28鋪貨以後,小天哥將為大家帶來GCN1.0(HD7970 / R9 280X)+ 兩種GCN3.0(R9 285X / 380X)+ GCN4.0(RX470 / 570)+ GCN5.0(VEGA32)四代架構、五張顯卡之間的同SP(2048個)、同頻率對比,來遍歷GCN走過的五代,為大家獻上一場GCN架構的縱向評測盛宴!

▌顯存界的金坷垃——HBM

讓我們回到主題,將時間再度拉回2015上半年。等不到GDDR6的AMD,將目標轉向了下一代顯存技術——HBM顯存。相比GDDR顯存,HBM將直接集成於片上,大幅減少由於PCB走線所導致的延遲;相對應的也帶來了及其可觀的顯存位寬。農企就像拿到了夢寐以求的金坷垃一樣,「GCN摻了HBM,流處理器隨便堆!」「GCN用了HBM,一片顯存能頂八片用!」

科技年輪|縫縫補補又三年——聊聊AMD GCN顯卡架構史(下)

但是,新技術的嘗試總要付出代價。HBM顯存的難產,直接導致了AMD旗艦級顯卡的跳票。然而GTX900系列的鋪貨,卻又讓AMD感受到了巨大的壓力。於是R9 300系列在2015年中,被AMD以全系馬甲的身份搬上了歷史舞台,在本文開頭的表格里可謂一清二楚。唯一稱得上「新卡」的R9 380X,也只是套用了Tonga完整版的2048個流處理器,顯存控制器依然被閹割成了256bit。

科技年輪|縫縫補補又三年——聊聊AMD GCN顯卡架構史(下)

終於,一個月後,AMD的新旗艦R9 Fury系列登場。得益於HBM顯存的超高帶寬,AMD乾脆一鼓作氣將Fiji核心堆上了4096SP的超強規格。同時也得益於使用了HBM顯存,節省了GDDR顯存的布線,R9 Fury系列的PCB完全可以做到17cm的ITX規格。因此R9 Fury Nano橫空出世,一時間風光無兩,被冠以「小鋼炮之王」的稱號;頂級的Fury X乾脆也直接上水冷,只將次旗艦R9 Fury開放給了各大AIB廠商做非公版。GCN3.0終於迎來了最強、也是最後的三員大將。

科技年輪|縫縫補補又三年——聊聊AMD GCN顯卡架構史(下)

2015年就在Fiji的光環中落下了帷幕。最強ITX小鋼炮也有了,4096SP的巨無霸也有了,HBM的存在也讓AMD不再擔心顯存位寬頻來的瓶頸……一切都好似順風順水的發展著。然而,AMD的架構師卻依然坐立難安:4096SP的規格已經是GCN架構的極限,HBM顯存也足夠餵飽這顆性能怪獸,在核心和顯存都已經得到了完全的性能發揮後,將來的路該怎麼走?

- 5 -

GCN4.0:14nm加持,涅槃重生

▌比你小,還比你強!

2016年註定是不平凡的一年。年初,AMD的女朋友Global Foundry的14nm製程就宣布流片成功,這讓AMD看到了未來的希望:從28nm升級到14nm,這簡直可以說是質的飛躍!既然架構上已經遇到了瓶頸,那我們就用製程來湊!

終於在半年後,我們看到了RX480,也是首張14nm的顯卡。在GCN3.0的基礎上小改了一波GCN單元的結構,再加以一些Liquid VR、HDR技術、原生DX12支持等新特性,就這樣與大家見面了。

科技年輪|縫縫補補又三年——聊聊AMD GCN顯卡架構史(下)

從圖中我們可以看到,精簡後的顯存控制器由每路控制64bit精簡為32bit,這樣保持8路顯存控制器不變的同時,可將總位寬降至256bit,大大減少了布線難度。GCN單元的結構也由R9 390X的4+4+3=11CU精簡為3+3+3=9CU,同時精簡了一半的ROP單元。但最重要的不是架構上的縫縫補補,而是在應用了14nm的工藝後,AMD將GCN4.0架構的核心頻率直接由歷代GCN的1050MHz左右拉升至1250MHz附近!這直接帶來了同SP下將近20%左右的性能提升,就算是ROPs以及SP單元相對R9 390X做出了精簡,RX480總體依然與R9 390X相平甚至略優。

AMD也深知無力對抗NVIDIA的頂級產品Titan系列,因此直接用田忌賽馬的策略對陣NVIDIA的GTX970、GTX1060。雖然發布後遭遇了從主板偷電、散熱不佳等一系列問題,但依然沒有阻礙RX480成為一張玩家心目中值得購買的顯卡。

▌沒有新卡怎麼辦,超超頻率又一年

後面的事情大家應該就比較熟悉了……AMD全力研發GCN5.0的VEGA系列,RX500系列就又搬出了全系RX400的馬甲作為新卡上市了。不過由於14nm製程的成熟,漏電率相比初期更低,因此RX580相比RX480頻率再高100MHz,來到了1350MHz附近。加之高頻率顯存的加持,帶來的相比RX480的提升也算是夠看。加之2017年適逢迪蘭恆進成立18周年,迪蘭就出了這麼一款全白的RX580 8G,也算是滿足了一眾顏值控的玩家們~

科技年輪|縫縫補補又三年——聊聊AMD GCN顯卡架構史(下)

雖然GCN4.0不算是一個多麼「嶄新」的架構,但至少是AMD從GCN1.0以來,第一次升級了製程來到了14nm;也是第一次從中高端到低端完全布局,避免了GCN2.0、GCN3.0時代「一塊新卡,全系馬甲」的這種尷尬局面。雖然Fiji核心R9 Fury系列的繼承者被織女星VEGA欽定,但是那畢竟是有錢人的玩具,GCN4.0能讓我們廣大的平民玩家享受到不錯的性能,就足夠了。大家說呢?

- 6 -

GCN5.0:總結與展望

GCN這個架構,從2011年研發到2012年發布,直到今年2018年都仍在歷史舞台上堅守。可是,伴隨著VEGA64(GCN5.0)的發布,4096SP的巨無霸核心、超高帶寬的HBM2顯存、14nm的新製程這三張救命牌已然被AMD打完,剩下的GCN架構該何去何從?難道要堆5120個流處理器?寄希望於HBM3顯存?抑或是使用7nm製程?殊不知,這些都是治標不治本的舉措——GCN架構,實在是太老了。就像當年的VLIW架構在X1900時代站上歷史舞台,卻在HD6000時代遭遇了折戟沉沙一樣,這期間是2006年到2012年的6年時間。GCN架構已經撐了7年,它也老了,也需要新一代的接班人來接過它的火炬,將AMD再度推上新的巔峰。

科技年輪|縫縫補補又三年——聊聊AMD GCN顯卡架構史(下)

雖然縱向對比GCN的歷代架構,不管用何種方式,性能總還在穩步地提升著;但是橫向比較隔壁的NVIDIA,Pascal、Volta的出現卻直接讓顯卡性能坐火箭一般上天。而由於AMD這邊的縫縫補補,老黃的手術刀又開始耍的肆無忌憚。我們太需要一個可以抗衡NVIDIA高端產品的存在了,一個不僅僅是堆料、超頻,而是真真正正涅槃重生的GPU架構。

科技年輪|縫縫補補又三年——聊聊AMD GCN顯卡架構史(下)

我們理解,作為一個在Intel和NVIDIA夾縫中生存的農企,無法做到同時兼顧GPU與CPU部門。GCN架構橫空出世的那年,FX系列處理器的多模塊設計遭遇了前所未有的滑鐵盧,高端市場盡失;而AMD對ZEN處理器的全身心投入,為我們帶來了一顆極其優秀的產品的同時,也讓GCN架構經歷了縫縫補補三年又三年的窘境。如今市值120億美元的AMD已不再是2015年市值連15億美元都不到的公司,17年4季度非固定資產營收的扭虧為盈也讓我們看到AMD正在崛起。

GCN架構已然到了耄耋之年,我們也衷心希望AMD能看到其中的不足,努力研發新的GPU架構,對人工智慧等並行計算領域提供更好的支持,爭取早日與NVIDIA抗衡。

最後,祝AMD翻身成功!AMD,Yes!科技年輪|縫縫補補又三年——聊聊AMD GCN顯卡架構史(下)

戳圖片傳送至往期精彩

科技年輪|縫縫補補又三年——聊聊AMD GCN顯卡架構史(下)

科技年輪|縫縫補補又三年——聊聊AMD GCN顯卡架構史(下)

科技年輪|縫縫補補又三年——聊聊AMD GCN顯卡架構史(下)

喜歡我們的推送別忘了點一個頂

向親朋好友推薦一下我們的文章

或者讚賞一下

我們下期再見啦!

科技年輪|縫縫補補又三年——聊聊AMD GCN顯卡架構史(下)

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 極客灣 的精彩文章:

浪子回頭金不換——聊聊AMD GCN顯卡架構史(上)
三款Mac新機即將到來,蘋果將推廣自研晶元

TAG:極客灣 |