加速器的盡頭:後摩爾定律時代下的新問題
放眼未來,專用晶元與電路可能無法拯救整個計算機行業。
時至今日,加速器早已無處不在:世界上的比特幣大多由用於加速加密貨幣核心演算法的晶元採礦得來,幾乎每一種能夠發出聲音的數字產品都在使用硬連線音頻解碼器;而且當前亦有數十家初創企業在探索速度更快的專用晶元,旨在真正推動深度學習AI實現普及。這種專用化趨勢,使得各類原本運行在通用CPU之上的軟體及其內部常見演算法得以在定製化硬體上帶來更快的處理速度。但必須承認,從悲觀角度來講,這也是摩爾定律失效之後,我們能夠在接下來一到兩代晶元當中繼續驅動計算能力保持增長的少數可行方法之一。
但更遺憾的是,這種過渡性方案也即將走向終點——至少將有不久的將來耗盡一切潛能空間。普林斯頓大學電氣工程學副教授David Wentzlaff和他的博士生Adi Fuchs即將在本月IEEE國際高性能計算機架構研討會上就這一研究方向提出重要結論。根據他們計算出的結果,晶元專用化無法帶來與摩爾定律相契合的性能收益。換句話說,加速器的發展即將向已經開始萎縮的晶體管那樣走向盡頭,而且這一切的來臨都要遠早於人們的預期。
為了證明他們的觀點,Fuchs與Wentzlaff首先需要弄清楚近期晶元中表現出的性能提升之內,有多大比例來自晶元專用化調整,又有多大比例源自摩爾定律本身。這意味著他們需要檢查1000多份晶元數據表,同時弄清這些不同型號處理器中的哪些性能組成部分源自更好的演算法,又有哪些由更巧妙的電路實現方法所貢獻。更具體地講,他們希望把這段時間半導體行業內的人類聰明才智進行一番量化統計。
為了實現這一目標,他們採取了工程師最擅長的方法:將問題轉換為無量綱量。他們將其稱為晶元專用化回歸,並希望藉此解決這樣一個問題:「晶體管的計算能力在晶體管自身的固體物理潛能空間中還有多大的改善餘地?」
利用這一指標,他們評估了特定應用集成電路(簡稱ASIC)上的視頻解碼性能,在GPU上測試遊戲幀率,在FPGA上測試卷積神經網路並在ASIC上嘗試比特幣採礦。然而,得出的結果令人相當沮喪:專用晶元的增益在很大程度上仍然源自每平方毫米內可用晶體管數量的增加。換句話說,如果沒有摩爾定律的支持,晶元專用化本身並不能帶來顯著的性能提升。
因此,如果專用化無法給出理想的答案,那麼未來的出路在哪裡?Wentzlaff建議半導體業界學習使用那些能夠在邏輯停止時仍可實現擴展的事物進行計算。舉例來說,每平方厘米內的可用快閃記憶體bit數能夠不斷增加,這與摩爾定律無關,因為業界已經開始能夠製造出256層甚至更高單元層數的3D堆疊技術。Fuchs與Wentzlaff已經開始就這一方向展開探索,他們希望開發出一種新的計算機架構,通過讓處理器查找存儲在內存當中的原有計算結果(而非重新進行計算)來加快計算速度。
Wentzlaff最後總結道,摩爾定律的終結「並不是世界末日。但很明顯,我們仍然需要為此做好準備。」
※鵬博士為雲布局,擴張提速
※2018戴爾易安信伺服器年度總結
TAG:至頂網 |