龍芯3A3000 CPU深入實測!等同2013年低功耗賽揚
國產自主技術的重要性,如今體現得越來越明顯,尤其是在高性能半導體領域,我國正在全力奮起直追,面臨的困難和挑戰很多,取得的成果也不少,一方面需要繼續加大馬力,另一方面也需要予以肯定和支持。
在高性能CPU處理器領域,Intel、AMD是我們最熟悉的兩個名字,還有企業級的IBM。我國也在不斷投入,相關企業並不少,但由於高性能CPU的特殊性,門檻極高,目前只能採取引入授權再發展的方式,而性能距離世界頂級水平還有極大的差距,只能一步一步縮小。
龍芯是起步較早的國產CPU之一,而且早就已經完全獨立自主研發和經營,不拿國家一分錢資助。龍芯走的不是我們日常熟悉的x86指令集,而是MIPS指令集體系,所以更多應用在一些特殊行業領域,消費級市場上也有但不多見,還處在生態建設的初級階段。
目前,龍芯已經發展出了多個龍芯產品家族,其中針對桌面市場的最新產品是龍芯3A3000。
想必大家一定很想知道它的性能到底如何吧?之前也陸續見過一些官方非官方的性能數據,但都很零散。最近,有龍芯愛好者對龍芯3A3000做了一次全面的實際性能測試,並發表在龍芯社區,這裡節選一部分來看看(略有修改)。
據介紹,這套測試平台是去年9月份龍芯俱樂部搞龍芯3A主板團購時買的,自行搭建,測試工具為phronix-test-suite,儘可能理性、中立、客觀、全面,不吹不黑,不誇大成績,也不迴避問題。
龍芯3A3000主板照片,風扇下面是龍芯的CPU。另外兩塊散熱片下面分別是南橋和北橋。
拆下風扇後的龍芯3A3000近照。LS3A3000D-LP的編號代表這是一個低功耗版本的龍芯3A3000。
開機後BIOS:可以看到CPU的主頻是1400MHZ,一級指令緩存64KB,一級數據緩存64KB,二級緩存4MB。
主板上的國產Unilc(西安紫光國芯半導體)內存條。
龍芯3A3000規格表
龍芯3A3000頻率最高1.5GHz,這裡測試的是1.4GHz版本,因此最好性能應該比以下測試的再高出5%左右。
此外需要說明的是,龍芯3A3000筆記本裡帶的龍芯3A3000的主頻被限制在了1.2GHZ。
規格對比
性能測試基本環境
龍芯3A3000處理器性能測試
測試是在Linux系統上進行的,很多測試內容都偏重CPU理論性能測試,跟大家熟悉的Windows下CPU性能測試不同,具體原理就不贅述了,大家只要看看結果和對比就行了。
測試對比型號除了Intel酷睿i5-7200U、賽揚J1900,還加入了同樣國產的處理器、來自飛騰的FT-1500A、FT-2000+。
i5-7200U是Intel第七代酷睿移動平台的低壓低功耗版本,14nm工藝,雙核心四線程,主頻2.5-3.1GHz,集成核顯HD 620,熱設計功耗15W。
賽揚J1900則是一顆超低功耗的移動產品,隸屬於Bay Trail家族,2013年就發布了,22nm工藝,四核心四線程,主頻2.0-2.42GHz,集成核顯HD Graphics,熱設計功耗10W。
作者的結論:
從縱向上看龍芯的發展,相比龍芯2F,龍芯3A3000的性能有了很大的進步。工藝上,從龍芯2F的90nm,提高到了龍芯3A3000處理器的28nm;主頻從龍芯2F的800MHZ提高到了1.5GHz。
在用戶實際應用上,基本可以達到流暢使用的程度。與Intel處理器相比,龍芯3A3000綜合性能相當於Intel賽揚J1900,單核性能相當於i5-7200U的30%~40%。
通過本文中所進行的34項測試,我們發現龍芯3A3000在性能不好的根源有以下幾個:
同主頻性能較弱
從同主頻性能來看,龍芯3A3000已經超過了J1900,但只有Intel i5-7200U的60%~70%。預計2019年流片的龍芯3A4000同主頻性能至少有30%的性能提升——那樣就能達到i5-7200U的80-90%。
主頻太低
這是龍芯處理器讓眾多愛好者耿耿於懷的的一個難以迴避的弱點。誠然,主頻不代表所有性能,但主頻太低是萬萬不行的。
J1900的同主頻性能弱於龍芯3A3000,但由於它的主頻可以到1.99GHz,並且還可以睿頻到2.4GHz,在多項測試中一樣超過了龍芯3A3000。
i5-7200U基礎主頻達到2.5GHz,睿頻可以到3.1GHz。飛騰2000+主頻可以到2.2GHz,而兆芯的KX-6000主頻甚至可以到3.0GHz。
飛騰、兆芯處理器可能在同主頻性能上弱於龍芯,但還是可以靠著較高的主頻擊敗龍芯3A3000。
龍芯主頻較低的原因之一是落後的工藝製程,目前還在使用28nm工藝,而Intel、飛騰、兆芯等已經在使用14nm工藝。
根據龍芯的發展規劃,到2020年龍芯將使用14nm工藝對了龍芯3C5000進行流片,主頻能夠達到2.5GHz。
系統軟體優化不夠
在測試中,我們發現的問題有三角函數等數學函數運算速度過慢,看起來部分硬體浮點運算的沒有得到應用,而且龍芯缺少一個優化的數學函數庫。在加密解密指令上,缺少AES硬體實現。
在測試中,我們發現使用Debian操作系統、GCC7.3和1.4GHz的龍芯3A3000進行的各項測試基本優於使用Loongnix操作系統、GCC4.9編譯器和1.5GHz龍芯3A3000的組合。
我們認為編譯器的優化對發揮龍芯的性能非常重要。
在測試中,我們也發現使用4.14的Linux內核會比3.10的Linux內核上有相當程度的性能提升,龍芯依然缺少優化的Linux內核。
應用軟體優化不夠
由於MIPS架構缺少軟體生態,各種應用軟體缺少針對MIPS架構的優化。具體表現就是在很多軟體有針對X86系統的彙編優化。
要建立龍芯的生態,發揮龍芯處理器的性能,相同級別的優化不可缺少。隨著龍芯未來架構的優化、主頻的提升,影響龍芯發展的瓶頸將不是處理器的性能,而是軟體生態的建設,也就是系統軟體優化以及應用軟體優化。
其中,各種應用軟體的優化將是提升龍芯用戶體驗的捷徑。實際上,龍芯也已經意識到了這些問題,提出了要學習蘋果「app by app, feature by feature, pixel by pixel」地進行優化。