當前位置:
首頁 > 科技 > 【原創】PVRIC:降低內存帶寬

【原創】PVRIC:降低內存帶寬

原標題:【原創】PVRIC:降低內存帶寬


由於屏幕解析度的提高以及越來越複雜的渲染管道,使得遊戲和其他應用對於帶寬的要求也越來越高,大量的數據需要從內存拷貝或者寫入。現在用戶普遍認為在無其他特殊情況下設備應該能夠支持2K的屏幕解析度,高端遊戲則具有更大的幾何複雜性,真正在屏幕上顯示圖像之前渲染管道通常要涉及多個中間渲染目標。即使一些休閑類遊戲也可能具有一些全屏後的處理效果,需要幀緩存數據從片外存儲器中讀取和寫入。內存訪問是非常消耗功率的,佔用帶寬越大功耗則越高,這對於功率預算緊張的嵌入式系統尤其是個棘手的問題。


PowerVR GPU採用 PVR3C三重壓縮技術來解決這個問題,這三重壓縮解決方案包括紋理壓縮(涉及PVRTC和ASTC)、幾何壓縮(PVRGC)和本文的主題圖像壓縮(PVRIC)。


PowerVR圖片壓縮(PVRIC)


如上文所說,在現代實時圖形應用中內存帶寬的最大壓力之一就是生成高質量圖像所需的大量中間渲染對象。一個明顯的例子就是創建立方體環境貼圖( cube maps),通常用於反射效果。這包括從一個不動點向六個方向渲染一個場景,最後結果會形成一個立方體的貼圖紋理,然後對場景中的對象進行類似反射的採樣。其他示例包括解析度縮放、渲染小地圖或其他場景視點、渲染平面反射貼圖,更不用說無盡的屏幕空間和後期處理效果了,比如可分離模糊處理、 SSAO、 景深效果以及色調映射等。


一個立方體貼圖的六個面可用於汽車上的近似反射,在汽車的窗戶上可以看到天空的倒影。


PVRIC通過高效、無損的壓縮方案大大降低了內存帶寬成本,這種壓縮方案通常會使得圖像大小減少50%(依賴於很多元素)。前文提到的目標渲染在寫入GPU之前就進行了壓縮,然後從內存中讀取時會被解壓,因為這種壓縮是無損的,所以可以從解壓數據中重構得到完美的原始圖像,這也意味著圖像的質量不會降低。



上圖展示了與GPU的所有交互,但更有利的是這有可能會將PVRIC技術集成到SoC級別的顯示管道中,使得最終的渲染圖像在寫入內存之前會進行壓縮,然後在顯示控制器中進行解壓,這將更有效地節省總體帶寬。


在許多移動遊戲和App中,紋理資源通常都會採用眾所周知的格式進行壓縮,比如 ETC、PVRTC等,但是開發者會選擇保留一部分未經壓縮的紋理資源,比如字體或UI紋理,這些紋理在縮放時需要保持清晰和不失真。PVRIC方案的另一個好處是它允許將相同的無損壓縮應用到任何未經壓縮的紋理上,然後上傳給GPU(如果紋理使用的是多種被支持的格式之一),根據不同的應用,這可能會帶來更大幅度的帶寬減少。

應用帶寬分析


我們在Synaptics BG5CT板卡(集成 PowerVR Series8XE GE8310 GPU,它採用了最新一代的PVRIC技術——PVRICv3)上運行API trace測試了多款流行的應用,我們看到了這種壓縮方案所帶來的性能提升,尤其是帶寬消耗的顯著降低。


下面的視頻展示了不同應用的實時分析效果,並提供了實時帶寬佔用情況:



下面的表格展示了不同應用的測試結果,需要注意的是,在這款器件上PVRIC並沒有集成到SoC的顯示管道中,如果集成了那麼我們將會看到最後的幀緩存圖像會有更好的壓縮效果,正如前文所述。因為我們使用的是安卓平台,幀緩存壓縮會應用到最終的渲染操作,Android SurfaceFlinger會將這些壓縮幀寫入內存,讀取到GPU中。如果是這樣,那麼SoC顯示管道也將受益於SurfaceFlinger的最終合成結果。


那麼這些結果到底意味著什麼?這些數字可能有點兒誤導人。我們可以清楚的看到所有應用佔用的總帶寬都有所減少,但有些應用比其他應用帶寬的降低程度要大得多,正如上文所提到的PVRIC技術涵蓋了紋理的渲染和解壓縮,但這只是總帶寬的一部分,幾何圖形、著色器等等也會佔用一定的帶寬,但是它們並不會受PVRIC操作的影響,所以對於整體帶寬的佔用情況我們能做的只是降低,雖然系統範圍內的數據保持在較高的水平,但是我們想隔離受PVRIC影響的相關帶寬參數,藉助我們的內部分析工具可以讓我們更精確的完成這些操作(雖然我們不能消除一切——比如紋理壓縮)。


在這裡,我們隔離的只是GPU在執行渲染操作時佔用的帶寬,而忽略了貼圖操作所需要的幾何處理。為了簡化這一過程,測試平台上已經禁止了這些任務的重複。我們還能夠識別和忽略其他進程的任務,現在我們需要分析為什麼有些app會那樣運行,這需要我們了解app是如何在圖形API層工作的,不妨深入了解一下PVRTrace。


《minecraft》(《我的世界》)


我們使用PVRTrace對Minecraft這款應用進行分析,我們發現總體帶寬節省率比較低(大約2.42%),但是隔離圖片/紋理帶寬方面顯示帶寬節省率則更高(大約17.76%)。Minecraft採用的是完全未壓縮的紋理技術,因此PVRIC的效果比較顯著,儘管這與典型場景中幾何圖形的數量(大約13萬4千個三角形)相比非常的少,更不用說很多紋理的尺寸非常的小,PVRIC只是完成了它所能實現的,但是對於Minecraft並沒有太多的事情可以做。請記住:通過集成到顯示管道中,我們可以看到發送給顯示控制器的幀緩存更好的優化效果。


《憤怒的小鳥 2》



在憤怒的小鳥 2這款應用中,幾何圖形(1萬6千個三角形)和紋理內容各自佔用的帶寬比例則更協調一些,因此我們能夠更加清晰的看到PVRIC所帶來的好處,系統整體帶寬節省43%,隔離帶寬節省56%。這款遊戲既採用了壓縮的紋理格式也採用了一些未壓縮的紋理格式,因此PVRIC非常起作用。此外,整個場景在進行最終的展示之前會採用渲染中間件的形式(很多應用都使用這種技術來處理解析度縮放或後續處理操作),這兩種因素的結合對於PVRIC技術是很好的展示。


《真實賽車 3》



真實賽車3是另一款使用大量幾何圖形(測試時顯示16萬個三角形)的應用,而且紋理/曲面也佔用了相當一部分的帶寬。紋理壓縮技術(PowerVR的PVRTC技術)在這款應用中被廣泛採用,這非常棒,但是還有很多未壓縮的紋理需要藉助PVRIC技術來處理,此外還涉及一組512 x 512的立方體環境貼圖和全屏幕紋理渲染。最後的百分比可能不太明顯,但是這很好的展示了PVRIC與PVRTC相結合所帶來的好處,PVRTC可用於處理大部分的紋理,PVRIC則用於處理其他內容。


從這些工作負載中可以看出,無論圖像數據是否佔用應用程序的大部分帶寬,採用PVRIC技術後都會帶來顯著的影響,在很大程度上減少了圖像佔用的帶寬。


功耗分析


為了能夠更清楚的了解PVRIC技術和降低帶寬對於功耗的影響,我們修改了平台,使其支持功耗分析並連接了數據採集設備從而可以收集一些功耗數據,下面的圖表就是我們的發現:



在憤怒的小鳥2同一段5秒的運行過程中,我們發現:使用PVRIC時內存的功耗會更低一些,採用兩組數據之間的差值並進行平滑處理,我們發現內存功耗降低了18%。這個效果非常的顯著,對於採用電池驅動的設備比如移動手機可以在充電之前使用更長的時間,當然對於功耗和電池壽命的影響還有很多其他因素,而且不同設備之間也會有所差別。



總結


總而言之,PVRIC技術是PVR3C壓縮策略關鍵的組成部分,對於使用的帶寬來說其壓縮比可高達(有時甚至超過)2:1。這會對設備存儲器的功耗產生實質性的影響,通過對我們紋理和幾何壓縮方案的測試,很明顯可以得出PVR3C是全面的帶寬效率方案,能夠從整體上提高系統的效率,從而讓我們能夠實現更加全面的低功耗解決方案。


原文鏈接:https://www.imgtec.com/blog/reducing-bandwidth-pvric/


聲明:本文為原創文章,轉載需註明作者、出處及原文鏈接,否則,本網站將保留追究其法律責任的權利

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 ImaginationTech 的精彩文章:

PowerVR開發工具和SDK 2018 Release1正式發布!
Imagination參加2018嵌入式視覺峰會

TAG:ImaginationTech |