越來(lái)越重要的GPU

在傳統GPU市場(chǎng)中,永遠都存在著(zhù)對更佳視覺(jué)用戶(hù)體驗的追求,包括更高的顯示分辨率、更新率和更佳的像素效果,所以很多設備都要求采用更佳的GPU。而在部分新興領(lǐng)域,GPU IP的應用同樣不可避免,比如VR/AR的成功就依賴(lài)于高質(zhì)量圖形性能,而且必須具備顯示功能。在這樣的領(lǐng)域中,沒(méi)有GPU是不行的,所以GPU應用延伸至這些行業(yè)也不足為奇。

但在Imagination業(yè)務(wù)開(kāi)發(fā)高級工程經(jīng)理Rys Sommefeldt看來(lái),更加有趣的話(huà)題是GPU在IoT和可穿戴設備等領(lǐng)域中的應用。這些應用雖然也可能具有顯示性能,但其分辨率需求低,CPU就足以實(shí)現相應的性能。有些設備甚至可能都沒(méi)有顯示功能,比如海量的IoT產(chǎn)品和服務(wù)器應用等。

GPU的利用往往取決于以下兩個(gè)關(guān)鍵因素:功耗以及CPU無(wú)法滿(mǎn)足的計算性能需求。Rys Sommefeldt認為,對于具備顯示功能的可穿戴設備(例如智能手表),使用GPU可在滿(mǎn)足性能需求的同時(shí)降低設備功耗,從而改善可穿戴設備中最重要的因素—電池壽命;而對于沒(méi)有顯示功能的應用來(lái)說(shuō),使用GPU基本意味著(zhù)設備有相應的計算需求,而這些需求與GPU架構和它的運行方式高度契合。在這些應用場(chǎng)景中,對像素的追求并不是使用GPU的主要目的。

“圖形密集的游戲、動(dòng)畫(huà)和應用已經(jīng)成為消費者移動(dòng)體驗中的重要部分,視覺(jué)互動(dòng)是他們與所依賴(lài)的移動(dòng)終端之間的主要聯(lián)系界面,而圖形正是該界面的核心。”Qualcomm產(chǎn)品市場(chǎng)總監王宇飛說(shuō),這正是為什么一體化設計的驍龍處理器中包含Adreno GPU的原因,因為它能加速復雜幾何結構的渲染,從而在低功耗下提供相片級逼真的圖形和豐富的用戶(hù)體驗。20161028-GPU-3Qualcomm 產(chǎn)品市場(chǎng)總監王宇飛

集成于驍龍820處理器中的Adreno 530是Qualcomm迄今為止所設計的性能最佳的GPU,可用于智能手機、無(wú)人機、機器人等眾多領(lǐng)域。例如,Qualcomm驍龍TM650 IP攝像頭參考設計是一款完整的4K聯(lián)網(wǎng)攝像頭,支持64位異構計算,支持包括從以太網(wǎng)到X8 4G LTE的全面廣泛的連接,還支持先進(jìn)的視頻分析,包括運動(dòng)與面部檢測、面部識別、物體追蹤和Zeroth目標分類(lèi)。

在另一個(gè)案例中,得益于驍龍800系列集成的Adreno視覺(jué)處理、Hexagon數字信號處理、Spectra計算機視覺(jué)和全新的慣性傳感器內核,Qualcomm在一款由驍龍820處理器支持的頭戴式顯示器(HMD)上首次展示了六自由度(6DOF)運動(dòng)追蹤。

ARM多媒體處理部門(mén)GPU產(chǎn)品經(jīng)理Espen Oybo對此給出的觀(guān)點(diǎn)是,此前,在設備中配置GPU并不認為是必需或是高性?xún)r(jià)比的,因為CPU本身可以處理一些簡(jiǎn)單的圖形任務(wù),而減少芯片體積和降低功耗顯得更加重要。然而,隨著(zhù)GPU技術(shù)的不斷進(jìn)步,人們發(fā)現GPU不僅能提供更佳的用戶(hù)體驗,也能釋放CPU的處理能力,使其更專(zhuān)注于關(guān)鍵任務(wù),并顯著(zhù)的減少了芯片體積、功耗和帶寬消耗。

Mali超低功耗GPU是ARM產(chǎn)品家族中的重要成員,能夠幫助設備在有限功耗條件下,完美的實(shí)現性能和功耗平衡,從而在可穿戴和物聯(lián)網(wǎng)市場(chǎng)獲得出色的圖形體驗。而全新推出的Mali-G71高性能GPU則采用新一代Bifrost架構,適用于A(yíng)R/VR等需要高性能的領(lǐng)域。

除了圖形處理,GPU要不要嘗試一下通用計算?

Rys Sommefeldt在接受采訪(fǎng)時(shí)稱(chēng),承擔更多計算任務(wù)將是GPU發(fā)展的必然趨勢。相比于主要應用于通用目標計算上的傳統渲染場(chǎng)景,AR/VR帶來(lái)了更多整體渲染和視覺(jué)處理系統的需求。盡管它仍舊是圖形相關(guān)的通用目標計算,但已經(jīng)不屬于傳統光柵化。因此,具備在單一渲染框架中混合GPU和計算負荷的GPU微架構,來(lái)滿(mǎn)足不同水平的需求,這一點(diǎn)非常重要。

應用在PowerVR Wizard GPU中的光線(xiàn)追蹤技術(shù)是Imagination的“殺手锏”之一,尤其適合于A(yíng)R/VR等非傳統應用場(chǎng)景的使用。它可以將渲染完成的圖像根據人眼效果進(jìn)行調整,并將之扭曲提供恰當的輸出,以適應特定的視覺(jué)系統—無(wú)論是鏡頭還是人眼。相比于在單獨GPU上運行同樣的負載,該技術(shù)具備在硬件光線(xiàn)追蹤器上運行扭曲平臺,并與GPU一道形成獨特的優(yōu)勢。20161028-GPU-1ARM多媒體處理部門(mén)GPU產(chǎn)品經(jīng)理Espen Oybo

每個(gè)產(chǎn)品對GPU的要求都不盡相同,一些只需顯示簡(jiǎn)單的用戶(hù)界面,而另一些產(chǎn)品則需要支持高端3D游戲的運行。有鑒于此,ARM Mali系列GPU滿(mǎn)足了低功耗可穿戴設備、高端智能手機和要求高性能且獨立的虛擬現實(shí)頭盔這三大類(lèi)產(chǎn)品的不同需求,并通過(guò)在核心數量和配置選項方面的可擴展性,賦予合作伙伴在設計特定產(chǎn)品時(shí)實(shí)現功耗和效率的平衡。

“AR/VR的復雜性確實(shí)對移動(dòng)SoC組件提出了很高的要求,我們希望通過(guò)Brifrost GPU架構來(lái)滿(mǎn)足這些要求。”Espen Oybo說(shuō)盡管目前數量有限,但ARM已經(jīng)看到一些采用通用圖形處理器(GPGPU)來(lái)進(jìn)行任務(wù)處理的案例,這是因為在現有API和硬件條件下實(shí)現GPU和CPU之間的數據共享較為困難,很難淋漓盡致的發(fā)揮GPU的作用。但隨著(zhù)OpenCL 2.0的出現,在高性能Bifrost架構中增加全系統一致性,將便于GPU和CPU通過(guò)高效的共享內存實(shí)現彼此“溝通”,讓GPU和CPU在各種規模計算任務(wù)中的合作更加高效,避免了CPU緩存清理的間接費用。

性能與功耗,兩者必須得兼

上述這些細分領(lǐng)域有些屬于快速變化的高存量市場(chǎng),有些屬于擁有很大創(chuàng )新空間的新興市場(chǎng),但它們都依賴(lài)于高性能GPU在最低功耗下的性能表現。換句話(huà)說(shuō),如何在帶給用戶(hù)最佳性能體驗的同時(shí)更兼顧低功耗特性,正成為各家公司實(shí)力比拼的焦點(diǎn)。

根據多年來(lái)提供GPU授權設計的經(jīng)驗,Rys Sommefeldt說(shuō)自己認識到很多時(shí)候市場(chǎng)所需要的與實(shí)際創(chuàng )造出來(lái)的產(chǎn)品并不一致。“每個(gè)人都希望看到一定的改變,即使只是很小的變化,但我們又無(wú)法準確預測客戶(hù)所期望的目標性能水平、功耗和領(lǐng)域,這就是這個(gè)行業(yè)的本質(zhì)。所以,可擴展的、模塊化的可調節GPU設計是必須的。”

對于GPU來(lái)說(shuō),最關(guān)鍵的可擴展因素永遠是性能,例如浮點(diǎn)數量和GPU可處理的像素數量。因此,通過(guò)在設計中提供多種水平的性能,用戶(hù)就有機會(huì )以最少的精力和時(shí)間來(lái)應對市場(chǎng)中新的配置需求,并使自己得以跳出原本的領(lǐng)域和產(chǎn)品計劃。

Imagination最新推出的塊狀延遲渲染微架構是專(zhuān)為在渲染過(guò)程中降低工作量而設計的。該架構不對隱藏的像素內容進(jìn)行著(zhù)色內容處理,意味著(zhù)無(wú)需耗費電源來(lái)運行ALU和獲取寄存器組,從而帶來(lái)了功耗方面的大幅降低;也無(wú)需提供紋理模型和寫(xiě)出用于中繼緩沖或最終圖形的像素,極大地節省了存儲需求。20161028-GPU-2Imagination業(yè)務(wù)開(kāi)發(fā)高級工程經(jīng)理Rys Sommefeldt

“就算是不靠電池供電工作的終端,也需要出于散熱和工業(yè)設計的考慮去盡量減小功耗。” 王宇飛表示,Adreno GPU的關(guān)注點(diǎn)一直是要提供每一份能量(每毫瓦)的絕對最佳性能,這也是所有移動(dòng)市場(chǎng)細分領(lǐng)域的根本推動(dòng)力。最新的Adreno 5xx GPU既支持Khronos最新圖形API Vulkan,能在CPU低消耗狀況下實(shí)現高級圖形內容,也支持最新計算API OpenCL 2.0 FP的所有特性,以應對各種GPGPU應用。

幫助合作伙伴在功耗和效能間取得適宜其產(chǎn)品的最佳平衡,對于A(yíng)RM而言是至關(guān)重要的。最初設計時(shí),Mali-400是首款配置Mali-200 GPU的多核GPU,市場(chǎng)的反饋很快證明了這個(gè)策略是正確的。在隨后的設計中,基于高端Midgard架構的GPU,諸如Mali-T880,可以從單核拓展至16核,而全新的Mali-G71基于Bifrost架構,更能夠支持32核。

當今最高端的智能手機已經(jīng)實(shí)現了12個(gè)內核的配置,用以支持AR/VR等新興應用,它們的嚴苛要求正在不斷推動(dòng)電源功耗突破極限。所以Espen Oybo認為,額外的可用核是非常有必要的,它不僅能輕松的支持高端應用,同時(shí)也為其應對日益增加的內容復雜性預留了空間。除了數量外,內核在配置方面還有很多靈活空間,如何在這一過(guò)程中實(shí)現功率、性能和效能的平衡,從而能夠提供另一個(gè)層面的可定制選項,幫助用戶(hù)根據自己的市場(chǎng)需求進(jìn)行自由調整,也是非常關(guān)鍵的要素。

設計增值,才能活下去

GPU IP屬于設計復雜,離開(kāi)生態(tài)系統就無(wú)法生存的IP類(lèi)型,所有受訪(fǎng)者也均對此表示認可。王宇飛說(shuō),Qualcomm的主要目標之一就是為移動(dòng)開(kāi)發(fā)者提供盡可能多的價(jià)值。通過(guò)與生態(tài)系統中的合作伙伴密切合作,以保證中間件引擎是高效的,且針對Adreno實(shí)現優(yōu)化。高通還為開(kāi)發(fā)者們開(kāi)發(fā)資源,縮短他們在A(yíng)dreno GPU上的開(kāi)發(fā)時(shí)間:既有像驍龍Profiler這樣特性豐富的工具,在開(kāi)發(fā)周期的所有方面提供幫助;也有SDK來(lái)幫助開(kāi)發(fā)者獲得先進(jìn)的技術(shù),驍龍VR SDK就是一個(gè)例子,能讓開(kāi)發(fā)者們利用它開(kāi)發(fā)HMD和面向專(zhuān)用HMD的內容。

近年來(lái),Imagination在為客戶(hù)提供硬件、軟件和市場(chǎng)方面的產(chǎn)品支持上也取得了巨大的成就。包括提供專(zhuān)門(mén)的硬件設計團隊與客戶(hù)、晶圓代工長(cháng)溝通合作,以確保實(shí)現最佳的片上性能;戰略軟件團隊與客戶(hù)和開(kāi)發(fā)者共同創(chuàng )建可為PowerVR提供明確策略?xún)?yōu)勢的軟件產(chǎn)品;細分市場(chǎng)營(yíng)銷(xiāo)專(zhuān)家充分理解客戶(hù)的目標應用細節,展示PowerVR在相應領(lǐng)域的巨大價(jià)值等。

ARM是一家依托龐大生態(tài)系統生存的公司,這一特點(diǎn)無(wú)論對于GPU還是CPU來(lái)說(shuō)都至關(guān)重要。一方面,ARM與EDA合作伙伴和代工廠(chǎng)緊密協(xié)作,幫助芯片伙伴便捷的實(shí)施GPU。另一方面,通過(guò)軟件生態(tài)系統為程序員提供最好的Mali體驗。“正因我們擁有如此龐大的生態(tài)系統(包括實(shí)施和軟件),ARM的合作伙伴們能在眾多生態(tài)系統所提供的不同選擇中自由選取,從而實(shí)現他們產(chǎn)品的差異化。”Espen Oybo說(shuō)。