遊戲手機不能單看GPU跑分

2019-08-01
作者 黃燁鋒,EE Times China

當我們說一款手機遊戲性能表現好的時候,究竟是在說什麼?就常規來看,大部分情況下是在說這款手機的配置如何,或者說手機SoC的GPU部分圖形運算能力、CPU的drawcall開銷和驅動效率怎麼樣,但又或許,這個理解還是太片面了…

「我們對不同遊戲進行了觀察研究,玩一場遊戲要贏的關鍵因素是什麼?」當我們說一款手機遊戲性能表現好的時候,究竟是在說什麼?就常規來看,大部分情況下是在說這款手機的配置如何,或者說手機SoC的GPU部分圖形運算能力、CPU的drawcall開銷和驅動效率怎麼樣,以及手機整體設計的散熱、持續性能表現如何。

但又或許,這個理解還是太片面了。聯發科技無線產品軟體發展本部總經理曾寶慶,在聯發科技Helio G90系列暨HyperEngine技術發佈會上說:「以往強調的,多半是硬體能力。這個不是不好,只是硬體已經到了某一個程度,再往上是體驗更重要的。我們關注在體驗。」

20190801NT61P1
(圖片來源:聯發科)

體驗是什麼?如果不談傳統意義上的「硬體能力」,在描繪遊戲手機的時候又能說些什麼?「玩遊戲都是想玩就玩,不會等到訊號很好的時候才玩。」這是聯發科技無線通訊事業部技術行銷處處長李俊男在舉例「體驗」時說的一句話,似乎直指在日常遊戲時的一些痛點,比如在地鐵、火車這類高速移動的場合玩遊戲,連接穩定性總是不能讓人滿意。

「玩一場遊戲,我們總是想要贏的。如何贏得比賽,包括了很多因素,比如觸控反應快慢、多快能發招、網路能不能跟得上,這些都是完整配套的。重要的是穩定,如何讓用戶流暢地玩遊戲、痛痛快快地打贏,這是我們一直在觀察和研究的。」

Mali-G76 GPU能贏嗎?

7月30日聯發科在上海發佈了Helio G90/G90T,定位是遊戲手機SoC。Helio G90系列配置主體包括了CPU部分兩大核+六小核的設計,兩顆最高2.0GHz/2.06GHz主頻的A76核心,六顆最高2.0GHz主頻的A55核心;GPU部分則為Mali-G76 MC4(這裡的MC4,推測應該是指四個shader core)。兩顆SoC均採用12nm製程。實際從這些配置參數都不難發現,Helio G90/G90T在產品定位上並非旗艦,而更靠向中階手機設備。

20190801NT61P2

Helio G90/G90T都配備了神經網路執行專用核心,聯發科稱之為APU;ISP部分,G90T最高支援至6,400萬畫素的攝影鏡頭——這也順應了三星ISOCELL Bright GW1,以及索尼很可能接下來也要推出的6,400萬畫素CSI的潮流。

其他有關這兩顆SoC的亮點還包括了,Helio G90T支援螢幕刷新率至90Hz,這也是手機產業的一個新方向:一加 7 Pro在採用90Hz刷新率螢幕後取得了不錯的市場反響;另外Helio G90T還支援「雙單字語音喚醒」(或稱雙語音喚醒),意為如果某款手機內建兩個語音助手,就需要兩個喚醒詞,G90T提供這種原生支援。

既然是遊戲SoC,那麼來著重就聊聊「遊戲」。Helio G90系列所用的Mali G76 GPU實際並不是很新的GPU方案了,不過這基本也是聯發科現階段能夠用上的最高配GPU,畢竟Arm Mali G77仍需一個週期才會應用到實際產品中。上半年三星Exynos 9820和海思麒麟980,都用到了Mali G76,不過shader core規模大很多。

實際上,除了華為這樣的廠商會在中階產品中考慮用Arm的Mali G5x系列,其他Mali系SoC製造商都傾向於仍在中階產品中採用Mali G7x系列,只不過在核心規模上相較旗艦SoC做縮減,這也符合聯發科的一貫風格。

Mali G76相比G72堪稱完成了一次能效和性能飛躍,而且G76是真正完全體的Bifrost架構,首次換掉了Midgard時代的Texture單元。在各向異性過濾方面,終於讓Mali在遊戲畫質上達到與Adreno同一水準。就AnandTech先前的測試來看,Exynos 9820和Snapdragon 855的性能和能效就已經十分接近,這也是Arm Mali GPU在性能和能效方面第一次如此接近高通Snapdragon Adreno GPU。

20190801NT61P3
聯發科技無線通訊事業部協理李彥輯,為了配合遊戲主題,發言者腰間都特別配了一支搶。

聯發科Helio G90/G90T雖然在shader核心數量和主頻規模方面,還無法和Exynos 9820與麒麟980這些旗艦SoC叫板——畢竟這是兩顆中階定位的SoC。但相比更早的Helio P60/P70所用的Mali G72MP3,在圖形計算方面已經獲得了很大程度的提升。

聯發科技無線通訊事業部協理李彥輯在發佈會上,將Helio G90/G90T與高通Snapdragon 730/730G進行了比較。後者的GPU部分配置為Adreno 618(730G的GPU頻率相較730會略高)。鑒於Adreno在架構方面始終是個黑匣子,很難就Adreno和Mali做理論分析。

在前不久的華為nova 5發佈會上,華為也特別將麒麟810和Snapdragon 730進行了比較,不過麒麟810所用的GPU是架構規模更小的Mali G52——只是海思將G52的shader核心數改到了6顆。就G52架構本身的弱勢加上shader數量增大,猜測聯發科Helio G90/G90T在GPU絕對性能方面和麒麟810應該是同一水準,不過Helio G90架構部分的能效可能會更佔優勢。

20190801NT61P4

就圖形性能比較,聯發科官方公佈的資料顯示,Helio G90T的曼哈頓ES3.0離屏渲染測試,性能相比Snapdragon 730高出26%;安兔兔3D測試,Helio G90T領先Snapdragon 730約14%,較Snapdragon 730G高出5%;另外還包括3D Mark的Vulkan性能測試,「我們在Helio G90T上,對Vulkan也做了很好的支援。」

20190801NT61P5

就遊戲實測部分,《荒野行動》畫質開啟高訊框率+高解析度的情況下,Helio G90T相比Snapdragon 730G和730更穩。有趣的是,聯發科在發佈會上,就部分遊戲訊框率比較還拉來了高通Snapdragon 855——理論上,Helio G90/G90T的GPU規模和Snapdragon 855應該是沒法比的。這種比較還需要考慮遊戲能否發揮GPU的全部實力,注意這張表中《和平精英》(原《刺激戰場》)的畫質只開到了「流暢」,應該還不足以發揮Snapdragon 855及Adreno 640的全部實力。

20190801NT61P6

另外,遊戲實測對比還需要考慮到手機的結構工程差異,而不光是SoC和GPU本身的性能表現。比如手機的散熱設計,這樣GPU的持續性能才更能發揮得宜。

不過,聯發科Helio G90T能達到這樣的成績也已經非常亮眼了,尤其考慮到其中階定位。而其遊戲訊框率穩定性表現,更多依賴的還不光是GPU本身的持續性能輸出,而是聯發科這次主推的另外一個叫做「HyperEngine」的技術。

怎麼打贏手機遊戲,似乎是聯發科這次思考的重點。

打贏遊戲要靠:資源調度、畫質、操控

GPU部分的絕對性能並非聯發科此次宣傳的重點,而聯發科對於遊戲晶片的理解,也不在跑分成績上。如何「贏」得遊戲,體現在幾個層面,包括負載調控、畫質、操控體驗,以及網路延遲四個方面。

「人們對遊戲過程的體驗,並不是平均60fps就能覺得玩起來很流暢。如果這個遊戲玩起來是時快時慢,體驗就會變差,且時快時慢就是最糟糕的體驗了,那還不如訊框率是穩定的。玩遊戲進行操作的過程裡,按下去的反應和看到畫面的反應,可預測的才是最好的;當每次延遲都是固定的時候,效果才會比較好。」

這是李俊男在談HyperEngine的「智慧負載調控引擎」時提到的。實際上HyperEngine主要著力於四個方向,分別是智慧負載調控引擎(Resource Management Engine)、畫質最佳化引擎(Picture Quality Engine)、操控最佳化引擎(Rapid Response Engine),以及在看來最重要的網路最佳化引擎(Networking Engine)。

20190801NT61P7
聯發科技無線通訊事業部技術行銷處處長李俊男

「高訊框率不代表不卡頓。輸出穩定,不會忽快忽慢才是真正的流暢。」這是智慧負載調控引擎部分在做的工作。智慧負載調控引擎的核心是根據遊戲場景所需,對CPU、GPU、DRAM資源進行相對智慧的調度,「預測系統負載,用剛好的力量畫完每一訊框。」

這一點實際和華為的GPU Turbo還是頗為異曲同工的,不知道這種負載最佳化技術是否也需要針對不同的遊戲做事先的深度學習training操作。

20190801NT61P8

在和Snapdragon 730G的對比中,就《流星蝴蝶刀劍》這款遊戲跑2分鐘,聯發科著力對比了三款SoC每分鐘訊框率發生掉落的頻率(訊框率小幅下滑在聯發科稱「小卡頓」,大幅搖擺則稱「大卡」)。拋開平均訊框率不談,Snapdragon 730G的表現也是不夠穩定的,每分鐘訊框率掉落次數達到5.5次。「可以推測730G的調度可能不是太好,調度引擎不是太智慧,所以有時候跑得快,有時候跑得慢。有的時候,它可能在做別的事情。」

「以我們很多測試和遊戲玩家的測試,我們發現一個標準,每分鐘≤2次小卡頓,玩家就會覺得是流暢的。這也是我們做系統設計時對自己的要求。」

麒麟810實際也具備類似的「智慧調度」策略,所以Helio G90/G90T與麒麟810的對比,或許會是未來更值得關注的。而在聯發科入局這種操作方式以後,手機SoC製造商以後恐怕會將這種方案作為標配。

20190801NT61P9

第二,聯發科的「畫質最佳化引擎」,實際更像是畫面的HDR dithering技術——這在電視領域很常見,近些年也開始逐漸下放給手機,不過以前的著力點是視訊觀看。今年早前,pixelworks宣佈和高通合作,某些定制版本的Snapdragon 855整合了Soft Iris實際也能達成類似的效果,包括黑鯊、諾基亞7.1等手機已經開始應用類似的技術。

只不過要專門應用於遊戲,必然是需要開發者做配合的,看起來聯發科在這一局中也開始先發制人了。從李俊男提到已經開始跟不少遊戲生態合作夥伴合作就不難發現,這屬於相對主動的出擊,這裡的畫質最佳化,並非相關GPU的各向異性過濾、銳化之類的圖形渲染品質,而是遊戲畫面本身的對比度、明亮度、寬容度等屬性,做到對HDR10的支持。引用李俊男的話來說:「別人看不到,你卻看得到,是很重要的事情。」

這部分,聯發科的確借鑒了其電視晶片領域的經驗,採用Local Tone Mapping的方式進行畫面亮度的局部調控,用以實現畫面更高的寬容度——這一點就實際應用來看,似乎對看視訊和HDR電影,也會有很好的效果。演示中對比的是遊戲《明日之後》的畫面,Helio G90/G90T調控下的畫面暗部會呈現出更多的細節。「這是跟《明日之後》的團隊合作,他們也覺得我們這一代引擎帶來的效果很好。」李俊男說。遊戲中,能看到草叢了,人家看不到,這是遊戲對戰的決勝關鍵。

20190801NT61P10

第三是「操控最佳化引擎」。操控最佳化首先能想到的應該是螢幕觸控層取樣速率,以及顯示層刷新率的提升,比如觸控從120Hz提升到240Hz,顯示刷新率提升到90Hz。聯發科是從晶片的角度,在觸控和顯示之間,提供「晶片級最佳化,降低中間的延遲。」

「從晶片收到觸控操作的訊號,到把結果畫出來,我們做了很多技術最佳化。我們這部分的延遲大概在16ms,競爭對手約在40ms。如果在這個階段就需要花到40ms的延遲,加上網路等各類延遲,最終遊戲體驗就會差很多,所以我們做了2.5倍的提升。」

用通俗的話來說,操控最佳化引擎著力解決的是在玩《王者榮耀》這類遊戲時,按下發招按鍵的直接回應速度有多快。很多高段位的王者榮耀玩家對這部分一定也深有體會。

打贏遊戲還需要:網路低延遲

「玩遊戲都是想玩就玩,不會等到訊號很好的時候才玩。」這句話好像真的戳到眾多手游愛好者的痛點了。HyperEngine的網路最佳化引擎的邏輯是這樣的:在網路擁塞時,Wi-Fi、LTE可以並用,與此同時還能實現Wi-Fi 2.4GHz與5GHz雙頻段的併發,以實現遊戲延遲的大幅降低。

「以13ms的速度,智慧預測環境狀況,進行Wi-Fi併發,或者Wi-Fi/LTE併發。軟體類的方案需要用到113ms,速度慢了10倍。」

華為去年曾經在榮耀手機上推出過一個稱做「Link Turbo」的技術,核心就是同時利用Wi-Fi和4G LTE來提升手機的網路通訊能力,可以智慧地在Wi-Fi和LTE之間,選擇其中一路,或者同時用兩路來改善體驗。這項技術需要MP-TCP做適配——這項技術也不新鮮,iOS也有相應的API給開發者提供。

HyperEngine中強調的「網路最佳化引擎」聽起來和Link Turbo有些類似。不過曾寶慶表示:「我們的併發技術是重在延遲部分的,友商則偏向於吞吐量(throughput)。我們認為吞吐量的提升,應用場景並不多。但延遲的提升,比如遊戲、需要快速反應的相關場景,會比較重要。」

20190801NT61P11

作為聯發科合作夥伴的騰訊手游加速器負責人甯斌暉在會上介紹說,實際在去年3月,騰訊就和聯發科成立了聯合實驗室。今年,騰訊的CROS技術團隊推出MT-Storm多網路加速引擎,晶片層面的支援就是由聯發科提供——這也是Wi-Fi雙發合作方案的開始。所以包括《和平精英》、《火影忍者》、《王者榮耀》、《QQ飛車》等騰訊系的主流遊戲都支援HyperEngine的這項特性。

李俊男說:「通常我們認為,100ms是流暢的,200ms就會感覺到卡頓了。我們要將延遲控制在100ms以下。」在聯發科提供的資料中,在類似地下室這樣訊號不好的場景,4G訊號相對偏弱,Helio G90T遊戲中大約98%的時間裡,遊戲延遲都低於100ms,而對比的Snapdragon 855、Snapdragon 730G情況就沒這麼樂觀了。相對的,咖啡廳場景,Wi-Fi網路擁塞,Helio G90T也能夠在60%的時間裡,將延遲控制在100ms以下。

不知道這組對比的實驗環境是如何,訊號表現畢竟還需要綜合考量基頻、射頻、天線,甚至手機設計的結構工程。如果在同等條件下做多組測試能夠達到這樣的成績,對遊戲愛好者而言的確是福音,尤其通勤時間玩遊戲的網路調度。畢竟在地鐵上玩《王者榮耀》因為網路問題導致滿盤皆輸的狀況實在是多之又多。

聯發科為此特別拿出了協力廠商認證機構的背書:Helio G90/G90T是全球首款拿到德國萊茵(TÜV)手機網路遊戲體驗認證的晶片平台,在抗握姿干擾能力、複雜網路環境體驗、平台網路封包併發能力方面都表現出色。聯發科公開的Helio G90/G90T各項子項測試都優於Snapdragon 855這樣的對手,看起來對這項技術是信心十足的。

20190801NT61P12

在綜合了網路延遲≤100ms,針對觸控–>顯示進行晶片處理的延遲≤16ms,智慧負載調控≤2次小卡/分鐘,以及畫質提升的Local Tone Mapping局部調光策略,是聯發科眼中取得遊戲勝利的幾個重要條件。這些特點組成了HyperEngine技術,以及Helio G90/G90T SoC。

這個想法還是在「遊戲」SoC的概念上給了我們驚喜的,只是在生態方面仍然需要開發者的配合,才能體現這種軟硬結合做到真正理想的體驗。李俊男表示,HyperEngine技術未來還會應用到聯發科更多的晶片系列中,而不只是最新的「G」系列。

李彥輯特別援引了Newzoo 2018年的資料,手遊使用者達到了22億人次,而亞洲佔手游營收的64%,這是個巨大的市場。當前手機SoC市場留給聯發科的空間並不多,如果聯發科能夠將生態系統搭建好,配合遊戲平台企業做深入,這或許是聯發科在手機領域開拓細分市場、提高營收的一個機會。

所以合作夥伴的加入對聯發科的細分市場策略成功與否關係重大。「遊戲生態部分,我們跟一些重要的夥伴都有合作,比如像騰訊。Wi-Fi雙發我們跟騰訊就有深度的合作,騰訊的重點遊戲幾乎都支持。」

與此同時,小米Redmi品牌總經理盧偉冰也特別到現場宣佈了與聯發科的合作。想必很快就會看到搭載Helio G90/G90T的Redmi手機產品問世。

本文為姊妹刊EE Times China原創文章

活動簡介
未來寬能隙半導體元件會在哪些應用成為主流?元件供應商又會開發出哪些新的應用寬能隙元件的電路架構,以協助電力系統開發商進一步簡化設計複雜度、提升系統整體效率?TechTaipei「寬能隙元件市場與技術發展研討會」將邀請寬能隙半導體的關鍵供應商一一為與會者解惑。
贊助廠商
訂閱EETT電子報