NVIDIA GeForce RTX 4060首發評測:甜點終相逢,玩轉DLSS 3高性價比

愛極物 發佈 2023-11-25T19:28:56.852126+00:00

縱觀Steam硬體排行榜,NVIDIA GeForce的60尾綴GPU不講道理的霸榜已久,GTX 1060、RTX 2060、RTX 3060,甚至RTX 3060 Laptop GPU在TOP 10中都占有不少的份額。


縱觀Steam硬體排行榜,的60尾綴GPU不講道理的霸榜已久,GTX 1060、RTX 2060、RTX 3060,甚至RTX 3060 Laptop GPU在TOP 10中都占有不少的份額。而出於性價比考慮,大多數玩家會選擇3-5年為周期更新硬體,這意味著GTX 1060、GTX 1660以及RTX 2060玩家們已經開始考慮遊戲硬體升級了。

定位1080p流暢高畫質遊戲的GeForce RTX 4060在此刻提前上市顯然很合時宜。面對日漸複雜的光線追蹤特效,1080p解析度流暢運行仍然是主流需求,更何況3-5年前開始流行的1080p高刷顯示器表現仍然良好。這時候,MSRP 2399元的GeForce RTX 4060自然增添了不少吸引力。

更重要的是整個遊戲生態也在發生翻天覆地的變化。RTX GPU剛推出時,只有37%的RTX 20系列玩家啟用光線追蹤,26%的人啟用DLSS。現在有超過400個RTX加速的遊戲、應用和數以百萬計的RTX玩家。而在當下,83%的RTX 40系列遊戲玩家啟用光線追蹤,79%的人啟用DLSS,RTX技術的普適性已經成為了業內共識。

DLSS與RTX下一階段的普及重任落到了GeForce RTX 4060身上。與RTX 30上市初期開賣即斷貨的尷尬局面不同,如今MSRP定價已經可以輕鬆在官方電商平台下手。隨著GeForce RTX 4060增大L2緩存,並擁有電競遊戲低延遲響應、DLSS超採樣提升幀率,以及強大AI性能的特性,GeForce RTX 4060很好的奉行了甜點顯卡的重任。

由於公版Founders Edition的缺席,iGame GeForce RTX 4060 Ultra W DUO 8GB成為首發陣營的主角。也恰好是今年,iGame開始不斷嘗試MSRP價格,讓性價比更為凸顯。那麼GeForce RTX 4060是否真如主流玩家們所期望那般成為遊戲PC升級的重要理由?GeForce RTX 4060首發評測就此奉上。

用AD107戳中甜點

雖然與GeForce RTX 4060 Ti同時現身,但GeForce RTX 4060採用了面積更小的AD107核心,型號AD107-400-A1,Die size 146mm²,搭配8GB 128-bit GDDR6顯存使用。另外AD107還會有應用於移動端的GN21-X4變體,即GeForce RTX 4060 Laptop GPU。但由於頻率、筆記本調教方式和定位不同,故沒有太多對比參考價值。

AD107同樣使用了NVIDIA最新的Ada Lovelace架構,台積電4N英偉達定製工藝,在146mm²的晶片面積中同樣保存了完整的架構設計,即GPU中包含了若干個GPC(Graphics Processing Clusters,圖形處理集群),GPC下包含若干個TPC(Texture Processing Clusters,紋理處理簇),再往下就是SM、CUDA、RT Core、Tensor Core等等。

GeForce RTX 4060的AD107已經是完整的架構,擁有3個GPC,每個GPC包含4組TPC,而非AD106的6組。

與此同時,GeForce RTX 4060其他結構則保持不變,即每組TPC包含2個流式多處理器(Streaming Multiprocessors,SM)。其中每個SM包含4個處理塊,每個處理塊包含1個64KB寄存器堆,1個L0指令緩存,1個Warp調度器,1個調度單元,4個加載/存儲單元,1個特殊功能單元(Special Function Unit,SFU)用於執行超越函數指令(比如正弦、餘弦、倒數、平方根等)和圖形差值算法指令。另外每個SM下的128個CUDA Core隨處理塊分成4組,每組CUDA由16個專門用於FP32的CUDA Core,16個可以在FP32和INT32之間切換的CUDA Core組成。

GeForce RTX 4060的L2緩存相對RTX 30以前GPU的巨大提升,來到了24MB,是GeForce RTX 3060 12GB和GeForce RTX 2060的3MB L2的8倍。

由於緊貼著核心,L1緩存設計決定了存儲空間不可能做得太大,所以提升L2緩存容量就稱為了理想選擇。更大的L2緩存有助於提高隨機存取的命中率,更快的L2緩存能提升運算單元的效率。內核在計算的過程中會不斷的調用存儲子系統的數據,順序是L1緩存、L2緩存、顯存、內存,越往後響應速度越慢。為了趕上快速刷新的遊戲畫面,GPU所有的數據會經過預加載放置在緩存中,因此緩存容量越大,下一幀所需要素材的命中率就越高,GPU跑腿尋找數據所需要的時間就更短,效率就更高。

同樣,GPC都需要通過L2緩存完成所有訪存操作,即Ada Lovelace架構中的第四代Tensor Core和第三代RT Core性能提升也會通過L2緩存實現。正因為如此,在單元數量、顯存帶寬沒有優勢的情況下,GeForce RTX 4060依然能輕鬆超越前輩。

這裡讓我們奉上對比表格:

除此之外,Ada Lovelace架構還為第三代RT Core帶來了更多的射線/三角形求交測試吞吐量,並並額外增加了透明度微圖引擎(Opacity Micro-Map,OMM)和位移式微型網面引擎(Displaced Micro-Mesh,DMM),引入了著色器執行重排序(Shader Execution Reordering,SER)技術,通過與遊戲設計團隊配合,更有效的分配次級射線的排序權重。

第四代Tensor Core則配合新光流加速器、NVIDIA Reflex等技術組成了DLSS 3。更確切的說,DLSS 3是一套包含了提升遊戲幀率、降低系統延遲的完整解決方案。它通過引入光流加速器(Optical Flow Acceleration,OFA)與DLSS相結合的辦法,構建出了一個更為立體的分析方式,將卷積自編碼器的輸入源擴展到幾個部分,分別是:之前幀與當下幀,由光流加速器生成的光流場、遊戲運動矢量和深度等數據。這時候DLSS 3甚至承擔起渲染過程中7/8的工作,讓CPU和GPU進完成其中1/8的渲染即可,從而節省出大量的計算資源專注到更有用的地方。

另外值得注意,GeForce RTX 4060的AD107中依然包含了1個NVNEC和1個NVDEC,也意味著GeForce RTX 4060與GeForce RTX 4060 Ti、與GeForce RTX 4070一樣,擁有完整的視頻編解碼能力。特別是AV1編碼器能夠利用現階段可以進行1080p串流視頻的帶寬。同時掌握AV1編解碼器也意味著GeForce RTX 4060 Ti 8GB無論是播放還是輸出,都擁有不錯的表現,其中AV1編碼器能比H.264編碼器效率高出40%。

再遇iGame

至此,GeForce RTX 4060的核心元素集齊,讓我們把目光聚焦到GPU的外觀上。由於首發沒有Founders Edition設計,iGame GeForce RTX 4060 Ultra W DUO 8GB成為了不錯的選擇,它不僅符合MSRP的2399元定價,白色主題搭配波普漸變色外觀也更好的符合時下流行的白色系搭配。

iGame Ultra新的波普(POP)藝術風格起源於上個世紀50年代,通過撞色運用及隨性的線條勾勒,打造出擁有極強物質主義及樂觀精神。在變換角度時,會發現彩色部分會雖不斷變換呈現出色彩斑斕的效果。

其中雙風扇設計讓顯卡長度控制在了255mm範圍之內,而如果觀察PCB會發現實際顯卡長度可以更短,考慮到GeForce RTX 4060對功耗有著很好的控制,自然也期待未來AIC可以推出更小尺寸的版本,方便塞入小型機箱中。

另外iGame GeForce RTX 4060 Ultra W DUO 8GB的電源接口也回到了傳統的8pin形態,而非最新的16pin(12VHPWR)接口,很好的考慮到老款PC升級的兼容性。

在散熱設計上,iGame GeForce RTX 4060 Ultra W DUO 8GB使用了2個90mm雙環形扇葉可以做到葉片環環相連,提升風扇強度。同時風扇內部使用了雙滾珠軸承設計,幫助風扇可以柔滑流暢運行,並延長風扇的使用壽命。

為了提升導熱效率,風扇下方使用了一套大面積的散熱鰭片以加速導熱效率,比如採用了2x6mm熱管,另外回流焊也確保了熱管和鰭片緊密接觸,以獲得更好的散熱效能。同時iGame GeForce RTX 4060 Ultra W DUO 8GB金屬背板也使用了與iGame Ultra波普風格相呼應的白色主題設計。

因此在實際壓力測試下,iGame GeForce RTX 4060 Ultra W DUO 8GB的散熱表現不錯,GPU核心溫度在58℃左右。如果通過紅外線測溫,在室溫26℃的環境中,可以看到顯卡表面保持著清涼的狀態。

事實上GeForce RTX 4060功耗控制得不錯,例如在待機狀態下整體功耗控制在10W以內,而平均遊戲功耗在110W左右,這裡我們抓取了數款遊戲實際運行過程的平均功耗表現,足以見得115W TGP已經完全夠用了。

有意思的是,NVIDIA也對GeForce RTX 3060和GeForce RTX 4060每周所產生功耗與電費做了統計,110W功耗的GeForce RTX 4060相對RTX 3060可以節省將近35%的費用。對於家用玩家而言,4年節省上百元似乎意義不大,但對於動輒上百台60系列GPU的電競酒店和網吧業主,35%電費的節省可是一個不小的數額。

最後在擋板設計上,GeForce RTX 4060提供了3個DisplayPort 1.4a和1個HDMI 2.1接口,iGame再次基礎上還提供了一個物理固件切換按鈕,限於MSRP定價,iGame GeForce RTX 4060 Ultra W DUO 8GB沒有提供官方一鍵超頻功能。不過超跑還可以通過iGame Center進行進一步的頻率設置。鑑於GeForce RTX 4060的低功耗與相對冗餘的散熱設計,通過超頻換取更多的性能提升也是個不錯的選擇。

光追遊戲酸爽了

收集完GeForce RTX 4060的所有條件讓我們來到喜聞樂見的跑分與遊戲測試環節。這次硬體平台包括Core i9-13900K,七彩虹Colorful CNV DDR5-6600 16GB x2,CVN Z790D5 GAMING FROZEN V20,以及1250W電源作為支持,同時也引入GeForce RTX 3060,GeForce RTX 2060作為對比。

鑑於GeForce RTX 4060定位在1080p級別,因此在實際測試中主要圍繞1080p最高光線追蹤畫質進行。另外需要注意,GeForce RTX 4060使用的是PCIe 4.0 x8通道,通過PCB觀察會發現引腳的後半部分是沒有電路的。因此GeForce RTX 4060也只有在顯卡槽支持PCIe 4.0以上版本時性能會被充分發揮,如果安裝在PCIe 3.0 x16插槽中,性能會有明顯影響。

在基礎測試部分,這裡使用3DMark Time Spy,3DMark Time Spy Extreme,3DMark Fire Strike Extreme,3DMark Fire Strike Ultra,Port Royal進行對比。GeForce RTX 4060的表現非常亮眼,相對GeForce RTX 3060 12GB性能提升有15%到22%,如果是GeForce RTX 3060 8GB,差距無疑會更大。與此同時,GeForce RTX 4060相對GeForce RTX 2060提升更是40%以上。

在常規非DLSS 3遊戲測試中,我們選擇了《刺客信條:英靈殿》和《看門狗:軍團》這樣的開放世界,也有《生化危機4》重置版。可以看到GeForce RTX 4060相對GeForce RTX 3060 12GB性能提升15%到21%,相對GeForce RTX 2060提升幅度上就相當大了,可以從35%到152%不等。

接下來開啟光線追蹤最高畫質加DLSS 3才是重頭戲,RTX生態發展的5年中,已經獲得了超過400款遊戲的支持,其中會有79%的RTX 40系列用戶開啟DLSS,83%的RTX 40系列用戶開啟光線追蹤。

不僅如此,在DLSS 3發布數個月內,支持的遊戲和應用已經超過30款,增長速度更快,提升效果也更明顯。但前提是必須要有一塊GeForce RTX 40系列GPU中的第四代Tensor Core提供硬體支持,此前的Tensor Core最高只能支持到DLSS 2.X。

GeForce RTX 4060無疑將擁有DLSS 3技術的門檻下降了一大截,在3DMark DLSS功能測試中,可以看到GeForce RTX 4060相對GeForce RTX 3060 12GB在2K解析度下提升了84%,4K解析度下提升了109%。而相對GeForce RTX 2060,2K解析度下提升了113%,4K解析度提升了157%。可見DLSS 3幀生成在其中起了很大的作用。

在DLSS 3遊戲測試環節。同樣是在1080p解析度下開啟光線追蹤最高畫質,可以看到《極限競速:地平線5》中GeForce RTX 4060相對GeForce RTX 3060 12GB提升了63%的幀率,相對GeForce RTX 2060則提升了211%。

再比如《漫威蜘蛛俠:邁爾斯》中,GeForce RTX 4060相對GeForce RTX 3060 12GB提升了65%的幀率,相對GeForce RTX 2060則提升了132%。

《賽博朋克2077》和《巫師3:狂獵》在開啟光線追蹤高畫質後,讓DLSS 3的加持顯得非常重要。GeForce RTX 4060相對GeForce RTX 3060 12GB提升超過了110%,相對GeForce RTX 2060則提升了200%。

另外由於DLSS 3本身自帶NVIDIA Reflex技術,不僅解決了AI插幀的時候避免關鍵操作和關鍵幀排在渲染序列尾端,同時也默認開啟了遊戲高速響應的節奏,在DLSS 2.X時代,這個選項需要遊戲單獨支持,並需要開啟獨立的選項才能實現,而現在則可以直接運用在DLSS 3遊戲中。同時目前主流的10款射擊類遊戲中,也已經有8款遊戲提供了對NVIDIA reflex的支持,比如《Apex英雄》, 《使命召喚: 戰區2》, 《命運2》, 《逃離塔科夫》, 《堡壘之夜》,《彩虹六號:圍攻》和《無畏契約》等。

AI與創作一樣不落

DLSS 3的影響已經不局限於遊戲,部分專業軟體已經開始率先支持DLSS 3特性,國產的D5渲染器便是其中之一。D5渲染器作為一款基於Unreal Engine開發的專業軟體,在更新速度、新技術支持表現得非常積極,再加上易上手的特性,可以在上手數個小時內就能掌握使用的要領,並直接投入到工作中,對新手和有經驗的用戶都非常有好。

在近期的更新中,D5渲染器追加了DLSS 3實時高幀率的支持,這讓操作中的實時預覽有了更流暢的體驗。

這裡同樣使用GeForce RTX 4060與GeForce RTX 3060 12GB、GeForce RTX 2060進行對比,選用軟體自帶的Minimalist Living Room,以及額外下載的Wooden Atrium Space場景進行對比。其中Minimalist Living Room擁有31個模型和4,065,155個表面,以及2個光源。Wooden Atrium Space則更為龐大一些,擁有288個模型,62,204,588個表面和30個光源。

這裡直接對DLSS 3環境進行對比,GeForce RTX 3060 12GB、GeForce RTX 2060由於無法開啟DLSS 3實時高幀率選項,因此實際幀率表現被甩開數條街。GeForce RTX 4060相對GeForce RTX 3060 12GB提升超過120%,相對GeForce RTX 2060提升超過220%。

另外一個則是時下的熱門的AI創作軟體Stable Diffusion 2.1,這裡我們仍然沿用此前的設置,讓GPU同時運算2張圖片,總共運行10次,即20張。每張圖片解析度為768x768解析度,採樣步數設置為50。通過記錄每個GPU花費的時間,並進一步推算出每分鐘生成的圖像效率(Images Per Minute)。

在Stable Diffusion 2.1中,GeForce RTX 4060的AI性能相對GeForce RTX 3060 12GB提升14%,相對GeForce RTX 2060提升47%。

然後是利用ON1 Resize AI 2022提升圖片的原生解析度,同樣考驗的是各GPU的AI性能,並記錄GPU的用時,用時越少越好。在Ferris Wheel、Glasses、Bicycle、Motorcycle、Leaf五個圖片場景中,GeForce RTX 4060相對GeForce RTX 3060 12GB節省15%的時間,相對GeForce RTX 2060節省36%的時間。

即使沒有第四代Tensor Core加持,GeForce RTX 4060表現也仍然強勁,例如V-Ray 5 Benchmark中,會分別對CUDA Core和RTX進行檢測。在CUDA Core表現上,GeForce RTX 4060相對GeForce RTX 3060 12GB提升45%,相對GeForce RTX 2060提升144%。而在RTX光追性能中,GeForce RTX 4060相對GeForce RTX 3060 12GB提升50%,相對GeForce RTX 2060提升143%。

在測試GPU的光線追蹤性能Octane Render RTX benchmark中,GeForce RTX 4060相對GeForce RTX 3060 12GB提升23%,相對GeForce RTX 2060提升88%。

另外喜聞樂見的Blender Benchmark主要檢測了Moster、Junkshop、Classroom三個輸出場景,GeForce RTX 4060相對GeForce RTX 3060 12GB提升40%,相對GeForce RTX 2060提升80%以上。

工程專業常見的SPECviewperf 2020。這是一款包含能源勘探、醫學、建築設計、機械設計、汽車設計、飛機設計領域的專業軟體圖形測試,包括包括3dsmax、Catia、Creo、Energy、Maya、Medical、SNX、Solidworks等主流軟體。這裡GeForce RTX 4060相對GeForce RTX 3060 12GB平均提升30%,相對GeForce RTX 2060平均提升40%。

寫在最後:甜點新標杆

在測試過程中,GeForce RTX 4060在性價比上著實給人眼前一亮,僅基礎性能就可以比GeForce RTX 3060 12GB提升20%以上,相對GeForce RTX 2060提升50%以上,如果獲得DLSS 3加持,效率則是成倍的增加,2399元的定價無疑讓GeForce RTX 4060看起來很有誠意。追求性價比的遊戲玩家,注重能耗的電競酒店,網吧業主都完全可以把GeForce RTX 4060當成首選項。

GeForce RTX 4060給予的3A大作體驗是沒有折扣,除了部分對光追性能及其嚴苛的遊戲,絕大部分主流遊戲和電競遊戲已經能夠輕鬆在1080p最高畫質下跨過100FPS台階,充分發揮1080p高刷顯示器的性能。並且絕大部分遊戲體驗是GeForce RTX 4060在遊戲中僅以平均110W功耗以內實現的,也足以證明GeForce RTX 4060的超頻潛力。

另外諸如iGame GeForce RTX 4060 Ultra W DUO 8GB在散熱設計上加碼的AIC產品,也從側面證明了GeForce RTX 4060還擁有更多等待被挖掘的潛力,因此我們也完全有理由期待AIC廠商們在非MSRP上給予的性能釋放。

在供貨充足的當下,以戰斧的價格入手一款iGame GeForce RTX 4060 Ultra W DUO 8GB這般的顯卡,戳中遊戲和創作性能的甜點,在1080p解析度下遊刃有餘的工作與玩耍,以最便宜的價格跨進GeForce RTX生態圈,如此甜點的GeForce RTX 4060,著實找不出什麼拒絕的理由了。

關鍵字: