Re: [情報] 4090太強 12900K/5800X3D都成瓶頸 - PC_Shopping板

首頁(home) 上頁(↑) 下頁(↓) 末頁(end)

※ 本文轉寄自 ptt.cc 更新時間: 2022-10-14 18:55:01

看板 PC_Shopping

作者 oopFoo (3d)
標題 Re: [情報] 4090太強 12900K/5800X3D都成瓶頸
時間 Thu Oct 13 09:41:45 2022

※ 引述《oppoR20 (發情豹紋)》之銘言：
: 已經不只一家評測指出這個問題了
: https://bit.ly/3MnaQNi
: TechSpot:5800X3D
: 1080p/1440p下會有CPU瓶頸
: https://i.imgur.com/ZPHXSHw.png
: Techpowerup/Techspot兩家測試都很明顯 4k之外都被cpu瓶頸了
: 尤其TPU用更弱的5800X讓4090效能無法發揮完全
: https://bit.ly/3yU7Anl
: PCMAG:預設功耗下會讓12900K成為瓶頸
: https://bit.ly/3rNegPU
: PcWorld:快到4K以下幾乎都會造成瓶頸

https://www.chiphell.com/thread-2450201-1-1.html

天天在那儿CPU瓶颈，买啥吹啥就那臭毛病 - 电脑讨论(新) - Chiphell - 分享与交流用户体验 天天在那儿CPU瓶颈，买啥吹啥就那臭毛病,7GPC的RTX 4080在2.79GHz下单周期三角形处理能力=14.34/2.79=5.14效率比例比6GPC的GA104还低4SE的NAVI21通过NGG Culling就能到8估计12GPC的RTX 4090效率会进一步 ...,电脑讨论(新),讨论 ...

https://i.imgur.com/xE4FJkD.png

其實不是CPU跟不上，是4090裡面的Front End(FE)跟不上。

了解為什麼老黃不願意改進FE，現在臭打AI更重要，而且Mesh Shader如果普及會減輕FE的壓力。

但能把缺點講成優點，老黃的宣傳部門實在厲害。

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.224.221.53 (臺灣)
※ 文章代碼(AID): #1ZHspUFj (PC_Shopping)
※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1665625310.A.3ED.html

※ 同主題文章:

　 10-11 22:18 oppoR20. ■ [情報] 4090太強 12900K/5800X3D都成瓶頸

● 10-13 09:41 oopFoo. ■ Re: [情報] 4090太強 12900K/5800X3D都成瓶頸

→ meicon5566: 結果又是老黃的鍋1F 10/13 09:44

推 sigma9988: 坐等50卡2F 10/13 09:51

推 ISAF: 風向又變了大人3F 10/13 09:53

推 ikarifaye: 什麼鍋這是刀法4F 10/13 09:53

推 joe199277: 老黃的刀法...真的好強....5F 10/13 09:55

推 Riya520: 皮衣刀客正盯著你6F 10/13 09:56

推 dylantu: 老黃沒有缺點消費者才有7F 10/13 10:11

推 LastAttack: 神前刀工，規格冗餘是為了4090ti留後路，架構冗餘是8F 10/13 10:14
→ LastAttack: 為了50系列留後路

推 GermanGerm: 有人可以幫硬體麻瓜解釋一下FE是什麼以及為什麼造成瓶10F 10/13 10:17
→ GermanGerm: 頸嗎QAQ

→ tactics2100: 應該改成主機卡插顯示板了貴成這樣不操個十年說不12F 10/13 10:30
→ tactics2100: 過去

→ oopFoo: fe是前端。現代的gpu雖然vertex/pixel shader是共用的，但14F 10/13 10:31
→ oopFoo: 前面還有一個專門處理三角形的前端，這個triangles/s就是

→ tactics2100: 既然強成這樣那就不要焊死做成像cpu一樣可以換晶片16F 10/13 10:32

→ oopFoo: 處理能力。看不見的三角形就在這拋棄，點(vertex)也在這算17F 10/13 10:34

→ tactics2100: 就算效能會降一些應該還是卡cpu瓶頸18F 10/13 10:34

→ oopFoo: 出。Ada這一代看起來fe太弱，跟不上shader的處理能力。19F 10/13 10:34

→ friedpig: Ada本來傳言就是 ampere 台GG版靠GG製程規模拉大很多20F 10/13 10:36

→ oopFoo: Mesh Shader可以一次處理一堆三角形，可以降低fe的壓力，21F 10/13 10:36

→ friedpig: 傳統性能部分看起來改變不大暴力+大而已其他進步都在22F 10/13 10:37

→ oopFoo: 但現在用Mesh Shader的遊戲還很少。23F 10/13 10:37

推 MoneyBlue: 看來是遊戲程式設計跟不上老黃24F 10/13 10:51

噓 a000000000: 幹尼老黃25F 10/13 10:55

推 aegis43210: 主要的改善在即時光追，GPC的主要變動是L2變大26F 10/13 10:58

→ friedpig: 看下一代狀況吧下一代還有MCM 整體應該會改更大27F 10/13 10:59
→ friedpig: 不過這代用GG已經不錯了可以戰蠻久又不熱

推 aegis43210: 所以效能爆增幾乎都是GG的貢獻29F 10/13 11:02

→ hong414: 遊戲廠的問題不關我們老黃的事配合nv是他們的責任30F 10/13 11:02

推 nmkl: 看來等蘇媽的了31F 10/13 11:04

噓 as6633208: 沒邏輯，各大測試結果很明顯就是cpu瓶頸的特徵。按你說32F 10/13 11:12
→ as6633208: 數據會「塞」在gpu前端，不就代表gpu根本還沒完成圖像
→ as6633208: 運算就請求下一個運算數據？這樣的話是不是只要跑個一
→ as6633208: 兩小時，前端就會卡一卡車的數據，然後就開始變慢了？
→ as6633208: 你確定？前端問題應該是gpu瓶頸吧？你當那些測試的連gp
→ as6633208: u瓶頸跟cpu瓶頸都分不出來嗎？
→ as6633208: 找個中國論壇不知到什麼咖的鄉民的廢文，就想推翻cpu瓶
→ as6633208: 頸測試結果，我也是笑，資料嚴謹度比維基百科還廢

→ oopFoo: 我開始寫3d程式是比老黃的tnt還早。從triangle setup開始40F 10/13 11:42
→ oopFoo: T&L，geometry/hull stages，compute, mesh shader，幾乎
→ oopFoo: 通通都經歷過。從cpu做culling，變成coarse culling，現在
→ oopFoo: 再變成mesh shader來culling。Mesh Shader 其實跟ps2的vpu
→ oopFoo: 與ps3的spu很像。硬體，軟體的變化，算是都跟上了。你要說
→ oopFoo: 我比那些只會測試的人不懂？

推 keyman2: 看不懂但是好厲害的樣子46F 10/13 11:47

→ oopFoo: ada的triangles/s的rate都出來了，瓶頸在那已經很清楚了47F 10/13 11:50

推 jimmyyang207: 那懂哥可以幫我們科普一下為何有些測試看起來跟CPU48F 10/13 11:52
→ jimmyyang207: 的性能有直接關係呢？感恩

推 ddrbox: 若是DL/ML用途，是不是FE的壓力就沒這麼大？50F 10/13 11:53

推 boren: 我也不明白，所以是只要畫面的三角形太多GPU就跑不滿？51F 10/13 11:56

→ a85139138: 原來有行家啊52F 10/13 12:01
→ a85139138: 也想請教一下前端的triangles/s
→ a85139138: 造成的瓶頸，CPU是怎麼cover的

推 a45351: 所以是cpu在強也沒用嗎55F 10/13 12:05

→ oopFoo: dl/ml用不到這個fe。對，太多三角形就shaders在等。56F 10/13 12:06
→ oopFoo: 現在的triangles很多都是gpu自己在產生的，cpu只是下指令

推 aimlin: 硬體不是nv的問題是消費者的問題58F 10/13 12:08

→ oopFoo: 而已，很多傳統cpu在處理，能轉到gpu處理的都轉過去。cpu59F 10/13 12:08
→ oopFoo: 在這能幫助的很有限，基本上現在3d繪圖程式的優化都是如何
→ oopFoo: 讓gpu能全速前進，cpu盡量不要去打擾。

推 Nonegrame: 可以開始等5090了62F 10/13 12:10

推 twinkleAshed: Ada是不是架構沒有跟上整個硬體規模才會卡住?63F 10/13 12:13
→ twinkleAshed: 如果簡而言之的話?

→ ileva3324: 等50+165F 10/13 12:14

推 LiNcUtT: 故意留一手啦,不然50系要出啥XD66F 10/13 12:19
→ LiNcUtT: 反正牛肉端一半就打死競品了,沒必要一次全上完吧

推 landy0910: 看不懂（ry68F 10/13 12:22

推 Supasizeit: 不然你要買AMD69F 10/13 12:23

推 ddrbox: 了解，換言之，4090的目標客群是專業市場，遊戲只是附加70F 10/13 12:23
→ ddrbox: 的

推 Bencrie: 理想狀況就是送很少的資料能畫很複雜的圖72F 10/13 12:27

推 BraviaX95j: 我就問front End是什麼？73F 10/13 12:28

推 huhu12301231: 既然你懂這麼多幹嘛要貼對岸文寫一篇提升一下板上74F 10/13 12:32
→ huhu12301231: 水準呀

推 vig077: 昨天還在吹==76F 10/13 12:38

推 smallreader: 推專業解釋幹你老黃77F 10/13 12:38

→ commandoEX: 或許也可以說是4090的目標已經不是fhd這些解析度不是78F 10/13 12:40
→ commandoEX: 嗎？

→ intela03252: 大概就是要你積極啟用dlss那些東西吧80F 10/13 12:41
→ intela03252: 3080ti dlss開起來也不太容易感覺出畫質減損了
→ intela03252: 2077不開dlss真的很難衝高幀數

推 poi96300: 13代解禁後效能提升 GPU使用率提高時我看你怎麼解釋83F 10/13 12:53

推 ronald279: 看不懂QQ84F 10/13 13:02

→ oopFoo: 其實就是取捨，AI/RT比較重要，Mesh/Task Shader普及後，85F 10/13 13:20
→ oopFoo: FE的瓶頸也就解除了。某方面也是戰未來。

推 TaiwanBeijin: 原po或許是架構上專家但卻不是商業成本的專家講87F 10/13 13:26
→ TaiwanBeijin: 的東西經常只看架構而忽略製造成本

推 leviva: 如果13900K / 7950X / 7800X3D 1080p / 2k 都拉不開跟30989F 10/13 13:31
→ leviva: 0 Ti的差距，證明cpu瓶頸完全是偽概念（而且買4090的,
→ leviva: 99.99% 開4K畫質，完全不受影響）

推 KoiKaze: 優文92F 10/13 13:56

推 sx4152: 合理阿怎麼可能現在這麼強的cpu會是瓶頸93F 10/13 13:58

推 google60411: 太難懂了拔草測風向94F 10/13 13:59

推 ctes940008: 不明覺厲95F 10/13 14:07

推 sdbb:96F 10/13 14:08

→ LiNcUtT: 13代解禁後就知道了,剩一個禮拜97F 10/13 14:23

推 NodeWay: 看13900k有沒有提升就知道了98F 10/13 14:40
→ NodeWay: 終於等到13900+4090了

推 rickie1141: 拔草測風向100F 10/13 14:53

→ bbest: levi大講到重點,等13代解禁就知道這篇是神預測還是喇叭文了101F 10/13 15:26

推 mrme945: 已經有人拿7950X測過了，一樣瓶頸呀102F 10/13 15:30

→ gbcg9725: 等等黨又可以等50了103F 10/13 16:10

→ ddfg: 因為現在cpu都在劑牙膏104F 10/13 16:12

推 kuninaka: 這篇的解釋合理啊，FE無能讓後端的shader在等105F 10/13 16:12

推 RaiGend0519: 大神出沒106F 10/13 16:13

→ kuninaka: 以前CPU負責送三角形現在是GPU自己送107F 10/13 16:13

→ ddfg: 講得好像13代很神一樣，製程沒變化還不是12代再捏上去108F 10/13 16:14

→ kuninaka: 遊戲設計跟不上老黃XDD109F 10/13 16:15

→ minipopy0314: 我都在等100系了老黃你快改阿110F 10/13 16:16

→ www123442: CPU佔用才20~30%講CPU瓶頸不然是要做到單核10GHz嗎？111F 10/13 16:49

→ tactics2100: 那是因為很多遊戲不支援全核運作(常見的就1～4核)112F 10/13 16:53
→ tactics2100: 遊戲會卡但是遊戲以外的軟體不卡

→ ltytw: 不可質疑你的老黃你NV價值不足？難道你要買AMD？114F 10/13 17:35

推 lee988325: cpu有可能是單核瓶頸可是評測的沒秀只能猜測115F 10/13 17:54

推 wantsu: 你可以買i皇的顯卡，弱到CPU絕不可能是瓶頸116F 10/13 17:55

→ fywei: 敢嘴老黃你 ...117F 10/13 17:56

→ a27417332: 有點好奇為什麼每週期的三角形處理率變低118F 10/13 18:02
→ a27417332: 可以推到瓶頸是在前端的結論？有其他數據證明嗎？

推 CORYCHAN: O大好資深120F 10/13 19:12

→ a85139138: 你還是沒有解答為何5800X和X3D121F 10/13 19:23
→ a85139138: 會有差距，就是因為看到這個差距
→ a85139138: 加上FHD提升非常有限，我們才覺得
→ a85139138: 可能跟CPU有關，如果真的是FE原因
→ a85139138: 那有辦法解釋這個結果嗎

推 ipspro: 等13900k解禁不就知道是不是瓶頸了126F 10/13 21:16

推 tint: 發表會公佈的GPC結構圖就可以看出SM結構沒什麼改變127F 10/13 21:37
→ tint: 這次ADA的結構沒有大改主要是頻率拉高、加大L2、增加SM規模
→ tint: 這篇推算出前端的效率看起來合理前端效率沒跟上規模的增加
→ tint: 另外 N卡對於CPU效能較依存的現象這是從Kepler就開始的
→ tint: 因為從Kepler架構開始 NV將Scheduling過程一部分轉移給CPU
→ tint: 來處理所以Fermi之後的架構 NV的GPU對CPU的依賴會相對高些
→ tint: 但NV這樣做的好處是可以大幅降低CUDA執行緒上的延遲
→ tint: 架構簡化亦能進一步提昇GPU的能耗比

→ savagy: 終於等到t大開釋，雖然還是看不懂135F 10/13 21:56

推 tint: 當年GTX600系列發售後就有一些關於新GPU對CPU依賴性的測試136F 10/13 22:14
→ tint: http://vga.zol.com.cn/290/2906445.html 當時對岸的測試文
→ tint: #1OubQ0fR (PC_Shopping) 板上有人po過的解析文章
→ tint: https://i.imgur.com/Kq7zjHs.png

[閒聊] 【AMD/NVIDIA】HWS vs SWS: 誰是贏家？ - 看板 PC_Shopping - 批踢踢實業坊

原出處：中文翻譯整理： -- NerdTechGasm做了一期影片講述了GCN架構和NVIDIA從Fermi到現在Scheduler的變化能夠很清楚的解釋為什麼當前GCN的A卡在DX11下性能不及N卡，以及為何DX12下A卡發揮更

→ tint: Kepler架構後Scheduling過程的一部分由驅動交由CPU處理140F 10/13 22:18
→ tint: 所以原標題依賴CPU和本篇前端處理效率跟不上覺得都是合理的
→ tint: GPU的發展方向每隔幾年都會有一些變革現在也許又到變革期

推 aegis43210: 5800x3d表現比較好是因為L3大，指令命中率更高，使GPU143F 10/13 22:26
→ aegis43210: 前端壓力變小

→ tint: 早年3D加速晶片->硬體T&L進入GPU時期->統一著色器架構時期145F 10/13 22:30
→ tint: 繪圖晶片從早年狂堆多邊形生成效能轉為重點擺在著色器效能
→ tint: 到現在強化單/半精度效能強化AI效能和加入光追功能

→ oopFoo: 那個解析文章，亂扯一通，完全不懂drawcall的瓶頸是什麼。148F 10/13 22:46
→ oopFoo: vulkan/dx12很複雜，效能沒有提昇很多，因為每個遊戲都需
→ oopFoo: 要一堆PSO(Pipeline State Object)。每個pso都需要編譯，
→ oopFoo: 編譯沒辦法即時，micro stuttering比以前更厲害，Steam為
→ oopFoo: 了解決這個問題，cache pso起來，所以steam cache吃一堆。

推 kuninaka: 上面PO電蝦那篇文章被中國人吐槽，亂扯一通XDD153F 10/13 22:52
→ kuninaka: "這篇文章屬於牛頭不對馬嘴的典型例子，作者甚至不知道
→ kuninaka: 自己在說什麼，居然把任務調度和sm內的指令調度混為一談
→ kuninaka: 。"
推 kuninaka: https://i.imgur.com/SuG1ncR.jpg

→ oopFoo: 硬體廠商故意混淆，也是造成大家誤解的一大原因。158F 10/13 22:55

→ kuninaka: 低解析度4090跟3090差不多159F 10/13 22:55
→ kuninaka: 啊就卡在前面，後面爆幹強也沒用
→ kuninaka: 高負載才有用武之地
→ kuninaka: 其實也是好處？
→ kuninaka: 低負載買這麼強的卡炫富其實沒必要

推 tint: https://tinyurl.com/4nb6yr28 後藤弘茂專欄講解Kepler架構164F 10/14 01:10
→ tint: https://i.imgur.com/hpGLask.jpg

【後藤弘茂のWeekly海外ニュース】NVIDIAが次世代GPUアーキテクチャ「Kepler」のベールを剥いだ - PC Watch

→ tint: Fermi架構中Scheduling過程是有一部份移交給CPU處理的166F 10/14 01:12
→ tint: 當年的NV技術文件也有提到所以那篇解析文的立論是對的
→ tint: 只是後面它提的DX12這可能就他自己的觀點
→ tint: 那個中國人吐槽可能也沒去看過NV當年Kepler的技術文件
→ tint: 上面第三行沒打完整應是Fermi架構後的Kepler架構
→ tint: SM中的平行處理調度當然還是硬體層外移的是Pre-Scheduling

→ oopFoo: kepler只是把job board移出來而已。gpu其實很早就有cpu在172F 10/14 06:19
→ oopFoo: 裡面，Nvidia早在2016年就換RISC-V，比其他人都早。但Job
→ oopFoo: Board跟Scoring這些東東本來交給主機的CPU是比較適合的。
→ oopFoo: CPU管大的，gpu管sm的thread，各有適合的。但這影響的不是
→ oopFoo: 效率，是成本。

推 kaltu: 所以是GPU上內建的CPU瓶頸了，不是主板上那顆177F 10/14 07:00

→ oopFoo: 瓶頸的是geometry engine，也不是內建的cpu。那個就是專門178F 10/14 07:13
→ oopFoo: 處理三角形該怎麼對應到frame buffer上。
→ oopFoo: 以前是歸類於前端(FE)，但現在中段也會用的到。

推 ltytw: 推t大181F 10/14 07:32

推 CharleneTsai: 結論等50看看182F 10/14 10:57

推 a85139138: 感謝o大t 大解釋，雖然沒看很懂183F 10/14 11:42
→ a85139138: 先存起來再說

推 boren: 我還好奇的是，為什麼4K能比1080P使用率更高？1080P的三角185F 10/14 12:54
→ boren: 型比較多？應該不是吧？

推 tint: 衡量GPU效能一項指標是填充率一般主要會指像素和紋理填充率187F 10/14 13:50
→ tint: 當解析度愈高 GPU要渲染的像素也愈多每秒能繪製格數就下降
→ tint: 所以boren是指哪方面的使用率？

推 boren: 就是工作管理員能看到的GPU使用率，但你這麼一說我懂了，解190F 10/14 14:07
→ boren: 析度高的時候GPU就加重別的工作了，這時front end就不需要
→ boren: 拼命畫三角形了

推 LastAttack: CPU瓶頸論者幹嘛一直喊13900k==也就多兩簇小核、時脈193F 10/14 16:11
→ LastAttack: 拉一成

※ 看板: PC_Shopping　文章推薦值: 0 目前人氣: 0 累積人氣: 102　

分享網址: 複製

回到看板(←)《PC_Shopping》

→

guest

x)推文 r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄同主題: =)首篇 [)上篇 ])下篇

回列表(←) 分享