顯示廣告
隱藏 ✕
※ 本文轉寄自 ptt.cc 更新時間: 2021-04-09 07:49:08
看板 PC_Shopping
作者 kqalea (沙丁魚罐頭)
標題 Re: [情報] 如果 AMD 也支援 AVX-512 指令集會發生
時間 Thu Apr  8 10:25:15 2021


TL;DR
https://www.phoronix.com/scan.php?page=article&item=rocket-lake-avx512&num=1
AVX / AVX2 / AVX-512 Performance + Power On Intel Rocket Lake - Phoronix Phoronix is the leading technology website for Linux hardware reviews, open-source news, Linux benchmarks, open-source benchmarks, and computer hardwa ...

 

看跑分就好了

AVX-512

結論 效能跟耗電同比上升,值不值看個人,我個人覺得不值

對照 預設跑分的ryzen 5800x

https://openbenchmarking.org/result/2102077-HA-2101171PT68
Ubuntu 20.10 Kernels AMD Zen 3 Benchmarks - OpenBenchmarking.org Performance benchmarks of Ubuntu 20.10 Kernels AMD Zen 3. ...

 

還是輸到脫褲

--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.136.103.176 (臺灣)
※ 文章代碼(AID): #1WRccGgM (PC_Shopping)
※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1617848720.A.A96.html
kimula01 
kimula01    : 主要還是看應用 支援AVX可讓特殊需求者更多選擇1F 04/08 10:27
kqalea      : 人家zen3 avx2 就跑得比core11 avx-512快了....2F 04/08 10:30
kuninaka    : 就看ZEN4的AVX512表現如何阿3F 04/08 11:23
xiemark     : AI的Inference會比較快。4F 04/08 11:32
oopFoo      : https://i.imgur.com/flYfkZw.png5F 04/08 12:14
oopFoo      : 會寫avx512的話,效能就可以差好幾倍。本來想解釋
oopFoo      : 想想算了,大概也沒人看的懂。
[圖]
friedpig    : avx512又不是牙膏閒閒沒事硬做的   客戶有需求去生8F 04/08 12:34
friedpig    : 出來的 當然消費級的就被硬塞用不太到的東西就是了
delaluna    : 特殊擴充指令集本來就是有用到就很有效率啊10F 04/08 12:37
delaluna    : 今天你去創造一個特殊指令再量身打造一個跑分指標
delaluna    : 一定也天下無敵
delaluna    : 問題多少客戶有用到 多頻繁使用的而已
littlefish1 : 一般用戶真的會用到avx512嗎?TR或EPYC等級再給就14F 04/08 12:40
littlefish1 : 行了吧  像dx12從底層撰寫能提高優化 但沒幾個團隊
littlefish1 : 真的會用
arrenwu     : 你覺得用Adobe的客戶算很少嗎?17F 04/08 12:45
powerair    : "本來想解釋 想想算了,大概也沒人看的懂"真萬用XD18F 04/08 12:46
arrenwu     : 實際上我覺得影音編輯算是一般人常用到的吃效能的19F 04/08 12:47
arrenwu     : 產品
arrenwu     : 再少一點就數值分析
bobbyac01   : 實際上AVX512的問題是有程式混用其他指令集 然後效22F 04/08 12:49
bobbyac01   : 率就沒有純AVX512來的好看
friedpig    : 還有一個問題是大家都很想一步到位  沒有前幾版硬體24F 04/08 12:57
friedpig    : 的砲灰慢慢優化下去 怎麼可能會好用 現在軟硬體都太
friedpig    : 複雜了 都要很多時間慢慢調整
oopFoo      : https://reurl.cc/2bVvMa27F 04/08 13:01
oopFoo      : 如果想知道為什麼avx512重要,看這篇。Intel人講的
Why Ice Lake is Important (a bit-basher’s perspective) – Branch Free
[圖]
With Computex, there's been a ton of news about Ice Lake (hereafter ICL) and the Sunny Cove core (SNC). Wikichip, Extremetech and Anandtech among many ...

 
arrenwu     : 欸 其實我覺得那個倒還...就參考29F 04/08 13:03
arrenwu     : 有意義的還是benchmark
arrenwu     : 這次Intel比較掉漆的是多線程AVX512應用會狀功耗牆
aegis43210  : x86的強勢就在這些特殊擴充指令集呀,並不是只有i皇32F 04/08 13:04
aegis43210  : 要面對ARM的浪潮,而是整個x86
arrenwu     : 不然一般應用大家用起來CPU都差不多快了34F 04/08 13:05
oopFoo      : 功耗牆很難撞上的,真正使用起來記憶體的頻寬跟本不35F 04/08 13:08
oopFoo      : 夠。benchmark只是測指令,才會功耗那麼高。大部份
oopFoo      : 情況是卡在記憶體存取,cpu在等待。
oopFoo      : https://reurl.cc/Q7xOLp
Ice Lake AVX-512 Downclocking | Performance Matters
[圖]
Examining the extent of AVX related downclocking on Intel’s Ice Lake CPU ...

 
friedpig    : 我記得Bios Default不是碰到AVX就會降了嗎 AVX頻率39F 04/08 13:13
friedpig    : 脫鉤的設定 導致頻率飄比較大
oopFoo      : 噴火湖幾乎不降速,但噴功耗。41F 04/08 13:15
friedpig    : 噴功耗也很嚴重阿  大家散熱很摳的42F 04/08 13:16
kuma660224  : AVX512畢竟性能不會是256兩倍43F 04/08 13:20
kuma660224  : 用AVX256高時脈+多幾核  反而更有效率
kuma660224  : AMD即使支援AVX512, 也很可能
kuma660224  : 不想透過硬體實作1Cycle 512bit
kuma660224  : 改用2Cycle 256bit更省電晶體
oopFoo      : 就幾乎不可能噴功耗啊。這些測試都是fma*100次然後48F 04/08 13:22
kuma660224  : 把那個資源拿去實作更強更多核49F 04/08 13:22
oopFoo      : 都不存取記憶體。實際沒有程式這樣跑的,一定是讀取50F 04/08 13:23
kuma660224  : 那個為什麼512很重要論 在12代就糗了51F 04/08 13:24
oopFoo      : 幾個指令處理再存回去。不可能用fmadd*100次。52F 04/08 13:24
kuma660224  : AlderLake搞大小核 為求指令一致性53F 04/08 13:24
kuma660224  : 放棄掉AVX512
kuma660224  : 於是AVX明年突然又不重要了
oopFoo      : 真的12代沒有就尷尬了,等被Zen4痛宰56F 04/08 13:27
kuma660224  : 如果大小核省電性贏不了GG黑科技製程57F 04/08 13:31
kuma660224  : 又沒AVX512可以吹,不知道怎麼戰
b325019     : 比省電應該會贏拉,只是大小核調度沒做好也沒用59F 04/08 13:35
kuma660224  : 確定小核一定更省嗎60F 04/08 13:40
kuma660224  : 明年Zen4 5nm vs 10nm 12代
twflanker   : 到時候跟bulldozer一樣被OS衝康就好笑了62F 04/08 13:42
kuma660224  : 那跨核切換搬移也是額外耗電63F 04/08 13:43
kuma660224  : 要長時間待在小核才有省電意義
kuma660224  : 但又不是用在手機....
twosheep0603: 大小核設計的主要目標是筆電吧 桌機就有點意義不明66F 04/08 13:45
kuma660224  : 省電有兩條路線  1.用小核心67F 04/08 13:46
kuma660224  : 2.用先進製程把大核面積做小 降壓
b325019     : 是阿要壓功耗把大核關掉應該很漂亮,只是實際使用就69F 04/08 13:47
b325019     : 不是這樣了
kuma660224  : 小核但製程輸人  是有可能沒更省電71F 04/08 13:47
kuma660224  : 只能說跟同製程的大核比是省電
b325019     : 只是zen4還有個iod在那邊應該不至於小核功耗還輸,A73F 04/08 13:48
b325019     : PU就不敢說了
kuma660224  : 問題是萬一對手不講武德 下單GG5nm75F 04/08 13:48
kuma660224  : 連IOD都可能搬到GG7nm
kuma660224  : 就像蘋果A14的小核其實也不小
kuma660224  : 小核ipc暴力到有A76的96%
kuma660224  : 但蘋果製程砸錢包產能 領先對手一代
kuma660224  : 亂序多發射中核靠製程縮小 當小核用
leung3740250: n5功耗降20%有很多嗎?81F 04/08 14:01
leung3740250: 不知道第幾次看到製程大師在吹n5功耗有多低
aegis43210  : 12代本來就會被zen4痛宰,要和Zen4打的是13代83F 04/08 14:23
kuninaka    : 如果沒有用,AMD不會在ZEN4支援拉84F 04/08 14:44
kuninaka    : 講這麼多
a27417332   : 我以為現在x86的優勢只剩下固有生態(X86F 04/08 15:14
kngs555     : AVX-512這應該是要用上AI.伺服器.特殊運算等,AMD才87F 04/08 15:24
kngs555     : 會塞進去
kuma660224  : n5低不低是看跟誰比 不是跟 GG自己比89F 04/08 15:33
kuma660224  : 因為連GG7省電實測都贏三星5
b325019     : 按照現在一個ccd通吃的手法如果真的實作512bit電路91F 04/08 15:43
b325019     : 上去消費級不想要也得吞,要嘛用現有256bit電路做相
b325019     : 容要嘛消費級ccd另外做不然AVX應該會是全面性支援
b325019     : AVX512*
leung3740250: 4ghz以上n7p打不過10sf,10esf功耗再降15%,請問n95F 04/08 16:29
leung3740250: 5p功耗是能夠低多少?
leung3740250: 5lpe那種拉到1.0v就已經比不過無印版n7就別拿來搞
leung3740250: 笑了,高中生打架找個國中生加入混戰是來當小丑的
leung3740250: 嗎?
CORYCHAN    : IOD用7nm應該會很爽100F 04/08 19:27
Dissipate   : 請問高頻的10sf那裡買的到呢?101F 04/08 20:03
leung3740250: tgl-u不是10sf是什麼,還是說tgl-u沒跑上4g?102F 04/08 20:07
Dissipate   : 哇,高頻好厲害,拍拍手,那怎麼不上桌機?噗疵103F 04/08 21:11
Dissipate   : H版都做不出來就不要拿出來說嘴了啦
leung3740250: 說製程性能就跳針到能不能生出來的問題?h45還有兩105F 04/08 21:21
leung3740250: 個月就出來了,原來這叫生不出來。
leung3740250: tgl-u的高頻實際上還比h45差一點,h35只能單核tur
leung3740250: bo 5g,h45可以雙核,順帶一提,h45 4.5g pl2 120
leung3740250: w。
leung3740250: 至於不上dt的原因,q3 adl-s就要上了,現在出tgl-
leung3740250: s是打算賣多久?rkl-s可是delay了將近半年
kqalea      : 10nm superfin的良率能超過50%再說吧112F 04/08 21:29
kqalea      : zen3+瞄準6nm不是沒有原因的
leung3740250: 去年武漢肺炎的影響下有多少東西真的能準時出來還114F 04/08 21:29
leung3740250: 夠產能?
leung3740250: 請問誰告訴你10sf良率不過50%的?
kqalea      : 不用別人告訴我,core11沒能搭上10nm 就是鐵證117F 04/08 21:32
leung3740250: 原來這就叫鐵證,10sf良率不夠50%還敢砍掉rkl-u,118F 04/08 21:38
leung3740250: 甚至把die size從上一代的120mm^2加大到接近150mm
leung3740250: ^2
leung3740250: icl-u的良率都不止50%,原來1.35v可以跑上5g的製程
leung3740250: 良率可以低於50%

--
※ 看板: PC_Shopping 文章推薦值: 1 目前人氣: 0 累積人氣: 296 
作者 kqalea 的最新發文:
點此顯示更多發文記錄
分享網址: 複製 已複製
( ̄︶ ̄)b enix999999 說讚!
guest
x)推文 r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇