※ 本文轉寄自 ptt.cc 更新時間: 2021-04-09 07:49:08
看板 PC_Shopping
作者 標題 Re: [情報] 如果 AMD 也支援 AVX-512 指令集會發生
時間 Thu Apr 8 10:25:15 2021
TL;DR
https://www.phoronix.com/scan.php?page=article&item=rocket-lake-avx512&num=1
AVX / AVX2 / AVX-512 Performance + Power On Intel Rocket Lake - Phoronix Phoronix is the leading technology website for Linux hardware reviews, open-source news, Linux benchmarks, open-source benchmarks, and computer hardwa ...
看跑分就好了
AVX-512
結論 效能跟耗電同比上升,值不值看個人,我個人覺得不值
對照 預設跑分的ryzen 5800x
https://openbenchmarking.org/result/2102077-HA-2101171PT68
Ubuntu 20.10 Kernels AMD Zen 3 Benchmarks - OpenBenchmarking.org Performance benchmarks of Ubuntu 20.10 Kernels AMD Zen 3. ...
還是輸到脫褲
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.136.103.176 (臺灣)
※ 文章代碼(AID): #1WRccGgM (PC_Shopping)
※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1617848720.A.A96.html
→ kimula01 …
→ : 人家zen3 avx2 就跑得比core11 avx-512快了....2F 04/08 10:30
推 : 就看ZEN4的AVX512表現如何阿3F 04/08 11:23
推 : AI的Inference會比較快。4F 04/08 11:32
→ : avx512又不是牙膏閒閒沒事硬做的 客戶有需求去生8F 04/08 12:34
→ : 出來的 當然消費級的就被硬塞用不太到的東西就是了
→ : 出來的 當然消費級的就被硬塞用不太到的東西就是了
→ : 特殊擴充指令集本來就是有用到就很有效率啊10F 04/08 12:37
→ : 今天你去創造一個特殊指令再量身打造一個跑分指標
→ : 一定也天下無敵
→ : 問題多少客戶有用到 多頻繁使用的而已
→ : 今天你去創造一個特殊指令再量身打造一個跑分指標
→ : 一定也天下無敵
→ : 問題多少客戶有用到 多頻繁使用的而已
推 : 一般用戶真的會用到avx512嗎?TR或EPYC等級再給就14F 04/08 12:40
→ : 行了吧 像dx12從底層撰寫能提高優化 但沒幾個團隊
→ : 真的會用
→ : 行了吧 像dx12從底層撰寫能提高優化 但沒幾個團隊
→ : 真的會用
推 : 你覺得用Adobe的客戶算很少嗎?17F 04/08 12:45
→ : "本來想解釋 想想算了,大概也沒人看的懂"真萬用XD18F 04/08 12:46
→ : 實際上我覺得影音編輯算是一般人常用到的吃效能的19F 04/08 12:47
→ : 產品
→ : 再少一點就數值分析
→ : 產品
→ : 再少一點就數值分析
推 : 實際上AVX512的問題是有程式混用其他指令集 然後效22F 04/08 12:49
→ : 率就沒有純AVX512來的好看
→ : 率就沒有純AVX512來的好看
→ : 還有一個問題是大家都很想一步到位 沒有前幾版硬體24F 04/08 12:57
→ : 的砲灰慢慢優化下去 怎麼可能會好用 現在軟硬體都太
→ : 複雜了 都要很多時間慢慢調整
→ : 的砲灰慢慢優化下去 怎麼可能會好用 現在軟硬體都太
→ : 複雜了 都要很多時間慢慢調整
Why Ice Lake is Important (a bit-basher’s perspective) – Branch Free
With Computex, there's been a ton of news about Ice Lake (hereafter ICL) and the Sunny Cove core (SNC). Wikichip, Extremetech and Anandtech among many ...
With Computex, there's been a ton of news about Ice Lake (hereafter ICL) and the Sunny Cove core (SNC). Wikichip, Extremetech and Anandtech among many ...
推 : 欸 其實我覺得那個倒還...就參考29F 04/08 13:03
→ : 有意義的還是benchmark
→ : 這次Intel比較掉漆的是多線程AVX512應用會狀功耗牆
→ : 有意義的還是benchmark
→ : 這次Intel比較掉漆的是多線程AVX512應用會狀功耗牆
推 : x86的強勢就在這些特殊擴充指令集呀,並不是只有i皇32F 04/08 13:04
→ : 要面對ARM的浪潮,而是整個x86
→ : 要面對ARM的浪潮,而是整個x86
→ : 不然一般應用大家用起來CPU都差不多快了34F 04/08 13:05
→ : 功耗牆很難撞上的,真正使用起來記憶體的頻寬跟本不35F 04/08 13:08
→ : 夠。benchmark只是測指令,才會功耗那麼高。大部份
→ : 情況是卡在記憶體存取,cpu在等待。
→ : https://reurl.cc/Q7xOLp
→ : 夠。benchmark只是測指令,才會功耗那麼高。大部份
→ : 情況是卡在記憶體存取,cpu在等待。
→ : https://reurl.cc/Q7xOLp
Ice Lake AVX-512 Downclocking | Performance Matters
Examining the extent of AVX related downclocking on Intel’s Ice Lake CPU ...
Examining the extent of AVX related downclocking on Intel’s Ice Lake CPU ...
→ : 我記得Bios Default不是碰到AVX就會降了嗎 AVX頻率39F 04/08 13:13
→ : 脫鉤的設定 導致頻率飄比較大
→ : 脫鉤的設定 導致頻率飄比較大
→ : 噴火湖幾乎不降速,但噴功耗。41F 04/08 13:15
→ : 噴功耗也很嚴重阿 大家散熱很摳的42F 04/08 13:16
→ : AVX512畢竟性能不會是256兩倍43F 04/08 13:20
→ : 用AVX256高時脈+多幾核 反而更有效率
→ : AMD即使支援AVX512, 也很可能
→ : 不想透過硬體實作1Cycle 512bit
→ : 改用2Cycle 256bit更省電晶體
→ : 用AVX256高時脈+多幾核 反而更有效率
→ : AMD即使支援AVX512, 也很可能
→ : 不想透過硬體實作1Cycle 512bit
→ : 改用2Cycle 256bit更省電晶體
推 : 就幾乎不可能噴功耗啊。這些測試都是fma*100次然後48F 04/08 13:22
→ : 把那個資源拿去實作更強更多核49F 04/08 13:22
→ : 都不存取記憶體。實際沒有程式這樣跑的,一定是讀取50F 04/08 13:23
→ : 那個為什麼512很重要論 在12代就糗了51F 04/08 13:24
→ : 幾個指令處理再存回去。不可能用fmadd*100次。52F 04/08 13:24
→ : AlderLake搞大小核 為求指令一致性53F 04/08 13:24
→ : 放棄掉AVX512
→ : 於是AVX明年突然又不重要了
→ : 放棄掉AVX512
→ : 於是AVX明年突然又不重要了
推 : 真的12代沒有就尷尬了,等被Zen4痛宰56F 04/08 13:27
→ : 如果大小核省電性贏不了GG黑科技製程57F 04/08 13:31
→ : 又沒AVX512可以吹,不知道怎麼戰
→ : 又沒AVX512可以吹,不知道怎麼戰
推 : 比省電應該會贏拉,只是大小核調度沒做好也沒用59F 04/08 13:35
→ : 確定小核一定更省嗎60F 04/08 13:40
→ : 明年Zen4 5nm vs 10nm 12代
→ : 明年Zen4 5nm vs 10nm 12代
→ : 到時候跟bulldozer一樣被OS衝康就好笑了62F 04/08 13:42
→ : 那跨核切換搬移也是額外耗電63F 04/08 13:43
→ : 要長時間待在小核才有省電意義
→ : 但又不是用在手機....
→ : 要長時間待在小核才有省電意義
→ : 但又不是用在手機....
推 : 大小核設計的主要目標是筆電吧 桌機就有點意義不明66F 04/08 13:45
→ : 省電有兩條路線 1.用小核心67F 04/08 13:46
→ : 2.用先進製程把大核面積做小 降壓
→ : 2.用先進製程把大核面積做小 降壓
推 : 是阿要壓功耗把大核關掉應該很漂亮,只是實際使用就69F 04/08 13:47
→ : 不是這樣了
→ : 不是這樣了
→ : 小核但製程輸人 是有可能沒更省電71F 04/08 13:47
→ : 只能說跟同製程的大核比是省電
→ : 只能說跟同製程的大核比是省電
→ : 只是zen4還有個iod在那邊應該不至於小核功耗還輸,A73F 04/08 13:48
→ : PU就不敢說了
→ : PU就不敢說了
→ : 問題是萬一對手不講武德 下單GG5nm75F 04/08 13:48
→ : 連IOD都可能搬到GG7nm
→ : 就像蘋果A14的小核其實也不小
→ : 小核ipc暴力到有A76的96%
→ : 但蘋果製程砸錢包產能 領先對手一代
→ : 亂序多發射中核靠製程縮小 當小核用
→ : 連IOD都可能搬到GG7nm
→ : 就像蘋果A14的小核其實也不小
→ : 小核ipc暴力到有A76的96%
→ : 但蘋果製程砸錢包產能 領先對手一代
→ : 亂序多發射中核靠製程縮小 當小核用
→ : n5功耗降20%有很多嗎?81F 04/08 14:01
→ : 不知道第幾次看到製程大師在吹n5功耗有多低
→ : 不知道第幾次看到製程大師在吹n5功耗有多低
推 : 12代本來就會被zen4痛宰,要和Zen4打的是13代83F 04/08 14:23
推 : 如果沒有用,AMD不會在ZEN4支援拉84F 04/08 14:44
→ : 講這麼多
→ : 講這麼多
→ : 我以為現在x86的優勢只剩下固有生態(X86F 04/08 15:14
推 : AVX-512這應該是要用上AI.伺服器.特殊運算等,AMD才87F 04/08 15:24
→ : 會塞進去
→ : 會塞進去
→ : n5低不低是看跟誰比 不是跟 GG自己比89F 04/08 15:33
→ : 因為連GG7省電實測都贏三星5
→ : 因為連GG7省電實測都贏三星5
推 : 按照現在一個ccd通吃的手法如果真的實作512bit電路91F 04/08 15:43
→ : 上去消費級不想要也得吞,要嘛用現有256bit電路做相
→ : 容要嘛消費級ccd另外做不然AVX應該會是全面性支援
→ : AVX512*
→ : 上去消費級不想要也得吞,要嘛用現有256bit電路做相
→ : 容要嘛消費級ccd另外做不然AVX應該會是全面性支援
→ : AVX512*
→ : 4ghz以上n7p打不過10sf,10esf功耗再降15%,請問n95F 04/08 16:29
→ : 5p功耗是能夠低多少?
→ : 5lpe那種拉到1.0v就已經比不過無印版n7就別拿來搞
→ : 笑了,高中生打架找個國中生加入混戰是來當小丑的
→ : 嗎?
→ : 5p功耗是能夠低多少?
→ : 5lpe那種拉到1.0v就已經比不過無印版n7就別拿來搞
→ : 笑了,高中生打架找個國中生加入混戰是來當小丑的
→ : 嗎?
推 : IOD用7nm應該會很爽100F 04/08 19:27
推 : 請問高頻的10sf那裡買的到呢?101F 04/08 20:03
→ : tgl-u不是10sf是什麼,還是說tgl-u沒跑上4g?102F 04/08 20:07
推 : 哇,高頻好厲害,拍拍手,那怎麼不上桌機?噗疵103F 04/08 21:11
→ : H版都做不出來就不要拿出來說嘴了啦
→ : H版都做不出來就不要拿出來說嘴了啦
→ : 說製程性能就跳針到能不能生出來的問題?h45還有兩105F 04/08 21:21
→ : 個月就出來了,原來這叫生不出來。
→ : tgl-u的高頻實際上還比h45差一點,h35只能單核tur
→ : bo 5g,h45可以雙核,順帶一提,h45 4.5g pl2 120
→ : w。
→ : 至於不上dt的原因,q3 adl-s就要上了,現在出tgl-
→ : s是打算賣多久?rkl-s可是delay了將近半年
→ : 個月就出來了,原來這叫生不出來。
→ : tgl-u的高頻實際上還比h45差一點,h35只能單核tur
→ : bo 5g,h45可以雙核,順帶一提,h45 4.5g pl2 120
→ : w。
→ : 至於不上dt的原因,q3 adl-s就要上了,現在出tgl-
→ : s是打算賣多久?rkl-s可是delay了將近半年
→ : 10nm superfin的良率能超過50%再說吧112F 04/08 21:29
→ : zen3+瞄準6nm不是沒有原因的
→ : zen3+瞄準6nm不是沒有原因的
→ : 去年武漢肺炎的影響下有多少東西真的能準時出來還114F 04/08 21:29
→ : 夠產能?
→ : 請問誰告訴你10sf良率不過50%的?
→ : 夠產能?
→ : 請問誰告訴你10sf良率不過50%的?
→ : 不用別人告訴我,core11沒能搭上10nm 就是鐵證117F 04/08 21:32
→ : 原來這就叫鐵證,10sf良率不夠50%還敢砍掉rkl-u,118F 04/08 21:38
→ : 甚至把die size從上一代的120mm^2加大到接近150mm
→ : ^2
→ : icl-u的良率都不止50%,原來1.35v可以跑上5g的製程
→ : 良率可以低於50%
→ : 甚至把die size從上一代的120mm^2加大到接近150mm
→ : ^2
→ : icl-u的良率都不止50%,原來1.35v可以跑上5g的製程
→ : 良率可以低於50%
--
※ 看板: PC_Shopping 文章推薦值: 1 目前人氣: 0 累積人氣: 296
( ̄︶ ̄)b enix999999 說讚!
→
guest
回列表(←)
分享