回看板
Disp BBS
看板
Stock
作者
breathair
(拆了?簡單了)
標題
Re: [新聞] DeepSeek R1來了,追平o1!它現在不但比OpenAI開放,也
時間
Mon Jan 27 21:55:30 2025
※ 引述《icrose (人本良心)》之銘言:
: 但是問題在於,如果中國中小公司用沒有一個海歸的團隊
: 就做出了這麼優秀的演算法優化
: 那如果全世界一起繼續優化,這半年又大幅發生成本降低怎麼辦,變形金剛模型其實算法
: 主體框架五六年沒有大的進化了
: 所以輝達和openai的只有堆算力一條路的敘事欺騙了世界兩年,現在敘事光環已破
: 用戶尤其是大用戶必然要重新審查自己的對輝達下單量。觀望或者只買原計劃的一部分是
: 理性的
: 中小用戶因為自搭模型門檻降低而發生需求大爆發,要等到什麼時候呢。目前不明朗,我
: 覺得,先跌2個月再說吧
應該不用那麼久
重點是DS是開源的
現在應該有許多數據中心已經開始實驗DS的演算法
我們先假設DS的創新
是往AGI道路上的王道
那麼在10萬張H100的算力訓練下
應該很快就能看到LLM的表現
在10萬張H100的暴力訓練下,質的突破
如果10萬張H100
跟2000張H800的訓練結果差不多
推理準確性沒有辦法有質的提升
那這個演算法不過是一個
地板很容易達到,但馬上會碰到天花板的
低成本的,但無成長性的演算法
馬上就會被要求更高準確性的模型區別開來
結局就是只能當基礎的,低成本的,內卷模型
如果10萬張暴力訓練,迎來質的突破
那算力依然是AI碾壓的條件之一
-----
Sent from JPTT on my iPhone
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.74.99.187 (臺灣)
※ 作者:
breathair
2025-01-27 21:55:30
※ 文章代碼(AID): #1dbv1Kt0 (Stock)
※ 文章網址:
https://www.ptt.cc/bbs/Stock/M.1737986132.A.DC0.html
※ 同主題文章:
Re: [新聞] DeepSeek R1來了,追平o1!它現在不但比OpenAI開放,也
01-27 20:15
kobebrian
Re: [新聞] DeepSeek R1來了,追平o1!它現在不但比OpenAI開放,也
01-27 20:29
icrose
Re: [新聞] DeepSeek R1來了,追平o1!它現在不
01-27 20:36
ohlong
Re: [新聞] DeepSeek R1來了,追平o1!它現在不但比OpenAI開放,也
01-27 21:07
TentoEtsu
Re: [新聞] DeepSeek R1來了,追平o1!它現在不但比OpenAI開放,也
01-27 21:55
breathair
Re: [新聞] DeepSeek R1來了,追平o1!它現在不但比OpenAI開放,
01-28 00:24
a3556959
推
herculus6502
: 有道理
1F 01/27 21:57
推
TentoEtsu
: 跟我想的一樣
2F 01/27 21:57
推
etset
: 怎麼會覺得 開發者沒試過一萬張
3F 01/27 21:58
推
openthedidi
: 這個才是正解
4F 01/27 21:58
推
nanako81240
: 內捲模型才好推廣阿 才有市場競爭力
5F 01/27 21:59
推
s800525
: 現在AI在專門類有用,但泛用性真的不怎樣,真的希望
能加速一下AI進步速度,不然通用性應用真的沒啥用
6F 01/27 21:59
→
nanako81240
: AI模型現在就是遇到拚多多了 直接跳過蝦皮
8F 01/27 21:59
推
zerro7
: 總覺得很像之前超導體 最後虛驚一場
9F 01/27 22:00
推
TentoEtsu
: 但是會不會10萬張下去天網直接誕生(對不起
10F 01/27 22:01
推
Lushen
: Deepseek=超導體2.0=ChatGPT套殼
=中共割韭菜
11F 01/27 22:01
推
s800525
: 如果AI進步只能靠堆硬體真的死路一條
13F 01/27 22:01
推
chuag
: 接下來是換h100大出貨吧XDDD
14F 01/27 22:01
→
Lushen
: 已經在脆上被揭露只是Open API串接
15F 01/27 22:02
推
Daikin
: 假如給DS的硬體是OPENAI的算力,會如何?
16F 01/27 22:02
推
uke823
: 所以華爾街都笨蛋嗎
17F 01/27 22:02
→
s800525
: 華爾街有時候表現真的像笨蛋一樣XD
常看美股就知道華爾街初一十五不一樣,常常洗自己臉
18F 01/27 22:02
推
freeclouds
: OpenAI串接 那OPEN AI不就噴爆
20F 01/27 22:03
→
NexusPrime
: 我想看看如果這個訓練架構真的可以這麼有效率,10
兆參數的LLM會有多強
21F 01/27 22:03
推
CMPunk
: 華西街找理由割韭菜賺大錢 哪裡笨了
23F 01/27 22:03
→
poru
: DS出現會加速AI之間的競爭態勢.
24F 01/27 22:04
推
uller
: 好像有道理
25F 01/27 22:04
推
uke823
: 抄底抄起來
26F 01/27 22:04
推
vicklin
: 華爾街天龍國被疫情和戰爭耍得團團轉也不是第一天
27F 01/27 22:04
→
JoeyChen
: 沒錯 看ds跟AI的天花板
28F 01/27 22:05
推
sunpedro0202
: 推
29F 01/27 22:05
推
TyuzuChou
:
https://i.imgur.com/OBFxyQJ.png
微軟去年買了45萬H100
30F 01/27 22:05
→
poru
: DS的出現等於中美AI競爭開啟.
32F 01/27 22:06
推
BruceChen227
: 抄底啦 盤前直接開撿
33F 01/27 22:07
→
TyuzuChou
: 合理推估deepseek從各種管道買進20萬個H100來衝模
型
34F 01/27 22:07
推
lusifa2007
: 那十萬張gb200能直接實現奇點嗎?
36F 01/27 22:07
推
ssdd740419
: 如果科技巨頭認為不停堆算力就能達到新境界 太好笑
37F 01/27 22:07
推
OSDim
: Goog買那麼少ㄛ
38F 01/27 22:07
→
JoeyChen
: 只是串接open AI?那是騙錢嗎?
39F 01/27 22:07
推
s800525
: 華爾街長期還是看財報,短線就跟鄉民一樣湊熱鬧到處
喊而已,這種短線常常喊完沒多久就自打臉的一堆,短
線看華爾街反映只會被割韭菜而已
40F 01/27 22:08
→
Liberl
:
https://reurl.cc/EgyGVv
Miula正在直播講deepseek
43F 01/27 22:08
推
liscp
: Ds 那麼猛 中共為什麼會讓它開源?
44F 01/27 22:08
→
fantasystar
: 在還沒有實現 AGI 的現在,如果 DS 可以加速的話,
會更多人買鏟子;如果 DS 的天花板很低,大家還是只
能乖乖買鏟子。買鏟子概念股明明就很穩,推測今天這
波下殺只是找個藉口殺散戶。
45F 01/27 22:08
推
koll
: 永遠要對中國數據存疑,就讓子彈飛一會,不要太急
49F 01/27 22:10
推
Mosskappa
: 而且DS是蒸餾OpenAI的數據,之後要發展更強大的模
型模型的成本只大不小
50F 01/27 22:10
推
chuag
: 差別在原本可以用gb200薛人現在變成h100
不過對gg就短空而已,東西都他做的
而且我不覺得硬體僅不只會停在h100 遲早會往上堆的
52F 01/27 22:10
→
IBIZA
: fantasystar 市場上買來訓練AI核心的晶片是少數
絕大部分是拿來架平台 給一般企業call訓練自己的AI
應用
55F 01/27 22:11
推
jumilin927
: 推,模型train出來後面學習的怎麼樣才是重點
58F 01/27 22:13
→
IBIZA
: 以Meta訓練Llama 4號稱史上最大叢集 10萬張H100
59F 01/27 22:14
推
jim543000
: 怎麼會有量變引起質變這種理解
60F 01/27 22:14
→
IBIZA
: 資本支出也才30億美元
Meta用來架構平台的資本支出是650億美元
也就是meta用來訓練自家AI的支本支出, 是架構商業
應用平台的1/20
整個AI市場 訓練AI核心的資本支出 應該只有平台的
零頭百分點
目前市場有能力訓練自己AI模型的 就幾家大頭
DS會讓這個門檻從幾十億美元 降到幾到幾十M
會讓架構大規模商業運用平台的成本 從百億 降到幾億
61F 01/27 22:14
推
andy810306
: 巨頭會比你還笨?早試過高參數的模型了,事實上就
是沒有太大的改善,所以低參數的勢必會來臨
70F 01/27 22:19
→
fantasystar
: 所以我的重點在於 AGI 跟其他目前還在"願景"裡的那
些AI夢。做現在的AI應用可以很便宜,但是要往前走還
是要繼續買鏟子。
72F 01/27 22:20
推
lifeterry
: 聞起來,是不是有 over booking 的味道
75F 01/27 22:20
→
IBIZA
: 我就跟你說了 做核心的只有整個市場資本支出的百分
之幾
76F 01/27 22:21
推
clecer
: pre-train就是快到極限算力推不動了,才在玩推理模
型,
78F 01/27 22:21
→
IBIZA
: 就算這百分之幾還是大量買鏟子 那也是百分之幾
更何況這些做核心的 也會參考 DS的模型 改善自己的
效率 以前要10萬張H100訓練的模型 現在只要2000張
你說鏟子還要多賣?
80F 01/27 22:21
→
clecer
: 算力成本降低,我看好應用端而且不需要太強的硬體
84F 01/27 22:22
→
IBIZA
: 投入的廠商會多好幾倍 但這些廠商需要的硬體能力
只是過去的幾趴而以
85F 01/27 22:23
推
Mosskappa
: AI也不只LLM吧,現在高端硬體依然供不應求,也不是
想買就買得到。
87F 01/27 22:24
→
puritylife
: 如果優化演算法效益開始遠超買鏟子
那鏟子的需求量勢必崩盤好嗎
鏟子貴到爆 錢轉去搞演算法反而更划算的話
你覺得他們還會死命買鏟子?
部分的投資轉移會是更明智的做法吧
89F 01/27 22:26
推
OSDim
: 覺得不會的記得放空,覺得繼續買的記得加碼
94F 01/27 22:28
推
TentoEtsu
: 聽Miula分析完 感覺變成送分題了 0.0
95F 01/27 22:37
推
kissa0924307
: 加倉+1
96F 01/27 22:39
推
clecer
: 我只知道巨頭的AI科學家會拼命優化演算法
不然被LAYOFF就是他們了
97F 01/27 22:39
→
ev331
: miula講什麼
99F 01/27 22:48
推
kobebrian
: 我就說了三個月前還有破百價 那怎麼跌的?讓子彈飛
一夥兒
476F 01/28 00:06
→
IBIZA
: 破百價好像又近了
478F 01/28 00:43
推
ejnfu
: 通常恐慌性賣壓都是進場好時機,已加碼
479F 01/28 00:44
推
jerry810113
: 泛用(x 專用合體(o
480F 01/28 01:49
推
ProTrader
: 再說一次 智障型手機成本降再低到1/500結果還是相同
智障型手機最後都是會被智慧型手機淘汰
現在的DS在AI發展中應該還沒達到智障型手機的水準
也就是說未來還會有更多更完備的AI模型出現
上面推文中也提到AI範圍很大 DS只是某個領域有成果
所以現在說未來高階硬體變成垃圾沒人要還是太早
資料模型演算法硬體的進步都是相輔相成
比較值得討論的是現在大廠搶硬體獲得市佔的策略
是不是會調整改成穩扎穩打按部就班
如果大廠不搶硬體對於賣鏟子的廠商來說確實較不利
但這跟高階硬體變成垃圾沒人要還是完全不同
至於股價高檔急跌在多頭中是很常見的現象
台積電要說空頭至少等到700之下再談
就算很急著要看空最少最少也先等台積電破1000再說
481F 01/28 03:07
--
作者 breathair 的最新發文:
+4
Re: [爆卦] 川普2/18起徵收晶片關稅 - Stock 板
作者:
breathair
42.78.118.13
(台灣)
2025-02-01 21:11:09
22F 5推 1噓
+5
Re: [新聞] 亞馬遜雲科技、英偉達、微軟紛紛上線Deep - Stock 板
作者:
breathair
42.78.118.13
(台灣)
2025-01-31 19:22:55
8F 5推
+66
Re: [新聞] DeepSeek R1來了,追平o1!它現在不但比OpenAI開放,也 - Stock 板
作者:
breathair
42.74.99.187
(台灣)
2025-01-27 21:55:30
應該不用那麼久 重點是DS是開源的 現在應該有許多數據中心已經開始實驗DS的演算法 我們先假設DS的創新 是往AGI道路上的王道 那麼在10萬張H100的算力訓練下 應該很快就能看到LLM的表現 在 …
494F 67推 1噓
+24
Re: [請益] 美債須設停損嗎? - Stock 板
作者:
breathair
42.76.242.227
(台灣)
2024-12-28 19:57:57
身為減倉債蛙 我一直覺得美債減倉不叫停損 而是資產再配置 一年前 軟著陸或硬著陸的可能未確定 配美債,我覺得沒什麼不好 現在是 軟著陸或不著陸的狀態 所有公司都在導入AI來實現獲利 資金擺太多在債券 …
63F 25推 1噓
+3
Re: [求助] 做得不好還是做得不夠? - marriage 板
作者:
breathair
42.71.106.62
(台灣)
2024-12-22 16:17:07
79F 4推 1噓
點此顯示更多發文記錄