Re: [新聞] DeepSeek R1來了，追平o1！它現在不但比OpenAI開放，也 - Stock板

看板 Stock
作者 breathair (拆了？簡單了)
標題 Re: [新聞] DeepSeek R1來了，追平o1！它現在不但比OpenAI開放，也
時間 Mon Jan 27 21:55:30 2025

※ 引述《icrose (人本良心)》之銘言：
: 但是問題在於，如果中國中小公司用沒有一個海歸的團隊
: 就做出了這麼優秀的演算法優化
: 那如果全世界一起繼續優化，這半年又大幅發生成本降低怎麼辦，變形金剛模型其實算法
: 主體框架五六年沒有大的進化了
: 所以輝達和openai的只有堆算力一條路的敘事欺騙了世界兩年，現在敘事光環已破
: 用戶尤其是大用戶必然要重新審查自己的對輝達下單量。觀望或者只買原計劃的一部分是
: 理性的
: 中小用戶因為自搭模型門檻降低而發生需求大爆發，要等到什麼時候呢。目前不明朗，我
: 覺得，先跌2個月再說吧

應該不用那麼久
重點是DS是開源的
現在應該有許多數據中心已經開始實驗DS的演算法

我們先假設DS的創新
是往AGI道路上的王道
那麼在10萬張H100的算力訓練下
應該很快就能看到LLM的表現
在10萬張H100的暴力訓練下，質的突破

如果10萬張H100
跟2000張H800的訓練結果差不多
推理準確性沒有辦法有質的提升

那這個演算法不過是一個
地板很容易達到，但馬上會碰到天花板的
低成本的，但無成長性的演算法
馬上就會被要求更高準確性的模型區別開來
結局就是只能當基礎的，低成本的，內卷模型

如果10萬張暴力訓練，迎來質的突破
那算力依然是AI碾壓的條件之一

-----
Sent from JPTT on my iPhone

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.74.99.187 (臺灣)
※ 作者: breathair 2025-01-27 21:55:30
※ 文章代碼(AID): #1dbv1Kt0 (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1737986132.A.DC0.html

※ 同主題文章:

Re: [新聞] DeepSeek R1來了，追平o1！它現在不但比OpenAI開放，也

01-27 20:15 kobebrian

Re: [新聞] DeepSeek R1來了，追平o1！它現在不但比OpenAI開放，也

01-27 20:29 icrose

Re: [新聞] DeepSeek R1來了，追平o1！它現在不

01-27 20:36 ohlong

Re: [新聞] DeepSeek R1來了，追平o1！它現在不但比OpenAI開放，也

01-27 21:07 TentoEtsu

Re: [新聞] DeepSeek R1來了，追平o1！它現在不但比OpenAI開放，也

01-27 21:55 breathair

Re: [新聞] DeepSeek R1來了，追平o1！它現在不但比OpenAI開放，

01-28 00:24 a3556959

推 herculus6502: 有道理1F 01/27 21:57

推 TentoEtsu: 跟我想的一樣2F 01/27 21:57

推 etset: 怎麼會覺得開發者沒試過一萬張3F 01/27 21:58

推 openthedidi: 這個才是正解4F 01/27 21:58

推 nanako81240: 內捲模型才好推廣阿才有市場競爭力5F 01/27 21:59

推 s800525: 現在AI在專門類有用，但泛用性真的不怎樣，真的希望能加速一下AI進步速度，不然通用性應用真的沒啥用6F 01/27 21:59

→ nanako81240: AI模型現在就是遇到拚多多了直接跳過蝦皮8F 01/27 21:59

推 zerro7: 總覺得很像之前超導體最後虛驚一場9F 01/27 22:00

推 TentoEtsu: 但是會不會10萬張下去天網直接誕生(對不起10F 01/27 22:01

推 Lushen: Deepseek=超導體2.0=ChatGPT套殼
=中共割韭菜11F 01/27 22:01

推 s800525: 如果AI進步只能靠堆硬體真的死路一條13F 01/27 22:01

推 chuag: 接下來是換h100大出貨吧XDDD14F 01/27 22:01

→ Lushen: 已經在脆上被揭露只是Open API串接15F 01/27 22:02

推 Daikin: 假如給DS的硬體是OPENAI的算力，會如何？16F 01/27 22:02

推 uke823: 所以華爾街都笨蛋嗎17F 01/27 22:02

→ s800525: 華爾街有時候表現真的像笨蛋一樣XD
常看美股就知道華爾街初一十五不一樣，常常洗自己臉18F 01/27 22:02

推 freeclouds: OpenAI串接那OPEN AI不就噴爆20F 01/27 22:03

→ NexusPrime: 我想看看如果這個訓練架構真的可以這麼有效率，10兆參數的LLM會有多強21F 01/27 22:03

推 CMPunk: 華西街找理由割韭菜賺大錢哪裡笨了23F 01/27 22:03

→ poru: DS出現會加速AI之間的競爭態勢.24F 01/27 22:04

推 uller: 好像有道理25F 01/27 22:04

推 uke823: 抄底抄起來26F 01/27 22:04

推 vicklin: 華爾街天龍國被疫情和戰爭耍得團團轉也不是第一天27F 01/27 22:04

→ JoeyChen: 沒錯看ds跟AI的天花板28F 01/27 22:05

推 sunpedro0202: 推29F 01/27 22:05

推 TyuzuChou: https://i.imgur.com/OBFxyQJ.png
微軟去年買了45萬H10030F 01/27 22:05

→ poru: DS的出現等於中美AI競爭開啟.32F 01/27 22:06

推 BruceChen227: 抄底啦盤前直接開撿33F 01/27 22:07

→ TyuzuChou: 合理推估deepseek從各種管道買進20萬個H100來衝模型34F 01/27 22:07

推 lusifa2007: 那十萬張gb200能直接實現奇點嗎？36F 01/27 22:07

推 ssdd740419: 如果科技巨頭認為不停堆算力就能達到新境界太好笑37F 01/27 22:07

推 OSDim: Goog買那麼少ㄛ38F 01/27 22:07

→ JoeyChen: 只是串接open AI?那是騙錢嗎?39F 01/27 22:07

推 s800525: 華爾街長期還是看財報，短線就跟鄉民一樣湊熱鬧到處喊而已，這種短線常常喊完沒多久就自打臉的一堆，短線看華爾街反映只會被割韭菜而已40F 01/27 22:08

→ Liberl: https://reurl.cc/EgyGVv Miula正在直播講deepseek43F 01/27 22:08

推 liscp: Ds 那麼猛中共為什麼會讓它開源？44F 01/27 22:08

→ fantasystar: 在還沒有實現 AGI 的現在，如果 DS 可以加速的話，會更多人買鏟子；如果 DS 的天花板很低，大家還是只能乖乖買鏟子。買鏟子概念股明明就很穩，推測今天這波下殺只是找個藉口殺散戶。45F 01/27 22:08

推 koll: 永遠要對中國數據存疑，就讓子彈飛一會，不要太急49F 01/27 22:10

推 Mosskappa: 而且DS是蒸餾OpenAI的數據，之後要發展更強大的模型模型的成本只大不小50F 01/27 22:10

推 chuag: 差別在原本可以用gb200薛人現在變成h100
不過對gg就短空而已,東西都他做的
而且我不覺得硬體僅不只會停在h100 遲早會往上堆的52F 01/27 22:10

→ IBIZA: fantasystar 市場上買來訓練AI核心的晶片是少數
絕大部分是拿來架平台給一般企業call訓練自己的AI應用55F 01/27 22:11

推 jumilin927: 推，模型train出來後面學習的怎麼樣才是重點58F 01/27 22:13

→ IBIZA: 以Meta訓練Llama 4號稱史上最大叢集 10萬張H10059F 01/27 22:14

推 jim543000: 怎麼會有量變引起質變這種理解60F 01/27 22:14

→ IBIZA: 資本支出也才30億美元
Meta用來架構平台的資本支出是650億美元
也就是meta用來訓練自家AI的支本支出, 是架構商業應用平台的1/20
整個AI市場訓練AI核心的資本支出應該只有平台的零頭百分點
目前市場有能力訓練自己AI模型的就幾家大頭
DS會讓這個門檻從幾十億美元降到幾到幾十M
會讓架構大規模商業運用平台的成本從百億降到幾億61F 01/27 22:14

推 andy810306: 巨頭會比你還笨？早試過高參數的模型了，事實上就是沒有太大的改善，所以低參數的勢必會來臨70F 01/27 22:19

→ fantasystar: 所以我的重點在於 AGI 跟其他目前還在"願景"裡的那些AI夢。做現在的AI應用可以很便宜，但是要往前走還是要繼續買鏟子。72F 01/27 22:20

推 lifeterry: 聞起來，是不是有 over booking 的味道75F 01/27 22:20

→ IBIZA: 我就跟你說了做核心的只有整個市場資本支出的百分之幾76F 01/27 22:21

推 clecer: pre-train就是快到極限算力推不動了，才在玩推理模型，78F 01/27 22:21

→ IBIZA: 就算這百分之幾還是大量買鏟子那也是百分之幾
更何況這些做核心的也會參考 DS的模型改善自己的效率以前要10萬張H100訓練的模型現在只要2000張你說鏟子還要多賣?80F 01/27 22:21

→ clecer: 算力成本降低，我看好應用端而且不需要太強的硬體84F 01/27 22:22

→ IBIZA: 投入的廠商會多好幾倍但這些廠商需要的硬體能力只是過去的幾趴而以85F 01/27 22:23

推 Mosskappa: AI也不只LLM吧，現在高端硬體依然供不應求，也不是想買就買得到。87F 01/27 22:24

→ puritylife: 如果優化演算法效益開始遠超買鏟子
那鏟子的需求量勢必崩盤好嗎
鏟子貴到爆錢轉去搞演算法反而更划算的話
你覺得他們還會死命買鏟子？
部分的投資轉移會是更明智的做法吧89F 01/27 22:26

推 OSDim: 覺得不會的記得放空，覺得繼續買的記得加碼94F 01/27 22:28

推 TentoEtsu: 聽Miula分析完感覺變成送分題了 0.095F 01/27 22:37

推 kissa0924307: 加倉+196F 01/27 22:39

推 clecer: 我只知道巨頭的AI科學家會拼命優化演算法
不然被LAYOFF就是他們了97F 01/27 22:39

→ ev331: miula講什麼99F 01/27 22:48

推 kobebrian: 我就說了三個月前還有破百價那怎麼跌的？讓子彈飛一夥兒476F 01/28 00:06

→ IBIZA: 破百價好像又近了478F 01/28 00:43

推 ejnfu: 通常恐慌性賣壓都是進場好時機，已加碼479F 01/28 00:44

推 jerry810113: 泛用（x 專用合體（o480F 01/28 01:49

推 ProTrader: 再說一次智障型手機成本降再低到1/500結果還是相同智障型手機最後都是會被智慧型手機淘汰
現在的DS在AI發展中應該還沒達到智障型手機的水準也就是說未來還會有更多更完備的AI模型出現
上面推文中也提到AI範圍很大 DS只是某個領域有成果所以現在說未來高階硬體變成垃圾沒人要還是太早
資料模型演算法硬體的進步都是相輔相成
比較值得討論的是現在大廠搶硬體獲得市佔的策略
是不是會調整改成穩扎穩打按部就班
如果大廠不搶硬體對於賣鏟子的廠商來說確實較不利但這跟高階硬體變成垃圾沒人要還是完全不同
至於股價高檔急跌在多頭中是很常見的現象
台積電要說空頭至少等到700之下再談
就算很急著要看空最少最少也先等台積電破1000再說481F 01/28 03:07

作者 breathair 的最新發文:

+2 Re: [新聞] 京華城案又被續押! 柯文哲：我被關得莫名 - Gossiping 板

作者: breathair 223.141.88.154 (台灣) 2025-07-22 21:21:40

7F 2推
+3 - Gossiping 板

作者: breathair 42.79.230.57 (台灣) 2025-07-13 18:33:37

17F 5推 2噓
+1 Re: [問卦] 建台高中事件該怎麼處理大家才滿意 - Gossiping 板

作者: breathair 42.79.230.57 (台灣) 2025-07-11 04:12:20

13F 2推 1噓
+6 Re: [問卦] 建台高中事件該怎麼處理大家才滿意 - Gossiping 板

作者: breathair 42.79.230.57 (台灣) 2025-07-10 22:36:35

43F 7推 1噓
+4 [問卦] 如果你想把民主國家獨裁化 - Gossiping 板

作者: breathair 111.83.166.88 (台灣) 2025-07-01 06:47:04

7F 4推

點此顯示更多發文記錄