看板 Stock作者 cosmite (焼き団子)標題 [新聞] 研究機構:DeepSeek硬體GPU支出逾160億時間 Sat Feb 1 16:31:59 2025
研究機構:DeepSeek硬體GPU支出逾160億台幣
https://is.gd/aHRcF6
中央社
張欣瑜報導
編輯:陳慧萍
2025/2/1 11:35
(中央社記者張欣瑜舊金山31日專電)中國新創公司DeepSeek的模型成本引發熱議,並且造
成股市震盪。研究機構SemiAnalysis今天發布報告指出,該公司至今在硬體繪圖處理器(GP
U)上的支出遠超過5億美元(約新台幣160億元)。
SemiAnalysis指出,中國對沖基金幻方量化(High-Flyer)在2023年5月成立「深度求索」
(DeepSeek)以推動AI技術研發,在此之前,幻方量化於2021年,也就是任何出口管制生效
前,投資購買了1萬顆輝達(Nvidia)A100 GPU。
報告指出,該公司在GPU的投資上花費超過5億美元。
報告稱,輝達根據法規要求,生產了多款H100的變化版,如H800、H20。目前僅有H20可銷售
給中國。輝達在過去9個月已生產超過100萬顆專供中國市場的H20 GPU。
報告分析顯示,DeepSeek的伺服器總資本支出(CapEx)約為16億美元。
報告提到,DeepSeek從中國本土招募人才,目前約有150名員工,正急速擴張。
DeepSeek的價格和效能這一週因出現模型訓練成本低於600萬美元的說法引起討論。報告強
調預訓練成本僅是總成本一小部分,不代表完整支出。
DeepSeek論文中提到的600萬美元成本指的是預訓練運行(pre-training run)時的GPU成本
,是模型總成本的一部分,未計入的重要支出還包括研發(R&D)、硬體總擁有成本(Total
Cost of Ownership)等關鍵因素。
報告也提到DeepSeek能獲得大量算力資源與出口管制存在時間滯後(lag)有關。
美國智庫蘭德公司(RAND)研究員海姆(Lennart Heim)近期分析,硬體的出口管制存在時
間滯後,目前尚未完全發揮影響力。真正的考驗將出現在數據中心需要升級或擴展時,這對
美國企業較為容易,但對受到出口管制的中國企業而言將是挑戰。
SemiAnalysis也評價指出,DeepSeek在開放權重模型上表現出色,超越Meta的Llama 、法國
人工智慧新創公司Mistral AI、以及其他競爭者。(編輯:陳慧萍)1140201
心得評論:
研究機構SemiAnalysis報導,DeepSeek宣稱的600萬美元成本指的是預訓練運行(pre-train
ing run)時的GPU成本,是模型總成本的一部分,尚未包含RD與硬體成本。
報導指稱,GPU成本約5億美元,伺服器總資本支出(CapEx)約為16億美元。
美股在驚慌中下跌,目前看似已反應DeepSeek帶來的影響?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 218.172.0.83 (臺灣)
※ 作者: cosmite 2025-02-01 16:31:59
※ 文章代碼(AID): #1ddTm7jP (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1738398727.A.B59.html
→ b9513227: 新加坡營收77億 DS吹自己算算中國買了多少2F 02/01 16:34
推 gbman: DS應該是根據訓練算力算的!不包含硬體購買成本
硬體是可重複使用除非DS開發完就結束CC4F 02/01 16:36
→ howzming: 這些人看不懂論文?人家是說訓練這個模型只要幾百萬6F 02/01 16:38
→ howzming: 現在用來量化成本都是這樣計算.不然OpenAI花了多少8F 02/01 16:39
推 gowet: 如果之前報導2024年OPENAI跟微軟租伺服器一年要40億美元,重點是那還是"租的"9F 02/01 16:39
→ b9513227: 又被DS吹上了一課 原來硬體可以白嫖11F 02/01 16:40
推 gbman: DS開源你租伺服器成本訓練成本就是5XX萬美元CC12F 02/01 16:41
→ realmd: 幻方都說自已是用AI作股票 DS是利用現有設備的項目13F 02/01 16:41
推 gowet: 這篇報導數字如果屬實,根本爆擊OPENAI吧? 不只訓練14F 02/01 16:42
→ atari77: 台灣點麵線是200億15F 02/01 16:42
→ gowet: 費用差這麼多,沒想到硬體算進去更慘
用買斷價格推算16億,結果OPEN用租的一年40億16F 02/01 16:42
噓 kensmile: 硬體才160億,看openAi多少18F 02/01 16:45
→ loom0et0bust: 那又怎樣,你買硬體又不會只拿來做一件事情或弄一個模型就丟了…19F 02/01 16:46
推 gbman: 就是純算力估成本!反正開源給你抄作業了CC24F 02/01 16:51
推 fhjqwefs: 中國
支那人跟一票滯台狗就靠說謊騙錢無誤26F 02/01 16:59
噓 z23061542: 才五億鎂 台GG完蛋了沒人要的芯片28F 02/01 17:00
噓 carefri: 比台灣的200E數位麵線部還嫩!29F 02/01 17:01
推 SRNOB: 200億泡麵app31F 02/01 17:13
推 SilentBob: 不到兩百億台幣根本沒資格參加慈善盤子王大賽32F 02/01 17:14
推 snownow: 一個是全新建置的成本,一個是折舊(租用)的成本,兩方在說完全不同的東西啊…33F 02/01 17:14
推 JUNGTE: 硬體如果只花這樣的 美國頭更大35F 02/01 17:14
推 stlinman: 沒到200億台幣都算便宜吧!36F 02/01 17:15
推 eriker: 某群東西跟機器人差異沒什麼兩樣 這樣不就只是讓川普有危機意識而已嗎37F 02/01 17:16
→ b9513227: 文盲可憐 這篇是算中國合法買的 新加坡偷買的可沒算39F 02/01 17:22
推 gowet: 別人都幫你算完他的支出了,還在偷買? 你以為左岸只有他這一家在買GPU喔? 只是剛好他找到方法,用低成本作出效能差不多的成品,不要把偷買的都灌他家40F 02/01 17:28
推 s213092921: 照這篇報導的計算標準,CloseAI的硬體成本只會更貴44F 02/01 17:32
→ b9513227: 嗯嗯 新加坡77億一毛錢都跟DS無關45F 02/01 17:34
推 straggler7: 5萬張H100市價15億 賺10億鎂 成本降為046F 02/01 17:35
推 gbman: 一直轟成本!但是真香CC48F 02/01 17:38
推 gowet: 我想他只是不好意思把設備成本放上去,要不然OPEN會更崩潰.....上面就說了他自己買斷伺服器成本才16億美金,OPEN2024給微軟租金就要40億美金49F 02/01 17:38
→ gowet: 就算他現在什麼都不幹,租給其他美國公司一年30億都躺著賺,甚至再買幾套都沒啥問題53F 02/01 17:41
推 Brioni: 蠻便宜的,巨頭們都每年百億美金在撒55F 02/01 17:50
推 loveup: 點麵線200E 快笑數57F 02/01 18:24
噓 jinshun: 把美金硬要換算成台幣來凸顯數字好像很大真的超蠢都什麼年代了還要美金算台幣喔58F 02/01 18:25
→ fashsboy: 5億美金...台灣花不起嗎?叫數發部也編個五億美金60F 02/01 18:35
→ vltw5v: 偷偷告訴你 台灣點麵線app要200億61F 02/01 18:36
→ fashsboy: 來做一套台灣的大型語言模型阿,做不出來就整個數發部砍掉這樣大家說好不好?62F 02/01 18:36
推 aegis43210: 要做AGI的成本自然比較高,DS這套又做不出AGI,降低精度又模型剪枝,早已失去潛力64F 02/01 19:01
→ AdomiZA: 數位部還要把另租辦公室的租金給搭上去 不然哭說砍預算的額度細項攤開來太難看67F 02/01 20:08
→ lain2002 …
推 lain2002: 這周放空美股就把GPU成本賺回來了所以算零成本合理69F 02/01 21:57
推 oyaji5566: 對照檯面上幾個AI巨頭的投資成本 5億鎂根本便宜71F 02/01 23:49
--