作者 chesterhe (chesterhe)
標題 Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援
時間 Wed Jan 29 17:26:08 2025


※ 引述《WinNOKIA (海神)》之銘言:
: 1. DeepSeek創辦人梁文鋒,少年股神變AI大神
: 2. 紐約時報指出,DeepSeek是由中國對沖基金幻方量化(High-Flyer)創辦
: 3. DeepSeek 宣稱,訓練成本僅 557.6 萬美元,幾乎是其他科技巨頭大型語言模型的十
: 分之一成本,這個費用也差不多是一位 AI 主管的年薪而已。
: 綜合以上媒體報導與揭露來看,DeepSeek是什麼狀況,不就很清楚了嗎?

Musk贊同投資公司Atreides Management合夥人兼資訊長貝克(Gavin Baker)在X提到
DeepSeek的R1低成本來自在訓練和推理效率上,取得了真正的算法突破
例如 FP8 訓練、MLA(機器學習加速)和多 token 預測。
訓練過程中涉及大量的知識蒸餾(distillation)
這意味著在沒有無限制存取 GPT-4o 和 o1 的情況下,這項訓練幾乎不可能完成。
並提出質疑對中國限制最先進 GPU 的出口,卻不阻止其蒸餾美國的頂尖 AI 模型
這基本上讓出口限制變得毫無意義

AI 基礎設施領域的現有贏家面臨的最大風險是
兩年內,R1的蒸餾版本可能會在高端智慧型手機上運行
Musk稱AJ will be everywhere.(AJ應為筆誤AI)

總之DeepSeek推出的模型低成本除了技術上突破外,很大基礎是建立在GPT
但在高階GPU管制下,要透過訓練超越OpenAI是不可能的
而且如果之後OpenAI防堵知識蒸餾,連推新版本都有困難
所以吹牛大賽大概也差不多該接近尾聲了

那競爭布局可能為何? GPT給了答案
https://imgur.com/wNCJOYB
[圖]
「50B AI」指的是一個擁有500億個參數的大型語言模型(LLM)
相當於 GPT-3.5 的規模

另川普於 2025 年 1 月 21 日發布啟動5000 億美元「Stargate」(星際之門)
人工智慧(AI)計畫。參與的公司包括 OpenAI、軟銀 和 甲骨文。
而 DeepSeek 則於 2025 年 1 月 20 日推出了其新模型 「DeepSeek-R1」。
要說巧合也太巧,R1推出目的大概率除了宣示要走向AI設備端,防堵OpenAI壟斷外
就是政治上的大外宣,中國可以用較少資本訓練出競爭級別的AI
甚至影響美國AI產業的投資者信心,改變資本流向

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.71.244.40 (臺灣)
※ 作者: chesterhe 2025-01-29 17:26:08
※ 文章代碼(AID): #1dcVGoEi (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1738142770.A.3AC.html
※ 同主題文章:
Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援
01-29 17:26 chesterhe
tw00172848: 所以要多還是空? 股點是啥1F 01/29 17:28
Sianan: 不就對岸一貫套路 在頂尖科技上跟你有差距 但在中低階可以卷死你2F 01/29 17:30
herculus6502: 鏟子商笑而不語4F 01/29 17:32
jo4: 沒gpt就生不出便宜的deepseek 成本都前人扛了5F 01/29 17:33
gbman: DS開源就是賣模型!第一天上班XD
以後GOOGLE應該也要收費被查詢太多次CC6F 01/29 17:35
fujioqq: 從頭到尾感覺越看越像做空AI股而炒的XD8F 01/29 17:36
lpmybig: 是啊 那模型v2的時候還根本沒人講9F 01/29 17:39
gbman: 效能被趕上又不是免費!趕快找理由安撫消費者CC10F 01/29 17:41
Leo4891: 意思就是美國可能會考慮不給你開源了  免得你中國公司都拿去優化11F 01/29 17:41
gbman: OPENAI新模型沒開源啊CC13F 01/29 17:42
fgkor123: 只有不給你用才能防堵,不給用=沒錢錢14F 01/29 17:43
CCH2022: 做空,低接,大外宣,AI普及往前邁進,各種因素都有。每個國家都要有主權AI,未來要普及化,持續硬體建設還是需要。15F 01/29 17:43
gbman: 美國封開源那應該是世界大笑話CC18F 01/29 17:45
fgkor123: 阿祖拿詐騙的錢一直開源一直爽19F 01/29 17:47
NexusPrime: 難怪成本低,建立在別人的基礎上再微調當然快又省20F 01/29 17:56
gbman: 一堆都這樣做啊!最先受害的是GOOGLE XD22F 01/29 17:59
ctx705f: 馬斯克跟貝克?什麼側翼23F 01/29 18:01
tr920: 其實就先限制像祖克柏這種把LLM最尖端美國技術開源的害群之馬就可以了24F 01/29 18:04
s56565566123: 特準備崩爛26F 01/29 18:09
pideo: 這篇的意思是說,一時蒸餾一時爽,一直蒸餾一直爽27F 01/29 18:21
dongdong0405: 這樣聽起來GG還是最後的贏家29F 01/29 18:25
SpursDynasty: AIPC噴?30F 01/29 18:34
turndown4wat: 手機跑得動這個?31F 01/29 19:01

--
作者 chesterhe 的最新發文:
點此顯示更多發文記錄