看板 Stock作者 gn02118620 ()標題 Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援時間 Wed Jan 29 08:59:54 2025
※ 引述《WinNOKIA (海神)》之銘言:
: 1. DeepSeek創辦人梁文鋒,少年股神變AI大神
: 2. 紐約時報指出,DeepSeek是由中國對沖基金幻方量化(High-Flyer)創辦
: 3. DeepSeek 宣稱,訓練成本僅 557.6 萬美元,幾乎是其他科技巨頭大型語言模型的十
: 分之一成本,這個費用也差不多是一位 AI 主管的年薪而已。
: 綜合以上媒體報導與揭露來看,DeepSeek是什麼狀況,不就很清楚了嗎?
來看看大神Andrej Karpathy是怎麼評論的
Andrej Karpathy
https://i.imgur.com/WYEHc65.jpeg
首先要打臉的是第二點
DeepSeek告訴大家,他是利用2048片H800 GPU, 經過兩個月的時間,訓練出來的,訓練費
用是550萬鎂
你訓練使用的GPU,可以當成設備成本,給之後的使用來做攤提,一片H80,一個小時租賃
可以到2~3美元/小時
所以用兩個月來計算,確實符合550萬鎂的訓練成本
而幾乎所有AI 模型都是給你訓練成本,這點DeepSeek沒有不同
這也是為什麼Andrej Karpathy會說這是如同「笑話般的預算」 因為他是其他模型訓練的
1/10~1/20的價格
對照財政部某官員在某財經網美下面被噴到刪留言的事情~嗯 我只能說有這種言論不意
外
https://i.imgur.com/SviWZpc.jpeg
至於你說第一點幻方量化是少年股神變AI大神,因為人家本來就是做大數據的,是用大數
據來炒股財富自由以後才來玩AI,順序不能搞錯
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.200.7.21 (臺灣)
※ 作者: gn02118620 2025-01-29 08:59:54
※ 文章代碼(AID): #1dcNsDeC (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1738112397.A.A0C.html
※ 同主題文章:
Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援
01-29 08:59 gn02118620
→ s213092921: 哼!Andrej有我們股神strlen及WTF5566等人了解AI嗎2F 01/29 09:04
推 hcwang1126: 其實老黃也是作加速卡作到變大神 老賈也是作pc作到變大神 蓋天也是作dos作到變大神(現在還有人知道dos?4F 01/29 09:08
噓 liscp: 中國id 要來囉 他們不喜歡這篇7F 01/29 09:10
→ sanos168: 中國大躍進即視感,畝產萬斤糧,讓我們看下去…8F 01/29 09:11
我只能網路有這種言論不意外。畢竟我們財政部官員都是小丑貨色了
現在的台灣有清末義和團的氛圍了,主打一個神功護台、刀槍不入
什麼DeepSeek都是幻覺、妖物,嚇不倒我滴
→ poz93: 他的本業 應該靠這波對沖Ai概念股又賺了一大筆9F 01/29 09:13
推 Dumbbbb: 不能回答8964就是廢物 懂?11F 01/29 09:15
※ 編輯: gn02118620 (1.200.7.21 臺灣), 01/29/2025 09:17:21
推 liliumeow: 對於工作內容就是產製中國的負面新聞的人來說的確是廢物13F 01/29 09:17
推 DecemberLV: 確實炒股呀 放空輝達 放出自己弄的Ai消息 回補輝達 退休 其他不重要了15F 01/29 09:19
→ AirPenguin: 他就照著DS發表的資訊告訴大家有這個東西而已19F 01/29 09:20
噓 sanos168: 呵,畝產萬斤糧,信的人就信吧20F 01/29 09:21
→ AirPenguin: 他的結論是如果DS的講法屬實那可能AI不用那麼多資源22F 01/29 09:22
推 turndown4wat: 好奇幻方做空這樣有賺嗎?沒跌很深反彈又快
ds12月底發表的,發表前幾個月佈局直接被尬爆吧?23F 01/29 09:22
→ s213092921: 幫你補充一下,質疑DS成本的林宜敬不是財政部官員,而是他X的數發部次長,這才可怕25F 01/29 09:22
→ s213092921: 台灣的數發部次長是這種外行人,可以,這很台灣29F 01/29 09:23
噓 arthur52: 如果大陸首先提出AGI模型,那才是大震撼32F 01/29 09:26
推 jay0117: 臺灣人講cp值 要薪水幾百萬官員去挑戰民間年薪幾千幾億人才 真有趣33F 01/29 09:27
→ silentence: 幾十年前吹大煉鋼 人有多大膽 地有多大產的35F 01/29 09:28
→ ctx705f: 要消費時講cp值 要工作時就看齊歐美了36F 01/29 09:28
推 gm3252: 目前都中國自己在吹居多,沒看到什麼名人在挺38F 01/29 09:33
推 renfro928: 以前都是美國割人韭菜,我不信幻方這次沒做空美股割美韭菜,盤前科技股重挫的狀況下,盤中DS發表新模型。能割就代表實力39F 01/29 09:33
推 tttt0204: 幫補血..真實情況如何還能慢慢驗證44F 01/29 09:37
→ lain2002 …
推 lain2002: 台灣千億數位部能點麵線, deepseek能吃嗎?45F 01/29 09:39
噓 greentiger: 義和團是台灣還是中國?有點耐心吧!慢慢看下去47F 01/29 09:39
→ suijojo: 真的越來越像義和團了48F 01/29 09:41
推 stocktonty: 既然都開誠佈公 就等著有其他人去公測啦
真只要600萬鎂很多26科技公司就拿得出來了49F 01/29 09:41
推 s213092921: 看錯了沒報導,只有臆測幻方做空美股XDD
不過幻方本來就是對沖基金起家的,如果這波割美股韭菜也是賺美國的錢繼續發展中國AI,嘻嘻51F 01/29 09:44
→ WTF55665566: 早就說成本都只是推測而已 乍看之下合理 跟超導體當初大吹牛的時候一樣 也是一堆領域大神拿來引用叫囂股價
如果deepseek真的這麼猛 反正也開源 小公司跟上玩小Ai,大公司拆解成本訓練法後補上效率運算的模型後又變回算力軍備競賽了
然後某族群幻想的擊潰鏟子上的義和團夢境還是沒有實現54F 01/29 09:48
噓 meowgy: 股版8卦化62F 01/29 09:53
噓 sanos168: 信的建議趕快砸錢去陸股All in ,不要錯過機會..呵63F 01/29 09:54
→ hcwang1126: 這個比較像日清時 對大炮巨艦的戰術 後來大炮巨艦還64F 01/29 09:54
噓 leighmeow: 其實openai 講的成本包含訓練成本 我覺得這篇才是亂講68F 01/29 09:56
→ IBIZA: 樓上 你才是亂講 openai講的成本在哪?70F 01/29 09:58
→ leighmeow: 目前美國那邊講的成本 的確都包含訓練沒錯71F 01/29 09:58
→ IBIZA: 目前已知的 就是chatgpt3用了相當1萬片A100 14.8天72F 01/29 09:58
→ IBIZA: 的訓練時間
chatgpt 3.5以上全部沒公開
什麼朋友 哪家公司?74F 01/29 09:58
→ IBIZA: 我問chatgpt都問不到 4以上的成本
你比他本人清楚嗎78F 01/29 09:59
→ IBIZA: 唬爛81F 01/29 09:59
→ IBIZA: 一開始說openai講的成本 被打爆 又說是朋友講的
openai自己就沒公開3.5以上的成本
你到底什麼朋友啦 阿特曼喔?83F 01/29 10:00
推 km612tw: 笑死 台灣只有點麵線 哪來的臉質疑別人86F 01/29 10:02
推 lusifa2007: 股價反彈代表市場過度反應 賣鏟子該賺還是得賺87F 01/29 10:03
推 holebro: 這些中黑好可悲 笑死88F 01/29 10:03
推 jwiww: 管你造假不造假股票會漲就好89F 01/29 10:09
→ CCH2022: 如果有作空的然後還一手大吹DS,一手打NV, TSM,會被噴爆吧
顯然DS的訓練費用是特地領域,如果要再更多,多元全面,長時間驗證運作,那預算肯定不夠。
媒體常常推波助瀾去誇大賺流量90F 01/29 10:17
→ IBIZA: 樓上 你的顯然是怎麼來的?
DS怎麼做的論文都有寫95F 01/29 10:18
推 kobebrian: IBIZA 你也不用急著想反駁 市場跟那幾個巨頭比我們了解97F 01/29 10:19
→ IBIZA: 二十幾頁而以 看一下吧
所以meta不就動起來了99F 01/29 10:20
→ busman214: 欸 可是他不是幫DS背書欸... 他只是說GPU的租賃費用和DS團隊宣稱的訓練費用對得上而已,你貼這篇是要打臉什麼?350F 01/29 14:31
→ wiie: 怎麼有人過年崩潰成這樣,真的會笑死XDDDD353F 01/29 14:57
噓 demintree: 可以給開源training的連結嗎,他GitHub上只放訓練好的模型和inference的程式354F 01/29 14:57
噓 repast: 可憐啊又再蝦吹356F 01/29 14:58
--