※ 本文轉寄自 ptt.cc 更新時間: 2025-01-26 12:30:41
看板 Stock
作者 標題 Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預
時間 Sat Jan 25 22:54:44 2025
結果Meta執行長馬上宣布
2025年 AI資本支出650億美金
我覺得,那帖子的真實性令人存疑
而且大陸的數據本來就不可信
他真實的成本應該是美化過的數字
※ 引述《Lushen (pttlushen)》之銘言:
: 原文標題:
: Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預算難以解釋
: 原文連結:https://www.jiqizhixin.com/articles/2025-01-24-2
: 發布時間:2025/01/24
: 記者署名:機器之心
: 原文內容:
: 「工程師正在瘋狂地分析 DeepSeek,試圖從中複製任何可能的東西。」
: DeepSeek 開源大模型的陽謀,切切實實震撼著美國 AI 公司。
: 最先陷入恐慌的,似乎是同樣推崇開源的 Meta。
: 最近,有 Meta 員工在美國匿名職場社群 teamblind 上面發布了一個貼文。貼文提到,?
: 原文如下:
: 這一切始於 DeepSeek-V3,它在基準測試中就已經讓 Llama 4 落後。更糟的是那個「擁?
: 工程師們正在瘋狂地分析 DeepSeek,試圖從中複製任何可能的東西。這一點都不誇張。
: 管理階層擔心如何證明龐大的生成式 AI 組織的成本是合理的。當生成式 AI 組織中的每
: DeepSeek-R1 讓情況變得更加可怕。雖然我不能透露機密信息,但這些很快就會公開。
: 這本來應該是一個以工程為重點的小型組織,但是因為很多人想要參與進來分一杯羹,人
: https://i.imgur.com/hKZ6h5W.png
: 貼文中提到的 DeepSeek-V3 和 DeepSeek-R1 分別發佈於 2024 年 12 月 26 日和 2025
: 其中,DeepSeek-V3 在發佈時提到,該模型在多項評測成績超越了Qwen2.5-72B 和Llama-
: 不過,更引人注目的是,這個參數量高達 671B 的大型語言模型訓練成本僅 558 萬美元?
: https://i.imgur.com/mJn5POl.png
: 而最近發布的 DeepSeek-R1 效能更猛 —— 在數學、程式碼、自然語言推理等任務上,?
: https://i.imgur.com/NLhp4Nj.png
: 看到這裡,我們不難理解為何 Meta 的團隊會陷入恐慌。如果今年推出的 Llama 4 沒有?
: 有人指出,其實該慌的不只 Meta,OpenAI、Google、Anthropic 又何嘗沒有受到挑戰。
: https://i.imgur.com/gQ5fHDH.png
: 還有人擔心起了英偉達的股價,表示「如果 DeeSeek 的創新是真的,那麼 AI 公司是否?
: https://i.imgur.com/HIFcTx6.png
: 不過,也有人質疑,DeepSeek 究竟是靠創新還是靠蒸餾 OpenAI 的模型取勝?有人回覆?
: https://i.imgur.com/HIFcTx6.png
: 目前,我們還無法確定貼文的真實性。
: 不知道 Meta 後續會如何回應,即將到來的 Llama 4 又會達到怎樣的表現。
: 心得/評論:
: Meta工程師在TeamBlind(一個匿名的職涯討論區,需要經過公司Email驗證)爆料中國的De
: DeepSeek R1訓練成本550萬美元 可能比一個Meta大頭的年薪還便宜
: DeepSeek 這件事情也不光是中國自己在吹噓
: 看了一下 Twitter/Reddit 美國AI工業界、學術界反響非常大
: DeekSeek 的母公司幻方量化產出 DeepSeek 的故事也在 Twitter 廣受討論
: https://i.imgur.com/NLhp4Nj.png
: DeepSeek R1 開源+論文公開應該會推進一波AI界的發展
: DeepSeek 後續發展值得關注一下
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.79.46.4 (臺灣)
※ 作者: Latte7 2025-01-25 22:54:44
※ 文章代碼(AID): #1dbFisQk (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1737816886.A.6AE.html
※ 同主題文章:
01-24 19:13 ■ [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預算難以解釋
01-24 21:59 ■ Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預算難以解釋
01-25 03:00 ■ Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預
01-25 09:15 ■ Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預算難以解釋
01-25 11:46 ■ Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預算難以解釋
● 01-25 22:54 ■ Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預算難以解釋
01-26 13:15 ■ Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高
01-26 19:27 ■ Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預算難以解釋
推 : 多投錢加薪就做的出來了3F 01/25 23:04
→ : 老美工程師一直都是這樣講
→ : 老美工程師一直都是這樣講
推 : Meta 裁員的錢都拿來蓋這些了,反正Meta 有的是錢5F 01/25 23:05
推 : 花錢請五毛幫忙吹,保證吹到外太空6F 01/25 23:08
推 : 中吹忙了半天Meta股價創新高,笑死7F 01/25 23:32
→ : 技術拼不出差距就當大課長,沒有什麼是課金不能解決8F 01/25 23:34
→ : 的
→ : 拉不開差距就只是錢還砸不夠多
→ : 技術研究再多也拼不贏本多忠勝
→ : 的
→ : 拉不開差距就只是錢還砸不夠多
→ : 技術研究再多也拼不贏本多忠勝
推 : TSM25012F 01/25 23:38
推 : 從12月多就開始吹DS,,整天喊屌打美國幾條街,結13F 01/25 23:43
→ : 果SP500又創新高了
→ : 果SP500又創新高了
推 : AMD都加入了 我相信是真的15F 01/25 23:48
→ : 成本這個跟大陸無關, 都開源了, 你可以自己照做16F 01/25 23:49
→ : 它連訓練方式都開源, 低成本應該騙不了人
→ : 這次比較驚艷的應該是強化學習用在 LLM 吧
→ : 類似 AlphaGO 自己跟自己下棋增加 Data 量一樣
→ : 它連訓練方式都開源, 低成本應該騙不了人
→ : 這次比較驚艷的應該是強化學習用在 LLM 吧
→ : 類似 AlphaGO 自己跟自己下棋增加 Data 量一樣
推 : DeepSeek 是不是真貨和 SP500 創新高有什麼邏輯關係20F 01/26 00:00
→ : ?現在誰靠大語言模型賺大錢了嗎?Meta 市值創新高
→ : ,但 Meta 在 LLM 是輸給 Google 喔,怎麼不是 Goog
→ : le 市值創新高?
→ : ?現在誰靠大語言模型賺大錢了嗎?Meta 市值創新高
→ : ,但 Meta 在 LLM 是輸給 Google 喔,怎麼不是 Goog
→ : le 市值創新高?
推 : 就花錢請網軍行銷吧 不然AMD沒cuda是要AI什麼24F 01/26 00:03
推 : Meta這次建構的是廠房設備 怎樣都不虧25F 01/26 00:03
→ : 更不用cuda有google fb支援torch tensorflow26F 01/26 00:05
推 : 跟OpenAI這種閉源盈利比較有關係 Meta是來玩的27F 01/26 00:09
推 : 連國中英文都看不懂的 AI 名人又來高談闊論了,嘻嘻28F 01/26 00:12
→ : wwww
推 : Meta 裏面做 AI 的和做 FB 的根本不是同一個團隊 ww
→ : ww
→ : wwww
推 : Meta 裏面做 AI 的和做 FB 的根本不是同一個團隊 ww
→ : ww
推 : 那你就學過來或買過來阿 用這個資金去訓練Deepseek32F 01/26 00:40
→ : 不就海放
→ : 不就海放
推 : Meta AI 是很認真在做研發的,鬼才跟你來玩 =.=34F 01/26 00:55
推 : AI不只LLM還有很多要搞35F 01/26 01:50
→ : Meta頭都洗了 難道要叫他現在縮手嗎36F 01/26 02:21
推 : 跟SP500沒關係?你說DS用不到1/10的預算就能超越美37F 01/26 02:32
→ : 國頂尖AI公司,真是這樣美國7巨頭早就跌成一片了,
→ : SP500能不跌嗎?
→ : 國頂尖AI公司,真是這樣美國7巨頭早就跌成一片了,
→ : SP500能不跌嗎?
推 : 沒人說超越吧?DS只是CP值超高,但不代表領先,這是40F 01/26 03:08
→ : 兩個概念
→ : 兩個概念
推 : 好笑,美國頂尖 AI 公司又不只一家,而且一家又不只43F 01/26 03:47
→ : 推出一個產品 wwww wwww
推 : DeepSeek-R1 在論文中的效能表現超越了,例如,同
→ : 樣是免費的 OpenAI o1-mini -- 有什麼問題嗎?
推 : Meta 也是美國頂尖的 AI 公司,更早發布的 DeepSeek
→ : -V3 在效能表現也打平甚至超越了 Meta 目前所有的開
→ : 源碼產品 -- 用 1/10 的成本
推 : 但是目前表現最好的大語言模型仍然是 -- 非開源碼
→ : 的 -- OpenAI o3
→ : 推出一個產品 wwww wwww
推 : DeepSeek-R1 在論文中的效能表現超越了,例如,同
→ : 樣是免費的 OpenAI o1-mini -- 有什麼問題嗎?
推 : Meta 也是美國頂尖的 AI 公司,更早發布的 DeepSeek
→ : -V3 在效能表現也打平甚至超越了 Meta 目前所有的開
→ : 源碼產品 -- 用 1/10 的成本
推 : 但是目前表現最好的大語言模型仍然是 -- 非開源碼
→ : 的 -- OpenAI o3
→ : 到底在ww 什麼東西…52F 01/26 04:02
推 : 到底腦袋要長怎麼樣才會認為如果這東西是真的,美53F 01/26 04:07
→ : 國七巨頭會崩潰、SP500 會大跌? -- 美國 M7 誰靠
→ : 賣 LLM 吃飯?還有,誰說 AI 競賽已經結束了?
推 : Google 上市前也有歐洲的新創公司說自己的 Search E
→ : ngine 表現不輸 Google 還開放免費公測 so what ???
→ : Google 也沒崩潰,大家都只想用 Google
推 : 軟體業誰能賺大錢本來就取決於許多技術面以外的因
→ : 素 -- 不然當初 MS-DOS 這爛東西怎麼能稱霸個人電
→ : 腦市場?
推 : 忘了和那隻腦袋不知道長成怎麼樣的再舉一個例子 --
→ : TikTok 穩坐 app 下載冠軍已經四年了,風靡歐美,
→ : 怎麼 Meta 不但沒崩潰反而市值還創新高?
推 : Meta 可是妥妥靠 SNS apps 吃飯的耶!
→ : 國七巨頭會崩潰、SP500 會大跌? -- 美國 M7 誰靠
→ : 賣 LLM 吃飯?還有,誰說 AI 競賽已經結束了?
推 : Google 上市前也有歐洲的新創公司說自己的 Search E
→ : ngine 表現不輸 Google 還開放免費公測 so what ???
→ : Google 也沒崩潰,大家都只想用 Google
推 : 軟體業誰能賺大錢本來就取決於許多技術面以外的因
→ : 素 -- 不然當初 MS-DOS 這爛東西怎麼能稱霸個人電
→ : 腦市場?
推 : 忘了和那隻腦袋不知道長成怎麼樣的再舉一個例子 --
→ : TikTok 穩坐 app 下載冠軍已經四年了,風靡歐美,
→ : 怎麼 Meta 不但沒崩潰反而市值還創新高?
推 : Meta 可是妥妥靠 SNS apps 吃飯的耶!
→ : 除了大語言模型 推論型AI也要發展啊 講得好像一66F 01/26 07:35
→ : 副不用砸錢ai自己就能發展了
→ : 大語言模型就只是一個的開端而已
→ : 副不用砸錢ai自己就能發展了
→ : 大語言模型就只是一個的開端而已
推 : 可是scale ai 的ceo說deepseek有5萬台h100 只是因69F 01/26 07:41
→ : 為政策關係那些不能說他們有
→ : 為政策關係那些不能說他們有
推 : 基本上就另一個C919啦 還以為多厲害 其實就是中共71F 01/26 07:46
→ : 那套宣傳體系嚇人而已
→ : 成本靠著不透明跟國家輸血 想改多低就多低
→ : 那套宣傳體系嚇人而已
→ : 成本靠著不透明跟國家輸血 想改多低就多低
推 : 我餵給DS R1正常的幾何數學題跟正常簡單的邏輯題都74F 01/26 07:56
→ : 會錯了,主打推理方面就得講究正確率,coding我用
→ : 平板就沒餵了。
→ : 會錯了,主打推理方面就得講究正確率,coding我用
→ : 平板就沒餵了。
→ : 誰跟你說成本降低就要砍資本支出?你會嫌ai智力太77F 01/26 08:42
→ : 高是不是
→ : 高是不是
推 : 再說一次,中國人不傻,但美國人絕對不是白癡,scal79F 01/26 10:40
→ : ing law依然存在,懂的就懂
→ : ing law依然存在,懂的就懂
--
※ 看板: Stock 文章推薦值: 0 目前人氣: 1 累積人氣: 212
作者 Latte7 的最新發文:
- 結果Meta執行長馬上宣布 2025年 AI資本支出650億美金 我覺得,那帖子的真實性令人存疑 而且大陸的數據本來就不可信 他真實的成本應該是美化過的數字80F 33推
- om 中國展示了他們的新模型 重點在它極低的成本 好奇這樣是不是代表科技巨頭們不需要這麼多晶片? 會對台積電的晶片需求有影響嗎100F 44推 4噓
- 15F 3推
- 8F 4推 1噓
- 25F 10推 3噓
點此顯示更多發文記錄
→
guest
回列表(←)
分享