看板 Stock作者 icrose (人本良心)標題 [新聞] 馬斯克吹了半年的模型終於發布:Grok 3 你需要知道的所時間 Wed Feb 19 23:17:29 2025
原文標題:馬斯克吹了半年的模型終於發布:Grok 3 你需要知道的所有信息
原文連結:
https://news.qq.com/rain/a/20250218A04EFA00
马斯克吹了半年的模型终于发布:Grok 3 你需要知道的所有信息_腾讯新闻
从 24 年底马斯克就开始给他们新建巨大计算中心训练的 Grok3 模型开始预热了,今天中午 12 点的直播活动中终于发布了 Grok3。 这次马斯克开始玩真的了,不仅模型的素质跟上了 Open AI 的 O1,而且在产品功能上全面对标 ChatGPT。 训练的硬件Musk 声称 Grok 3 的开 ...
發布時間:2025-02-18 13:29
記者署名:歸藏
原文內容:
從 24 年底馬斯克就開始給他們新建巨大計算中心訓練的 Grok3 模型開始預熱了,今天中午 12 點的直播活動中終於發布了 Grok3。
這次馬斯克開始玩真的了,不僅模型的素質跟上了 Open AI 的 O1,而且在產品功能上全面對標 ChatGPT。
訓練的硬件
Musk 聲稱 Grok 3 的開發使用了比其前身 Grok 2「10 倍」多的計算資源,xAI 一直在使用位於孟菲斯的一個龐大數據中心——一個包含約 20 萬個 GPU 的數據中心——來訓練 Grok 3。其中的一期工程只用了 122 天就完成了,工程這塊還得看馬斯克。
圖片
模型能力
Grok 3 的訓練量是 Grok 2 的 10 倍,在 1 月初完成了預訓練,即使現在依然在訓練過程中。
Grok3 包含兩個模型版本 Grok3 和 Grok3-mini,Grok 3 AIME 和 GPQA 在內的基準測試中顯著優於其他模型,如 Gemini 2 Pro 和 GPT-4o。即使是 Grok-3 mini 也表現不錯。目前的早期版本在 Elo 機製的 LLM 競技場 1400 分排第一。
圖片
同時 Grok3 也具備推理能力,馬斯克表示在代碼能力上 Grok3 非常強,同時在推理時不會展示原始思考過程。
至於推理性能,在提供更多測試時間計算資源(使其能夠思考更長時間)的情況下,它優於 o1 和 DeepSeek-R1。
Grok 3 Reasoning Beta 在 AIME 2025 上的表現也高於 o3-mini-high。
圖片
深度搜索功能
除了模型能力對標 Open AI 之外,前沿的 Agents 能力也必須跟上,Grok3 支持類似 Open AI 深度研究的 DeepSearch能力。
這個功能模型能夠深入思考用戶意圖、需要考慮哪些事實、要瀏覽多少個網站、可以交叉驗證不同來源,確保信息的真實性。DeepSearch 還會公開其執行搜索本身所采取的步驟。
圖片
如何使用和收費
目前最先可以體驗到 Grok3 的渠道應該是推特的 X Premium+ 會員,同時他們也推出了單獨的 Grok 網站和 APP。
另外還有搭配單獨有用的 Super Grok 會員,支持 Grok 3的權限、解鎖DeepSearch和Think功能、搶先體驗新功能、更高的圖像生成限製等。
圖片
未來規劃
網頁和應用的所有功能會在一周內推全、API 會在幾周內推出。
一周後還會有由 Grok 驅動的語音應用即將推出。
另外 Grok2 可能會在幾個月後開源,最後一個版本將在最新版本完全發布後開源。
心得/評論:
grok3相當於在給deepseek打配合吧。
花了DS200倍的訓練成本,提高了一點點分數。恰恰證明了堆硬件的路徹底走不通了,毫無意義
我覺得今晚NASDAQ跌的就是這個吧。還有什麽原因呢
--
當心,被擊沉的推文跟班有:
LiXX FaXX LuckXX DrGXX shiriXX downtoearXX stanthemXX liweitseXX
--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 171.14.60.249 (中國)
※ 作者: icrose 2025-02-19 23:17:29
※ 文章代碼(AID): #1djVOEyB (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1739978254.A.F0B.html
推 SRNOB: 沒強多少 1%多 耗能更多2F 02/19 23:20
推 qwe78971: 貴 沒什麼用 目前跟各大佬聊 價格一致看衰4F 02/19 23:21
→ SRNOB: 大力出奇蹟已經出現邊際效益遞減5F 02/19 23:21
→ s1612316: 只要還不是獨大 成本就別想回收
收費至少要再少一百倍6F 02/19 23:25
推 gladopo: 馬老闆的東西不用回收,再吹一下就一堆融資8F 02/19 23:27
推 ter2788: OPENAI做一個我也做一個 明明是差不多的東西但錢還是要花
這是力大飛磚 但也是做差不多的東西9F 02/19 23:29
→ gladopo: 他就看openai不爽啊,要自己搞一個12F 02/19 23:31
推 SRNOB: 這條路有點到底了 資料也都訓練完 只能另辟蹊蹺
微軟最近放一個重磅的 GitHub 衝分好高13F 02/19 23:31
推 Orianna: 10倍資源? omg 那有幾倍功效嗎15F 02/19 23:33
推 ter2788: 現在最大問題是 這樣堆真能AGI?16F 02/19 23:34
推 simba1222: 覺得再過不久就會把各家模型拿去軍用,再讓他們對打,決定誰最強17F 02/19 23:35
→ Ceferino: 整天只會吹,看起來就像把別人論文寫的東西跟架構用他的20萬張gpu跟海量資料復現而已19F 02/19 23:36
推 gamixxxx: 最後上車時間 All in Tsll22F 02/19 23:41
推 seemoon2000: 這就跟讀書一樣啊 你要全科PR80 沒有太困難 但你要23F 02/19 23:44
→ CYL009: 馬斯克很會做直銷的啦 安啦27F 02/19 23:48
→ liangnet: 說不定差那分數就差多了,畢竟使用者最終要的是可以回答他正確的答案,而不是瞎掰的答案。29F 02/19 23:51
推 ejnfu: 但NVDA沒跌
都回140了31F 02/19 23:55
推 seemoon2000: AI不是永遠都在跑這個語言模型 主要是還有其他應用33F 02/19 23:56
→ partsex: tsm股價真弱
該不回真的要等合資的事情確認後 才會漲或跌吧?34F 02/20 00:05
推 acgotaku: 看 gpt 4.5會不會被提前逼出來 如果沒有36F 02/20 00:10
→ acgotaku: Grok3 可能就是在走 OpenAI走過的路而已38F 02/20 00:10
推 sgaor: Nasdaq狂跌0.22%39F 02/20 00:11
推 dophin332: 這個鬼東西的價值是沒有內建DEI吧40F 02/20 00:12
推 chysh: 你敢用deepseek便宜自駕還是grok十萬片H100堆出來的自駕?41F 02/20 00:13
推 Karida: deepseek動不動就系統崩潰當機,誰敢用在自駕上?45F 02/20 00:22
→ sezna: grok沒什麼突破才是問題,ds有開源和拉低門檻。47F 02/20 00:26
→ ejnfu: SMCI都要60了.. 18抄底的爽死48F 02/20 00:29
推 Brioni: 但目前最高分就他49F 02/20 00:29
推 jo4: AI世界以後大概只有第一和others
大佬又不是客家人誰在和你CP值
以後就是硬體最新資源最多的贏 一切一切預告在前50F 02/20 00:37
噓 highca0709: 還在吹DS我真的笑死,隨便一點訪問量就崩潰的爛AI還有人說堆硬體沒用53F 02/20 00:56
推 dtfg: 一堆鄉民自以為比首富和專家聰明厲害,笑死55F 02/20 00:59
推 ImHoluCan: DS嚴重算力不足,問個問題ㄧ直伺服器繁忙,DS自己也說太多人用刮分算力56F 02/20 01:07
噓 LimYoHwan: 吹半年? grok從零開始研發也才1年58F 02/20 01:10
推 etset: DS還有天才少女61F 02/20 02:34
推 zzzzaaaa: 可以吹花最多的錢啊,nv感謝您62F 02/20 02:49
推 stosto: grok後來不是變20萬片100+200?
現在看起來就是堆算力,狂堆,狂堆,再狂堆
這就是AI64F 02/20 03:56
推 ksjr: 我知道老馬還有錢67F 02/20 04:35
推 lrac: 他們比較晚才投入吧 短時間迎頭趕上了69F 02/20 07:57
→ bojan0701: AI 後期就是加堆巨大算力,獲得小小改善...71F 02/20 08:14
推 mopa: 就說了,推論落地的算力需求遠大約訓練。72F 02/20 08:25
推 kotorichan: 推論用華為芯片就夠了 過一陣子再看看DS有沒有改善74F 02/20 08:35
推 jimmy12332: 現在買一張4090就能跑deepseek 671B的完整model 誰需要你們這些算力怪物?77F 02/20 10:54
推 eric356: 戰鬥機你比別人多個0.1秒就可以打趴對方79F 02/20 11:00
→ lluunnaa: 昨天X都是馬投顧跟我川XD80F 02/20 11:16
推 ejnfu: 講半天 NVDA也是漲回140了81F 02/20 11:38
推 eoeoeo: 我們也有天才美少女82F 02/20 12:34
推 annboy: 拜託 老馬是要跟OpenAI 拼SOTA跟AGI
蒸餾是另一個賽事 不要混為一談83F 02/20 13:43
→ ilqgray: 這幾篇綜合講了deepseek 蘋果和老馬xAI的動態
還提到南韓的新計劃...有些替台灣擔心啊87F 02/20 16:00
推 Klauhal: Grok3問冷門的東西也能答出來挺屌的,比DS好多了89F 02/20 16:17
推 davidr: ds要蒸餾也要有一級的訓練數據啊92F 02/20 20:05
--