※ 本文轉寄自 ptt.cc 更新時間: 2025-02-20 23:55:37
看板 Stock
作者 標題 [新聞] 馬斯克吹了半年的模型終於發布:Grok 3 你需要知道的所
時間 Wed Feb 19 23:17:29 2025
原文標題:馬斯克吹了半年的模型終於發布:Grok 3 你需要知道的所有信息
原文連結:https://news.qq.com/rain/a/20250218A04EFA00
马斯克吹了半年的模型终于发布:Grok 3 你需要知道的所有信息_腾讯新闻
从 24 年底马斯克就开始给他们新建巨大计算中心训练的 Grok3 模型开始预热了,今天中午 12 点的直播活动中终于发布了 Grok3。 这次马斯克开始玩真的了,不仅模型的素质跟上了 Open AI 的 O1,而且在产品功能上全面对标 ChatGPT。 训练的硬件Musk 声称 Grok 3 的开 ...
記者署名:歸藏
原文內容:
從 24 年底馬斯克就開始給他們新建巨大計算中心訓練的 Grok3 模型開始預熱了,今天中午 12 點的直播活動中終於發布了 Grok3。
這次馬斯克開始玩真的了,不僅模型的素質跟上了 Open AI 的 O1,而且在產品功能上全面對標 ChatGPT。
訓練的硬件
Musk 聲稱 Grok 3 的開發使用了比其前身 Grok 2「10 倍」多的計算資源,xAI 一直在使用位於孟菲斯的一個龐大數據中心——一個包含約 20 萬個 GPU 的數據中心——來訓練 Grok 3。其中的一期工程只用了 122 天就完成了,工程這塊還得看馬斯克。
圖片
模型能力
Grok 3 的訓練量是 Grok 2 的 10 倍,在 1 月初完成了預訓練,即使現在依然在訓練過程中。
Grok3 包含兩個模型版本 Grok3 和 Grok3-mini,Grok 3 AIME 和 GPQA 在內的基準測試中顯著優於其他模型,如 Gemini 2 Pro 和 GPT-4o。即使是 Grok-3 mini 也表現不錯。目前的早期版本在 Elo 機製的 LLM 競技場 1400 分排第一。
圖片
同時 Grok3 也具備推理能力,馬斯克表示在代碼能力上 Grok3 非常強,同時在推理時不會展示原始思考過程。
至於推理性能,在提供更多測試時間計算資源(使其能夠思考更長時間)的情況下,它優於 o1 和 DeepSeek-R1。
Grok 3 Reasoning Beta 在 AIME 2025 上的表現也高於 o3-mini-high。
圖片
深度搜索功能
除了模型能力對標 Open AI 之外,前沿的 Agents 能力也必須跟上,Grok3 支持類似 Open AI 深度研究的 DeepSearch能力。
這個功能模型能夠深入思考用戶意圖、需要考慮哪些事實、要瀏覽多少個網站、可以交叉驗證不同來源,確保信息的真實性。DeepSearch 還會公開其執行搜索本身所采取的步驟。
圖片
如何使用和收費
目前最先可以體驗到 Grok3 的渠道應該是推特的 X Premium+ 會員,同時他們也推出了單獨的 Grok 網站和 APP。
另外還有搭配單獨有用的 Super Grok 會員,支持 Grok 3的權限、解鎖DeepSearch和Think功能、搶先體驗新功能、更高的圖像生成限製等。
圖片
未來規劃
網頁和應用的所有功能會在一周內推全、API 會在幾周內推出。
一周後還會有由 Grok 驅動的語音應用即將推出。
另外 Grok2 可能會在幾個月後開源,最後一個版本將在最新版本完全發布後開源。
心得/評論:
grok3相當於在給deepseek打配合吧。
花了DS200倍的訓練成本,提高了一點點分數。恰恰證明了堆硬件的路徹底走不通了,毫無意義
我覺得今晚NASDAQ跌的就是這個吧。還有什麽原因呢
--
當心,被擊沉的推文跟班有:
LiXX FaXX LuckXX DrGXX shiriXX downtoearXX stanthemXX liweitseXX
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 171.14.60.249 (中國)
※ 作者: icrose 2025-02-19 23:17:29
※ 文章代碼(AID): #1djVOEyB (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1739978254.A.F0B.html
推 : 可以色色嗎1F 02/19 23:18
推 : 沒強多少 1%多 耗能更多2F 02/19 23:20
→ : 也吹太久3F 02/19 23:21
推 : 貴 沒什麼用 目前跟各大佬聊 價格一致看衰4F 02/19 23:21
→ : 大力出奇蹟已經出現邊際效益遞減5F 02/19 23:21
→ : 只要還不是獨大 成本就別想回收6F 02/19 23:25
→ : 收費至少要再少一百倍
→ : 收費至少要再少一百倍
推 : 馬老闆的東西不用回收,再吹一下就一堆融資8F 02/19 23:27
推 : OPENAI做一個我也做一個 明明是差不多的東西但錢還9F 02/19 23:29
→ : 是要花
→ : 這是力大飛磚 但也是做差不多的東西
→ : 是要花
→ : 這是力大飛磚 但也是做差不多的東西
→ : 他就看openai不爽啊,要自己搞一個12F 02/19 23:31
推 : 這條路有點到底了 資料也都訓練完 只能另辟蹊蹺13F 02/19 23:31
→ : 微軟最近放一個重磅的 GitHub 衝分好高
→ : 微軟最近放一個重磅的 GitHub 衝分好高
推 : 10倍資源? omg 那有幾倍功效嗎15F 02/19 23:33
推 : 現在最大問題是 這樣堆真能AGI?16F 02/19 23:34
推 : 覺得再過不久就會把各家模型拿去軍用,再讓他們對17F 02/19 23:35
→ : 打,決定誰最強
→ : 打,決定誰最強
→ : 整天只會吹,看起來就像把別人論文寫的東西跟架構19F 02/19 23:36
→ : 用他的20萬張gpu跟海量資料復現而已
→ : 用他的20萬張gpu跟海量資料復現而已
推 : tsla乖乖回300吧21F 02/19 23:38
推 : 最後上車時間 All in Tsll22F 02/19 23:41
推 : 這就跟讀書一樣啊 你要全科PR80 沒有太困難 但你要23F 02/19 23:44
推 : TSLA還沒買夠啊24F 02/19 23:44
→ : 全科PR90以上 投入的時間和效益會越來越低阿25F 02/19 23:45
推 : 人家都開源了你還在收費26F 02/19 23:46
→ : 馬斯克很會做直銷的啦 安啦27F 02/19 23:48
噓 : 又一個覺得自己比巨頭們聰明的28F 02/19 23:48
→ : 說不定差那分數就差多了,畢竟使用者最終要的是可29F 02/19 23:51
→ : 以回答他正確的答案,而不是瞎掰的答案。
→ : 以回答他正確的答案,而不是瞎掰的答案。
推 : 但NVDA沒跌31F 02/19 23:55
→ : 都回140了
→ : 都回140了
推 : AI不是永遠都在跑這個語言模型 主要是還有其他應用33F 02/19 23:56
→ : tsm股價真弱34F 02/20 00:05
→ : 該不回真的要等合資的事情確認後 才會漲或跌吧?
→ : 該不回真的要等合資的事情確認後 才會漲或跌吧?
推 : 看 gpt 4.5會不會被提前逼出來 如果沒有36F 02/20 00:10
推 : 99特斯拉37F 02/20 00:10
→ : Grok3 可能就是在走 OpenAI走過的路而已38F 02/20 00:10
推 : Nasdaq狂跌0.22%39F 02/20 00:11
推 : 這個鬼東西的價值是沒有內建DEI吧40F 02/20 00:12
推 : 你敢用deepseek便宜自駕還是grok十萬片H100堆出來的41F 02/20 00:13
→ : 自駕?
→ : 自駕?
噓 : 喔喔喔喔喔喔喔喔43F 02/20 00:15
→ : 力大出奇蹟44F 02/20 00:19
推 : deepseek動不動就系統崩潰當機,誰敢用在自駕上?45F 02/20 00:22
推 : Nvda SMCI :你們買不夠多!46F 02/20 00:23
→ : grok沒什麼突破才是問題,ds有開源和拉低門檻。47F 02/20 00:26
→ : SMCI都要60了.. 18抄底的爽死48F 02/20 00:29
推 : 但目前最高分就他49F 02/20 00:29
推 : AI世界以後大概只有第一和others50F 02/20 00:37
→ : 大佬又不是客家人誰在和你CP值
→ : 以後就是硬體最新資源最多的贏 一切一切預告在前
→ : 大佬又不是客家人誰在和你CP值
→ : 以後就是硬體最新資源最多的贏 一切一切預告在前
噓 : 還在吹DS我真的笑死,隨便一點訪問量就崩潰的爛AI53F 02/20 00:56
→ : 還有人說堆硬體沒用
→ : 還有人說堆硬體沒用
推 : 一堆鄉民自以為比首富和專家聰明厲害,笑死55F 02/20 00:59
推 : DS嚴重算力不足,問個問題ㄧ直伺服器繁忙,DS自己56F 02/20 01:07
→ : 也說太多人用刮分算力
→ : 也說太多人用刮分算力
噓 : 吹半年? grok從零開始研發也才1年58F 02/20 01:10
推 : 在台灣用自駕很好啊 自撞當自駕59F 02/20 01:39
推 : 要收費,我pass60F 02/20 02:17
推 : DS還有天才少女61F 02/20 02:34
推 : 可以吹花最多的錢啊,nv感謝您62F 02/20 02:49
→ : 快壓機器人股啊63F 02/20 03:17
推 : grok後來不是變20萬片100+200?64F 02/20 03:56
→ : 現在看起來就是堆算力,狂堆,狂堆,再狂堆
→ : 這就是AI
→ : 現在看起來就是堆算力,狂堆,狂堆,再狂堆
→ : 這就是AI
推 : 我知道老馬還有錢67F 02/20 04:35
→ : 20號腿了68F 02/20 07:55
推 : 他們比較晚才投入吧 短時間迎頭趕上了69F 02/20 07:57
→ : 噁男AI70F 02/20 08:09
→ : AI 後期就是加堆巨大算力,獲得小小改善...71F 02/20 08:14
推 : 就說了,推論落地的算力需求遠大約訓練。72F 02/20 08:25
→ : 這個可以用來分析股票嗎?73F 02/20 08:31
推 : 推論用華為芯片就夠了 過一陣子再看看DS有沒有改善74F 02/20 08:35
→ forbefor …
推 : 力大出棒槌76F 02/20 10:01
推 : 現在買一張4090就能跑deepseek 671B的完整model 誰77F 02/20 10:54
→ : 需要你們這些算力怪物?
→ : 需要你們這些算力怪物?
推 : 戰鬥機你比別人多個0.1秒就可以打趴對方79F 02/20 11:00
→ : 昨天X都是馬投顧跟我川XD80F 02/20 11:16
推 : 講半天 NVDA也是漲回140了81F 02/20 11:38
推 : 我們也有天才美少女82F 02/20 12:34
推 : 拜託 老馬是要跟OpenAI 拼SOTA跟AGI83F 02/20 13:43
→ : 蒸餾是另一個賽事 不要混為一談
→ : 蒸餾是另一個賽事 不要混為一談
Apple (AAPL) Gains Analyst Confidence with Upcoming Product Launches
We recently published a list of 10 AI Stocks Making Waves on Wall Street. In this article, we are going to take a look at where Apple Inc. (NASDAQ:AAP ...
蘋果推 iPhone 16e 新機;馬斯克旗下 xAI 發布新 AI 模型 Grok-3 - 財報狗 為什麼重要 蘋果公司推出 iPhone 16e 新機在即,預計將帶動公司未來幾季的銷售業績,對科技和消費電子產業的投資人來說,其銷售表現是值得關注的。 特斯拉創 ...
→ : 這幾篇綜合講了deepseek 蘋果和老馬xAI的動態87F 02/20 16:00
→ : 還提到南韓的新計劃...有些替台灣擔心啊
→ : 還提到南韓的新計劃...有些替台灣擔心啊
推 : Grok3問冷門的東西也能答出來挺屌的,比DS好多了89F 02/20 16:17
→ : https://youtu.be/yyYV_hu_iEU 也不是很聰明...90F 02/20 16:36
→ : https://youtu.be/k2YCp5Ficzw 同樣問題DS答對了
→ : https://youtu.be/k2YCp5Ficzw 同樣問題DS答對了


推 : ds要蒸餾也要有一級的訓練數據啊92F 02/20 20:05
--
※ 看板: Stock 文章推薦值: 0 目前人氣: 0 累積人氣: 74
作者 icrose 的最新發文:
- 50F 23推 8噓
- 從 24 年底馬斯克就開始給他們新建巨大計算中心訓練的 Grok3 模型開始預熱了,今天中午 12 點的直播活動中終於發布了 Grok3。 這次馬斯克開始玩真的了,不僅模型的素質跟上了 Open …92F 45推 4噓
- 28F 9推 7噓
點此顯示更多發文記錄
→
guest
回列表(←)
分享