[新聞] 緊咬Anthropic！OpenAI同日推GPT-5.3-Codex 跑分碾壓Opus 4.6 - Stock板

首頁(home) 上頁(↑) 下頁(↓) 末頁(end)

※ 本文轉寄自 ptt.cc 更新時間: 2026-02-07 09:24:15

看板 Stock

作者 qazxc1156892 (QQ)
標題 [新聞] 緊咬Anthropic！OpenAI同日推GPT-5.3-Cod
時間 Fri Feb 6 22:25:52 2026

原文標題：緊咬Anthropic！OpenAI同日推GPT-5.3-Codex　跑分碾壓Opus 4.6

原文連結： https://ai.ettoday.net/news/3114219

緊咬Anthropic！OpenAI同日推GPT-5.3-Codex　跑分碾壓Opus 4.6 | ETtoday AI科技 | ETtoday新聞雲

兩大 AI 巨頭 Anthropic 與 OpenAI 於今日接連發布重大更新。Anthropic 首先發表 Claude Opus 4.6，主打極長文本處理能力；OpenAI 一小時後隨即宣布推出 GPT-5.3-Codex，並公布數據顯示其在編碼實戰測試中展現出顯著的領先優勢。 ...

發布時間： 2026年02月6日 08:48

記者署名：吳立言

原文內容：

兩大 AI 巨頭 Anthropic 與 OpenAI 於今日接連發布重大更新。Anthropic 首先發表 Cl
aude Opus 4.6，主打極長文本處理能力；OpenAI 一小時後隨即宣布推出 GPT-5.3-Codex
，並公布數據顯示其在編碼實戰測試中展現出顯著的領先優勢。

Claude Opus 4.6：導入深度思考機制與多代理協作

Anthropic 此次更新重點聚焦於大規模資訊處理與邏輯穩定性。Claude Opus 4.6 將上下
文視窗（Context Window）擴展至 100 萬 Token，相較於前代版本提升 5 倍之多。技術
層面上，該模型導入了「思考決策點」功能，使模型能辨識問題複雜度，自主決定是否啟
動深度推理流程。

此外，Opus 4.6 強化了多代理（Multi-agent）協作能力，並在長文本記憶留存率上提升
近 4 倍，旨在解決長對話中常見的指令遺忘與邏輯斷層問題，針對大型專案的架構分析
提供了更穩定的基礎。

GPT-5.3-Codex：優化生成效率與 OS 層級操控

面對 Anthropic 的挑戰，OpenAI 推出的 GPT-5.3-Codex 則在編碼基準測試中交出了亮
眼成績。數據顯示，該模型在 SWE-bench Pro（57%）、TerminalBench 2.0（76%）及 O
SWorld（64%）等測試中，皆取得目前業界最高水準。

除了跑分優勢，GPT-5.3-Codex 在開發體驗上有兩項核心突破：

中途干預能力（Mid-task Steerability）：支持任務執行過程中的即時引導與動態更新
，大幅降低複雜開發任務的錯誤成本。

效能密度提升：生成相同內容所需 Token 數降至 5.2-Codex 的一半以下，且每 Token
生成速率提升超過 25%，顯著優化了推理成本與延遲。

這兩款模型的發布顯示出兩家公司發展策略的差異化：Claude 傾向於成為具備超長記憶
與深度邏輯的「數位大腦」；而 GPT-5.3-Codex 則朝向具備系統操作能力、高效率且可
高度受控的「執行工具」進化。

隨著 GPT-5.3-Codex 正式上線，開發者將有機會直接對比這兩款頂尖模型在實際工作流
中的表現差異。

心得/評論：

Google Gemini表示：.......

現在AI變成跟智慧型手機一樣比跑分了

這兩款token都一下子就用完了

Open醬看起來真的急了

以前是領頭羊現在被追趕著不擠牙膏了

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.137.178.34 (臺灣)
※ 作者: qazxc1156892 2026-02-06 22:25:52
※ 文章代碼(AID): #1fXVdoLi (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1770387954.A.56C.html

推 devidevi : 跑分是啥鬼東西1F 02/06 22:27

推 iwcuforever : 每個月輪流測不同工具，目前來說還真的各有各優點2F 02/06 22:27

推 gladopo : 最近open醬的更新看來不錯，急了3F 02/06 22:27

推 b2060027830 : google 下去4F 02/06 22:28

→ iwcuforever : Gemini強在多模態和notebooklm生簡報，Claude生出5F 02/06 22:30
→ iwcuforever : 的文本就是比較嚴謹和有邏輯性，Chatgpt感覺就中庸
→ iwcuforever : 版本

推 kanehhh : 哪個模型能降低記憶體的需求就是利多8F 02/06 22:37

推 yousking : 歐噴醬最近中文很強，給股票分析模型還會有（噴爆）9F 02/06 22:38
→ yousking : 等字眼....

推 jackychen122: Gemini寫程式跟老頑固博士生一樣，不停不做就是不做11F 02/06 22:40

推 offstage : 搞不好被餵進了PTT股板當學習資料12F 02/06 22:41

推 George72 : 緊咬是落後者的動詞13F 02/06 22:45

→ csgowen : 寫程式還是喜歡claude14F 02/06 22:47

→ LimYoHwan : 手機用戶通常主力一隻，寫程式很多人是claude, code15F 02/06 22:48
→ LimYoHwan : x, gemini三個都打開來用好嗎
→ LimYoHwan : Claude, codex左右互搏，gemini負責ui設計

推 Toge : 其實我覺得codex寫code略強一點，但Claude很適合當18F 02/06 22:50
→ Toge : 老師

→ LimYoHwan : 看新聞說claude比較強的人一看就知道沒用真的用過，20F 02/06 22:52
→ LimYoHwan : 就算5.2都不輸

推 pt993526 : Gpt目前速度有感提升22F 02/06 22:53

推 tarcowang : openAI是不是有派臥底啊？23F 02/06 22:53

推 sova0809 : 這兩個打架受傷的是其他軟體公司24F 02/06 22:53

→ jjjj222 : 看我跑分, 好像之前安卓機出來會說的話25F 02/06 22:55

推 Toge : codex一口氣寫出想要的功能機率比較高26F 02/06 22:55

推 Faker0613 : 說codex比較屌是沒用過claude code+skills喔幹根27F 02/06 23:05
→ Faker0613 : 本屌打codex

→ redbeanbread: 擠牙膏喔人家出你才出29F 02/06 23:06

推 tsubasawolfy: Codex 5.3抓bug能力有嚇到。講了一下某步驟的數字30F 02/06 23:09
→ tsubasawolfy: 跟原始資料有落差而已，他就開始順著開著文檔內的
→ tsubasawolfy: 位址一個script爬過一個檢查。然後要求系統權限開
→ tsubasawolfy: 始對每個步驟模擬進行跟除錯。最後跟你說是哪個地
→ tsubasawolfy: 方有問題，問你要不要修正。修完後還說我順便幫你
→ tsubasawolfy: 其他關聯的script都修改好了。

推 strlen : 這次發表的都是專門寫程式的跑分不用看了都垃圾36F 02/06 23:10
→ strlen : codex之前就蠻強的只是速度真的太慢了
→ strlen : 這次明顯把短板改進速度提升許多就還不錯了
→ strlen : 現在codex基本能與opus並駕其驅甚至部份超越
→ strlen : opus價格太貴了也是劣勢就是了
→ strlen : 然後前兩天codex也出了寫程式專用的App 那個讚
→ strlen : CLI就留給那些臭酸老肥宅跟裝逼仔用
→ strlen : 電腦發明都幾年了還在回去弄CLI 低能到有剩
→ strlen : 另外skills基本就是脫褲子放屁跟MCP一樣遲早過氣
→ strlen : skills底層就是提示詞工程最後全都會整合進LLM裡
→ strlen : 還在那邊玩skills 都是過渡期在用的廢物功能

→ LimYoHwan : https://i.mopix.cc/iEUpK8.jpg47F 02/06 23:18
→ LimYoHwan : https://i.mopix.cc/qJhqIf.jpg

→ LimYoHwan : https://i.mopix.cc/VcT2vs.jpg49F 02/06 23:18
→ LimYoHwan : Openclaw作者都這樣說了推文的你真的有用過？
→ LimYoHwan : https://i.mopix.cc/31W7EU.jpg

→ strlen : 現在模型進步太快有人不是每天刷推特不曉得不是他52F 02/06 23:22

→ LimYoHwan : 現在就華爾街帶風向說openai不行跟去年講goog一樣53F 02/06 23:22
→ LimYoHwan : 的套路故意打壓股價

→ strlen : 的錯他的印象還留在寫程式=claude55F 02/06 23:22
→ strlen : Openclaw作者一開始也是只用claude 後來交叉使用才
→ strlen : 自己比較出優劣

→ jjjj222 : 讓我想起了vim還是emacs還是vscode比較好的討論..58F 02/06 23:24
→ jjjj222 : 在此預言, 不會有結論....

→ strlen : 我以前碰過幾個vim死忠仔共同特徵就是又老又肥脾氣60F 02/06 23:25
→ strlen : 陰陽怪氣甚至其中一個連git都不會用只用小烏龜
→ strlen : 裝逼仔＋老肥宅無一例外
→ strlen : 不會進步的工程師在傳產一待就是20年 20年如一日
→ strlen : 這就是CLI愛好者的形象

→ LimYoHwan : Coding用很兇的人，全部都會用啦，各有優缺點，但65F 02/06 23:27
→ LimYoHwan : 體感，codex最強，只是速度慢。並不像車子一樣，大
→ LimYoHwan : 部分人選一種品牌

→ strlen : 不過就無聊抬槓在軟缸板講這個就是大爆炸然後被桶68F 02/06 23:27

推 Serisu : 現在寫程式就在比拼工具練了，誰還在拿模型互比69F 02/06 23:28

→ strlen : 本來就是交叉使用但我最近有點懶的主力就codex就70F 02/06 23:28
→ strlen : 好 claude太貴了啦用沒幾次額度就沒了三洨
→ strlen : 當然要互比像Gemini就是垃圾我說寫程式

→ Serisu : 規格丟上去就等收割了，到底有啥額度問題73F 02/06 23:29

→ strlen : 寫程式SOTA就是codex claude 沒了74F 02/06 23:29
→ strlen : 其它都是浪費時間時間就是金錢

→ LimYoHwan : 華爾街現在吹gemini 一狗票人也認為goog很強，開始76F 02/06 23:30
→ LimYoHwan : 要被套了

→ strlen : 當然gemini強項本來就在生圖之類的可理解啦78F 02/06 23:31
→ strlen : 狗家也有投資Antropic 大概是一個打消費一個打企業
→ strlen : 說好要聯合把歐噴醬幹死二打一
→ strlen : 巨頭血戰連續劇讓窩們繼續看下去

→ m30127813 : 離線ai值得期待嗎？82F 02/06 23:33

推 messi5566 : Codex一直都屌打G83F 02/06 23:37
→ messi5566 : 網頁版Gemini最近在一些實時跑分排名上還偷偷變笨

噓 mini178 : 把dickshit放哪裡?85F 02/06 23:39

推 GX90160SS : 用AI寫是很爽但感覺人類背的責任反而又更多了86F 02/06 23:43
→ GX90160SS : 以前維護一個專案 -> 用AI寫後變成要維護三專案以上

推 joy2105feh : 但GOOG強的點不只GEMINI阿XD88F 02/06 23:54

推 chachabo : 99估狗89F 02/06 23:55

→ yunf : 一人150萬美金不要太羨慕啊90F 02/06 23:57

→ strlen : 我沒說狗家不強啊搜我的文去年低點開始買的91F 02/07 00:11

推 stocktonty : 沒有成人模式都不用談92F 02/07 00:14

推 bhmagic : 偷偷變笨歐噴也有過但現在好像不敢了93F 02/07 00:16
→ bhmagic : 每個AI都有時候會故意用省資源的方式回答你

推 L1ON : gemini: gpt還在呼吸啊95F 02/07 00:23

推 s213092921 : 美國還在閉源模型的賽道死路內捲啊96F 02/07 00:29

推 omanorboyo : google一樣是最後贏家啦因為他才有轉換成$$的能力97F 02/07 00:40

→ b9513227 : 井蛙又在丟臉了 codex本來就不差98F 02/07 00:55
→ b9513227 : 至於gemini 這垃圾連競爭資格都沒有

推 quanhwe : Chatgpt要活著比較好不然Gemini會擺爛100F 02/07 03:00

推 myth356 : GPT現在很卡頓欸101F 02/07 03:17

→ e123456ddd : 現在會講什麼最後贏家的也很蠢根本還太早期102F 02/07 04:36

推 andy79323 : 用過vibe coding不會說出不同模型103F 02/07 07:21
→ andy79323 : 程式碼分工這種事
→ andy79323 : 用一款調架構就可以搞鼠自己了

→ KingTsia : 超明顯沒料了你更新我才更新106F 02/07 07:53

推 GinginDenSha: 軟體圈每天就是一堆優越仔，鄙視鏈107F 02/07 08:22

→ shiyangfoo : 沒人覺得祖家的方式才是最聰明的嗎108F 02/07 09:02

※ 看板: Stock　文章推薦值: 0 目前人氣: 0 累積人氣: 46　

作者 qazxc1156892 的最新發文:

+7 [問卦] 現在全世界軍事能力應該怎麼排行？ - Gossiping 板

作者: qazxc1156892 223.136.66.214 (台灣) 2026-04-04 11:08:43

16F 7推
+19 [新聞] 美軍還沒出全力！川普警告伊朗：下一波鎖定橋梁、發電廠 - Gossiping 板

作者: qazxc1156892 223.136.66.214 (台灣) 2026-04-03 15:30:00

46F 20推 1噓
+18 [新聞] 荷莫茲海峽重啟燃希望！日股漲逾900點 - Stock 板

作者: qazxc1156892 223.136.66.214 (台灣) 2026-04-03 09:41:50

伊朗與海峽對岸的鄰國阿曼起草一項協議，消息一出，市場期盼荷莫茲海峽（Strait of Hormuz）能以某種特定形式重新開放，帶動今（3日）日、韓股開高，日股一度大漲逾900 點，韓股強彈逾3.5 …

42F 20推 2噓
+3 [新聞] 柯文哲問「共諜是民進黨多？還陸配多？」陸委會：比這沒意義 - Gossiping 板

作者: qazxc1156892 223.136.66.214 (台灣) 2026-04-02 20:46:55

34F 10推 7噓
+65 [新聞] 川普證實「伊朗總統求停火」！強硬回應：不開放荷莫茲海峽就再轟 - Stock 板

作者: qazxc1156892 223.136.66.214 (台灣) 2026-04-01 21:48:58

中東戰局出現驚人轉折！美總統川普1日證實，伊朗新總統裴澤斯基安已正式向美提出「停火請求」。川普語出驚人評價對方「比前任聰明且不激進」，但也要求除非荷莫茲海峽全面恢復自由通航，否則美軍將持續猛烈轟 …

163F 88推 23噓

點此顯示更多發文記錄

分享網址: 複製

DispBBS

回到看板(←)《Stock》

→

guest

x)推文 r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄同主題: =)首篇 [)上篇 ])下篇

回列表(←) 分享