[新聞] AI競爭愈烈 OpenAI測試新AI模型o3與o3 mini - Stock板

看板 Stock
作者 sam20135 (sam20135)
標題 [新聞] AI競爭愈烈 OpenAI測試新AI模型o3與o3 mi
時間 Sat Dec 21 15:10:01 2024

https://news.cnyes.com/news/id/5815798

AI競爭愈烈 OpenAI測試新AI模型o3與o3 mini | Anue鉅亨 - 美股雷達

OpenAI 周五 (20 日) 宣布，目前正在測試其最新的推理 AI 模型 o3 和 o3 mini。此舉顯示 AI 產業競爭日益激烈，包括 Google(GOOGL-US) 在內的競爭對手也致力於開發能處理複雜問題的更先進模型。 ...

AI競爭愈烈 OpenAI測試新AI模型o3與o3 mini

鉅亨網編譯陳又嘉

OpenAI 周五 (20 日) 宣布，目前正在測試其最新的推理 AI 模型 o3 和 o3 mini。此舉
顯示 AI 產業競爭日益激烈，包括 Google(GOOGL-US) 在內的競爭對手也致力於開發能處
理複雜問題的更先進模型。

OpenAI 執行長 Sam Altman 表示，公司計劃在 1 月底推出 o3 mini 模型，隨後推出完
整版本的 o3 模型。這些規模更大、更健全的語言模型預計將超越現有模型，有望吸引新
的投資與用戶。

根據 OpenAI 一篇部落格文章，該公司於 9 月推出的 o1 模型已展示出解決科學、程式
編碼與數學等複雜任務的能力。即將推出的 o3 和 o3 mini 模型目前正在進行內部安全
測試，其能力表現預計將遠超過 o1 模型。

為了讓外部研究人員參與測試過程，OpenAI 啟動了申請程序，開放有興趣的人在公開發
布前測試 o3 模型。這項申請程序將於 1 月 10 日截止。

自 2022 年 11 月推出 ChatGPT 以來，OpenAI 已成為 AI 產業的關鍵企業，引發了一場
可稱為 AI 軍備競賽的浪潮。該公司憑藉日益增長的知名度及持續推出產品，已成功吸引
了大量資金，在 10 月完成了 66 億美元的融資。

OpenAI 在 AI 領域的主要競爭對手、Alphabet 旗下的 Google，則於 12 月初推出了其
第二代 AI 模型 Gemini，盼藉此重返在 AI 科技競賽中的領先地位。

-----------------------------------------------------------------------------

1月底將推出 o3 mini，競爭越來越激烈了，又有突破性發展。

AGI「通用人工智能」(artificial general intelligence)，

看來達到人類基本水平不遠了。

https://today.line.me/hk/v2/article/BEWYRqj 這裡有進一步數據解說

OpenAI 公佈最新 o3 模型　懶人包一文看懂是甚麼 | Unwire.hk | LINE TODAY 人工智能能否超越人類？OpenAI 用最新推出的 o3 模型給出了答案。這款模型在邏輯推理、數學計算和程式設計等領域展現出驚人的能力，不僅超... ...

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.42.212.34 (臺灣)
※ 作者: sam20135 2024-12-21 15:10:01
※ 文章代碼(AID): #1dPcdDCV (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1734765005.A.31F.html

推 breathair: 人類剩幾集？1F 12/21 15:25

推 ohlong: 圖表85%AGI覺得蠻胡蘭的2F 12/21 15:26

推 k1k1832002: 感覺2026就是新時代了3F 12/21 15:27

→ DAEVA: 一臉正經的胡說八道4F 12/21 15:30

推 bj45566: 其實重點在於 Google 已經全面追上 OpenAI 了
文字描述生成影片技術 Veo 2 > Sora5F 12/21 15:42

噓 shinewind: 到底什麼時候才能搞好圖表
GPT分析圖表都在鬼扯7F 12/21 15:50

推 sdbb: 嗚嗚，難怪昨天GG 掛190撿不到9F 12/21 16:07

推 SRNOB: 200美金一個月下次2000美金一個月賽博窮人用不起10F 12/21 16:16

推 bob1012: 推傳統科技業人才遲早會被人工智能的大浪淹沒11F 12/21 16:28

→ lavign: google有人力財源和資料支持，奧特曼人才都跑了12F 12/21 16:30

推 mdkn35: o@呢
o213F 12/21 17:06

推 y800122155: 沒救了 Google花不到一年時間就已經實現全面超越而且發展方向更廣15F 12/21 17:06

推 strlen: 實際體感測試o1跟gemini 2.0 後者還是遠遠輸啊
不管是回應品質還是正確度都不行 Claude還比較好17F 12/21 17:18

推 Homeparty: GPT5.0呢19F 12/21 17:23

推 xkso: GG本益比還不到30真滴便宜
GOOG20F 12/21 17:26

推 aspwell520: 難道沒有人覺得AI連數學都會算錯有點不聰明嗎… 只是內建計算機的事情而已
雖然這跟AI背後的演算法完全無關但很多日常AI應用場景都需要精確的數學吧22F 12/21 17:34

推 newyorker54: 很多人都不看O3展示就高談闊論
O3已經是博士級系統還沒有開放，坐中間的工程師說下一步就是做自我修改程式自我進化，奧圖曼嚇到立馬說不會那麼做
表示自我進化就是臨門一腳，二十四小時自我評測自我進化要怎麼輸給人類
六月鴨子不知死活
坐中間的工程師奧數滿分編碼競賽在人類記錄2500多分，這裡一堆人在嗆OpenAI??
他說Illya3000分，天才啊26F 12/21 17:40

→ MoonCode: 樓上你在說啥= =36F 12/21 17:54

推 Heedictator: 看 sora 就知道這間公司不行了37F 12/21 18:00

推 tsubasawolfy: 他在說OPENAI那片的內容 O3的寫程式分數已經贏中間那位穿白衣介紹的只比首席工程師低一點
數學問題的話 O3目前美國數學奧林匹亞已經96.7% 因為有一題不論怎樣算都錯。
傳統數學滿足不了就跑去算給數學家在玩得未發表數學問題正確率25% 其他模型都只有妮趴38F 12/21 18:13

噓 GodtoneIsGod: openAI命名越來越亂了 3.5 4 4o o1 o344F 12/21 18:17

→ tsubasawolfy: AGI部分那測驗是考推理能力雖然他是87.5%通過人類85%的門檻不過那是開大招所有資源全上算16小時
不到兩年時間可以用LLM+自我強化推到這程度
看更詳細的解說有提到o3是o1自我強化來沒有重新預訓練省去時間跟金錢
不過85%門檻大概是為了降低恐慌紐約大學找1400人測通過率只有73-77%45F 12/21 18:18

推 bj45566: 1. OpenAI o3 離真正的 AGI 還明顯有一段距離52F 12/21 18:33

→ strlen: https://tinyurl.com/4zrzh8e8 真的耶昨天沒注意到超人力霸王你怕惹嗎？呵呵呵53F 12/21 18:34

推 newyorker54: 謝謝樓上解說，專業的55F 12/21 18:35

推 bj45566: 2. AIME 只是美國國內數學奧林匹克選拔賽的資格賽56F 12/21 18:35

→ newyorker54: 我是說tsubasawolfy
應該是美國國內決賽吧？
這片看來離AGI只有一步之遙，祂已經能自我評測，要不要加入自我修改程式的能力只看奧圖曼要不要了57F 12/21 18:36

推 bj45566: "ARC-AGI 並不是AGI的試金石，它只是一種研究工具，旨在聚焦 AI 領域中最具挑戰性的未解決問題。通過 ARC-AGI，並不意味著實現 AGI。"61F 12/21 18:47

→ strlen: 老黃去年就說惹如果AGI指的是所有測驗都打爆人類那就五年啊如果你要自己隨便定義啥是AGI 那大概永遠達不到話隨便你講囉64F 12/21 18:57

推 jo4: 所以AGI定義是什麼67F 12/21 19:00

噓 bj45566: AGI 什麼時候是定義在標準測驗打敗人類，笑死 wwww連 Google scholar AGI 都不會，AI 第一個要淘汰的就是這種人68F 12/21 19:06

→ strlen: 我可沒說AGI是測驗都過是老黃說的事實上根本沒人知道AGI定義是三洨所以就看某人胡說八道笑死
沒有定義沒有測量方式還整天在那邊說啊你這葛根本不是AGI 這跟性別認同是戰鬥直升機一樣經典
我還希望AI趕快淘汰我勒太慢了老黃何時再回300？我成本就300啊嘻嘻71F 12/21 19:17

推 sdbb: 上上次拆股前的300，羨慕77F 12/21 19:21

噓 bj45566: 什麼資料都不會去查就信口開河說沒有人知道什麼是 AGI，笑死人有夠好笑 wwww78F 12/21 19:33

→ mic73528: google ai有人用喔?????gpt跟claude不就分完了80F 12/21 19:34

噓 bj45566: 如果照____的八奇邏輯這世界根本沒有 AGI 的定義，那 OpenAI 剛問世時是不是就可以自稱為 AGI？盡講這種弱智至極無法自洽的話還拼命出來丟人現眼，笑死！81F 12/21 19:38

→ strlen: https://i.imgur.com/cbcioVF.png 真的越說越可悲你找出OpenAI CEO哪一次說自己是AGI 找啊
還在胡扯唉84F 12/21 19:40

→ bj45566: 這世界上沒有 AGI 的定義，但公佈 OpenAI o3 卻還是要公開拿來跑測 ARC-AGI？嘻嘻87F 12/21 19:42

→ strlen: 反正你也不認為那些狗屎測驗是AGI啊所以我才說隨便你講啊嘻嘻你高興就豪89F 12/21 19:43

→ bj45566: 自成立以來，OpenAI 一直強調，他們的核心目標是打造一個能造福全人類的安全 AGI
OpenAI 的成立目的就是 AGI, 如果已經達到了，怎麼不敢向世人說 o3 就是 AGI 了？弱智 wwww91F 12/21 19:45

→ sdbb: Ai:韜光養晦95F 12/21 19:49

推 bj45566: 講一個最簡單的，如果是 AGI, 考人類的數學測驗只要讓 o3 配個攝影鏡頭就直接能理解題目並寫出、畫出答案和附上推理過程 -- 結果 o3 還是要靠人類輸入問題，然後碰到題目裏有複雜圖案的幾何問題也沒辦法自己看懂，AGI 個鬼！96F 12/21 20:19

→ yunf: 他強的就是邏輯能力但是你叫他寫東西出來就是沒有好作品
跟你說他們根本就是一個熔爐而已251F 12/22 01:52

→ seemoon2000: 之前假道德擔心自家可能開發出危險的AI 但卻忘了自己並沒有領先Meta和google多少這發展很正常254F 12/22 01:53

→ yunf: 因為台灣從來沒看過這東西所以覺得很新奇
https://tinyurl.com/2xk7gnuc
不知道你們有沒有看過這個
洋玩意
後面代表的是西方的聖火
每幾百年就會來侵襲一次
https://tinyurl.com/2dnk2v7c256F 12/22 01:56

🔥Chained Dream🔥 | 千年以前我们早已落后于西方，而不是“遥遥领先”… | Instagram

作者 sam20135 的最新發文:

-7 [新聞] 電價方案台電推演3劇本！若未獲千億撥補民生用電擬全面漲 - Stock 板

作者: sam20135 114.42.211.165 (台灣) 2025-03-08 19:41:48

109F 34推 41噓
+57 [新聞] 因應川普！經部降順差中油擬擴大買美天然氣 - Stock 板

作者: sam20135 114.42.192.134 (台灣) 2025-02-09 19:08:19

因應川普！經部降順差　中油擬擴大買美天然氣記者呂中漁 / 攝影顏睿陞報導美國總統川普，宣布祭出「對等關稅」政策，包括大陸、台灣和印度等國，傳出都是首要目標，對此經濟部研擬，要中油擴大對美 …

125F 62推 5噓
+24 [新聞] 搭上馬斯克政府改革潮 Palantir或成AI革命首選股 - Stock 板

作者: sam20135 114.42.192.134 (台灣) 2025-02-09 18:00:39

搭上馬斯克政府改革潮 Palantir或成AI革命首選股鉅亨網編譯陳又嘉據《財富》周日 (9 日) 報導，資料探勘軟體公司 Palantir Technologies(PLTR-US) 可能正 …

48F 24推
+38 [新聞] 超微將進駐台南沙崙AI基地 - Stock 板

作者: sam20135 114.42.217.25 (台灣) 2025-01-04 14:08:58

超微將進駐台南沙崙AI基地重量級來台投資案邁步，賴清德樂觀其成，要靠半導體及AI，建構台灣為AI人工智慧島工商時報呂雪彗呂俊儀新年伊始，大南方新矽谷推動方案暨AI創新應用大樓招商3日啟動 …

92F 49推 11噓
+35 [新聞] AI競爭愈烈 OpenAI測試新AI模型o3與o3 mini - Stock 板

作者: sam20135 114.42.212.34 (台灣) 2024-12-21 15:10:01

AI競爭愈烈 OpenAI測試新AI模型o3與o3 mini 鉅亨網編譯陳又嘉 OpenAI 周五 (20 日) 宣布，目前正在測試其最新的推理 AI 模型 o3 和 o3 mini。此舉顯示 A …

262F 53推 18噓

點此顯示更多發文記錄

(sam20135.): [新聞] AI競爭愈烈 OpenAI測試新AI模型o3與o3 mini - Stock板