※ 本文轉寄自 ptt.cc 更新時間: 2024-12-22 09:12:47
看板 Stock
作者 標題 [新聞] AI競爭愈烈 OpenAI測試新AI模型o3與o3 mi
時間 Sat Dec 21 15:10:01 2024
https://news.cnyes.com/news/id/5815798
AI競爭愈烈 OpenAI測試新AI模型o3與o3 mini | Anue鉅亨 - 美股雷達
OpenAI 周五 (20 日) 宣布,目前正在測試其最新的推理 AI 模型 o3 和 o3 mini。此舉顯示 AI 產業競爭日益激烈,包括 Google(GOOGL-US) 在內的競爭對手也致力於開發能處理複雜問題的更先進模型。 ...
OpenAI 周五 (20 日) 宣布,目前正在測試其最新的推理 AI 模型 o3 和 o3 mini。此舉顯示 AI 產業競爭日益激烈,包括 Google(GOOGL-US) 在內的競爭對手也致力於開發能處理複雜問題的更先進模型。 ...
AI競爭愈烈 OpenAI測試新AI模型o3與o3 mini
鉅亨網編譯陳又嘉
OpenAI 周五 (20 日) 宣布,目前正在測試其最新的推理 AI 模型 o3 和 o3 mini。此舉
顯示 AI 產業競爭日益激烈,包括 Google(GOOGL-US) 在內的競爭對手也致力於開發能處
理複雜問題的更先進模型。
顯示 AI 產業競爭日益激烈,包括 Google(GOOGL-US) 在內的競爭對手也致力於開發能處
理複雜問題的更先進模型。
OpenAI 執行長 Sam Altman 表示,公司計劃在 1 月底推出 o3 mini 模型,隨後推出完
整版本的 o3 模型。這些規模更大、更健全的語言模型預計將超越現有模型,有望吸引新
的投資與用戶。
整版本的 o3 模型。這些規模更大、更健全的語言模型預計將超越現有模型,有望吸引新
的投資與用戶。
根據 OpenAI 一篇部落格文章,該公司於 9 月推出的 o1 模型已展示出解決科學、程式
編碼與數學等複雜任務的能力。即將推出的 o3 和 o3 mini 模型目前正在進行內部安全
測試,其能力表現預計將遠超過 o1 模型。
編碼與數學等複雜任務的能力。即將推出的 o3 和 o3 mini 模型目前正在進行內部安全
測試,其能力表現預計將遠超過 o1 模型。
為了讓外部研究人員參與測試過程,OpenAI 啟動了申請程序,開放有興趣的人在公開發
布前測試 o3 模型。這項申請程序將於 1 月 10 日截止。
自 2022 年 11 月推出 ChatGPT 以來,OpenAI 已成為 AI 產業的關鍵企業,引發了一場
可稱為 AI 軍備競賽的浪潮。該公司憑藉日益增長的知名度及持續推出產品,已成功吸引
了大量資金,在 10 月完成了 66 億美元的融資。
可稱為 AI 軍備競賽的浪潮。該公司憑藉日益增長的知名度及持續推出產品,已成功吸引
了大量資金,在 10 月完成了 66 億美元的融資。
OpenAI 在 AI 領域的主要競爭對手、Alphabet 旗下的 Google,則於 12 月初推出了其
第二代 AI 模型 Gemini,盼藉此重返在 AI 科技競賽中的領先地位。
-----------------------------------------------------------------------------
1月底將推出 o3 mini,競爭越來越激烈了,又有突破性發展。
AGI「通用人工智能」(artificial general intelligence),
看來達到人類基本水平不遠了。
AGI「通用人工智能」(artificial general intelligence),
看來達到人類基本水平不遠了。
https://today.line.me/hk/v2/article/BEWYRqj 這裡有進一步數據解說
OpenAI 公佈最新 o3 模型 懶人包一文看懂是甚麼 | Unwire.hk | LINE TODAY 人工智能能否超越人類?OpenAI 用最新推出的 o3 模型給出了答案。這款模型在邏輯推理、數學計算和程式設計等領域展現出驚人的能力,不僅超... ...
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.42.212.34 (臺灣)
※ 作者: sam20135 2024-12-21 15:10:01
※ 文章代碼(AID): #1dPcdDCV (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1734765005.A.31F.html
推 : 人類剩幾集?1F 12/21 15:25
推 : 圖表85%AGI覺得蠻胡蘭的2F 12/21 15:26
推 : 感覺2026就是新時代了3F 12/21 15:27
→ : 一臉正經的胡說八道4F 12/21 15:30
推 : 其實重點在於 Google 已經全面追上 OpenAI 了5F 12/21 15:42
推 : 文字描述生成影片技術 Veo 2 > Sora
推 : 文字描述生成影片技術 Veo 2 > Sora
噓 : 到底什麼時候才能搞好圖表7F 12/21 15:50
→ : GPT分析圖表都在鬼扯
→ : GPT分析圖表都在鬼扯
推 : 嗚嗚,難怪昨天GG 掛190撿不到9F 12/21 16:07
推 : 200美金一個月 下次2000美金一個月 賽博窮人用不起10F 12/21 16:16
推 : 推 傳統科技業人才遲早會被人工智能的大浪淹沒11F 12/21 16:28
→ : google有人力財源和資料支持,奧特曼人才都跑了12F 12/21 16:30
推 : o@呢13F 12/21 17:06
→ : o2
→ : o2
推 : 沒救了 Google花不到一年時間就已經實現全面超越 而15F 12/21 17:06
→ : 且發展方向更廣
→ : 且發展方向更廣
推 : 實際體感測試o1跟gemini 2.0 後者還是遠遠輸啊17F 12/21 17:18
→ : 不管是回應品質還是正確度 都不行 Claude還比較好
→ : 不管是回應品質還是正確度 都不行 Claude還比較好
推 : GPT5.0呢19F 12/21 17:23
推 : GG本益比還不到30真滴便宜20F 12/21 17:26
→ : GOOG
→ : GOOG
推 : 難道沒有人覺得AI連數學都會算錯有點不聰明嗎… 只22F 12/21 17:34
→ : 是內建計算機的事情而已
→ : 雖然這跟AI背後的演算法完全無關 但很多日常AI應用
→ : 場景都需要精確的數學吧
→ : 是內建計算機的事情而已
→ : 雖然這跟AI背後的演算法完全無關 但很多日常AI應用
→ : 場景都需要精確的數學吧
推 : 很多人都不看O3展示就高談闊論26F 12/21 17:40
→ : O3已經是博士級系統還沒有開放,坐中間的工程師說下
→ : 一步就是做自我修改程式自我進化,奧圖曼嚇到立馬說
→ : 不會那麼做
→ : 表示自我進化就是臨門一腳,二十四小時自我評測自我
→ : 進化要怎麼輸給人類
→ : 六月鴨子不知死活
→ : 坐中間的工程師奧數滿分編碼競賽在人類記錄2500多分
→ : ,這裡一堆人在嗆OpenAI??
推 : 他說Illya3000分,天才啊
→ : O3已經是博士級系統還沒有開放,坐中間的工程師說下
→ : 一步就是做自我修改程式自我進化,奧圖曼嚇到立馬說
→ : 不會那麼做
→ : 表示自我進化就是臨門一腳,二十四小時自我評測自我
→ : 進化要怎麼輸給人類
→ : 六月鴨子不知死活
→ : 坐中間的工程師奧數滿分編碼競賽在人類記錄2500多分
→ : ,這裡一堆人在嗆OpenAI??
推 : 他說Illya3000分,天才啊
→ : 樓上你在說啥= =36F 12/21 17:54
推 : 看 sora 就知道這間公司不行了37F 12/21 18:00
推 : 他在說OPENAI那片的內容 O3的寫程式分數已經贏中間38F 12/21 18:13
→ : 那位穿白衣介紹的 只比首席工程師低一點
→ : 數學問題的話 O3目前美國數學奧林匹亞已經96.7% 因
→ : 為有一題不論怎樣算都錯。
→ : 傳統數學滿足不了就跑去算給數學家在玩得未發表數學
→ : 問題 正確率25% 其他模型都只有妮趴
→ : 那位穿白衣介紹的 只比首席工程師低一點
→ : 數學問題的話 O3目前美國數學奧林匹亞已經96.7% 因
→ : 為有一題不論怎樣算都錯。
→ : 傳統數學滿足不了就跑去算給數學家在玩得未發表數學
→ : 問題 正確率25% 其他模型都只有妮趴
噓 : openAI命名越來越亂了 3.5 4 4o o1 o344F 12/21 18:17
→ : AGI部分那測驗是考推理能力 雖然他是87.5%通過人類45F 12/21 18:18
→ : 85%的門檻 不過那是開大招所有資源全上算16小時
→ : 不到兩年時間可以用LLM+自我強化推到這程度
→ : 看更詳細的解說有提到o3是o1自我強化來 沒有重新預
→ : 訓練 省去時間跟金錢
→ : 不過85%門檻大概是為了降低恐慌 紐約大學找1400人測
→ : 通過率只有73-77%
→ : 85%的門檻 不過那是開大招所有資源全上算16小時
→ : 不到兩年時間可以用LLM+自我強化推到這程度
→ : 看更詳細的解說有提到o3是o1自我強化來 沒有重新預
→ : 訓練 省去時間跟金錢
→ : 不過85%門檻大概是為了降低恐慌 紐約大學找1400人測
→ : 通過率只有73-77%
推 : 1. OpenAI o3 離真正的 AGI 還明顯有一段距離52F 12/21 18:33
推 : 謝謝樓上解說,專業的55F 12/21 18:35
推 : 2. AIME 只是美國國內數學奧林匹克選拔賽的資格賽56F 12/21 18:35
→ : 我是說tsubasawolfy57F 12/21 18:36
→ : 應該是美國國內決賽吧?
→ : 這片看來離AGI只有一步之遙,祂已經能自我評測,要
→ : 不要加入自我修改程式的能力只看奧圖曼要不要了
→ : 應該是美國國內決賽吧?
→ : 這片看來離AGI只有一步之遙,祂已經能自我評測,要
→ : 不要加入自我修改程式的能力只看奧圖曼要不要了
推 : "ARC-AGI 並不是AGI的試金石,它只是一種研究工具,61F 12/21 18:47
→ : 旨在聚焦 AI 領域中最具挑戰性的未解決問題。通過 A
→ : RC-AGI,並不意味著實現 AGI。"
→ : 旨在聚焦 AI 領域中最具挑戰性的未解決問題。通過 A
→ : RC-AGI,並不意味著實現 AGI。"
→ : 老黃去年就說惹 如果AGI指的是所有測驗都打爆人類64F 12/21 18:57
→ : 那就五年 啊如果你要自己隨便定義啥是AGI 那大概永
→ : 遠達不到 話隨便你講囉
→ : 那就五年 啊如果你要自己隨便定義啥是AGI 那大概永
→ : 遠達不到 話隨便你講囉
推 : 所以AGI定義是什麼67F 12/21 19:00
噓 : AGI 什麼時候是定義在標準測驗打敗人類,笑死 wwww68F 12/21 19:06
→ : 連 Google scholar AGI 都不會,AI 第一個要淘汰的
→ : 就是這種人
→ : 連 Google scholar AGI 都不會,AI 第一個要淘汰的
→ : 就是這種人
→ : 我可沒說AGI是測驗都過 是老黃說的 事實上 根本沒71F 12/21 19:17
→ : 人知道AGI定義是三洨 所以就看某人胡說八道 笑死
→ : 沒有定義沒有測量方式 還整天在那邊說啊你這葛根本
→ : 不是AGI 這跟性別認同是戰鬥直升機一樣經典
→ : 我還希望AI趕快淘汰我勒 太慢了 老黃何時再回300?
→ : 我成本就300啊 嘻嘻
→ : 人知道AGI定義是三洨 所以就看某人胡說八道 笑死
→ : 沒有定義沒有測量方式 還整天在那邊說啊你這葛根本
→ : 不是AGI 這跟性別認同是戰鬥直升機一樣經典
→ : 我還希望AI趕快淘汰我勒 太慢了 老黃何時再回300?
→ : 我成本就300啊 嘻嘻
推 : 上上次拆股前的300,羨慕77F 12/21 19:21
噓 : 什麼資料都不會去查就信口開河說沒有人知道什麼是 A78F 12/21 19:33
→ : GI,笑死人有夠好笑 wwww
→ : GI,笑死人有夠好笑 wwww
→ : google ai有人用喔?????gpt跟claude不就分完了80F 12/21 19:34
噓 : 如果照____的八奇邏輯這世界根本沒有 AGI 的定義,81F 12/21 19:38
→ : 那 OpenAI 剛問世時是不是就可以自稱為 AGI?盡講這
→ : 種弱智至極無法自洽的話還拼命出來丟人現眼,笑死!
→ : 那 OpenAI 剛問世時是不是就可以自稱為 AGI?盡講這
→ : 種弱智至極無法自洽的話還拼命出來丟人現眼,笑死!
→ : https://i.imgur.com/cbcioVF.png 真的越說越可悲84F 12/21 19:40
→ : 你找出OpenAI CEO哪一次說自己是AGI 找啊
→ : 還在胡扯 唉
→ : 你找出OpenAI CEO哪一次說自己是AGI 找啊
→ : 還在胡扯 唉
→ : 這世界上沒有 AGI 的定義,但公佈 OpenAI o3 卻還是87F 12/21 19:42
→ : 要公開拿來跑測 ARC-AGI?嘻嘻
→ : 要公開拿來跑測 ARC-AGI?嘻嘻
→ : 反正你也不認為那些狗屎測驗是AGI啊 所以我才說隨便89F 12/21 19:43
→ : 你講啊 嘻嘻 你高興就豪
→ : 你講啊 嘻嘻 你高興就豪
→ : 自成立以來,OpenAI 一直強調,他們的核心目標是打91F 12/21 19:45
→ : 造一個能造福全人類的安全 AGI
→ : OpenAI 的成立目的就是 AGI, 如果已經達到了,怎麼
→ : 不敢向世人說 o3 就是 AGI 了?弱智 wwww
→ : 造一個能造福全人類的安全 AGI
→ : OpenAI 的成立目的就是 AGI, 如果已經達到了,怎麼
→ : 不敢向世人說 o3 就是 AGI 了?弱智 wwww
→ : Ai:韜光養晦95F 12/21 19:49
推 : 講一個最簡單的,如果是 AGI, 考人類的數學測驗只要96F 12/21 20:19
→ : 讓 o3 配個攝影鏡頭就直接能理解題目並寫出、畫出
→ : 答案和附上推理過程 -- 結果 o3 還是要靠人類輸入
→ : 問題,然後碰到題目裏有複雜圖案的幾何問題也沒辦法
→ : 自己看懂,AGI 個鬼!
→ : 讓 o3 配個攝影鏡頭就直接能理解題目並寫出、畫出
→ : 答案和附上推理過程 -- 結果 o3 還是要靠人類輸入
→ : 問題,然後碰到題目裏有複雜圖案的幾何問題也沒辦法
→ : 自己看懂,AGI 個鬼!
推 : 看奧圖曼的反應,明顯可以做出他認定的AGI 但是不是101F 12/21 20:22
→ : 安全的AGI ,所以中間那個工程師說要接著做自我修正
→ : 程式碼的AI奧圖曼立刻完全沒停頓說we may be not
→ : 我看你是不懂喔!祂不是看不懂圖祂在思考問題的邏輯
→ : 安全的AGI ,所以中間那個工程師說要接著做自我修正
→ : 程式碼的AI奧圖曼立刻完全沒停頓說we may be not
→ : 我看你是不懂喔!祂不是看不懂圖祂在思考問題的邏輯
推 : mac的GPT app現在有開放捕捉桌面了 WIN的還沒開105F 12/21 20:24
→ : 手機的倒是可以試試看直接開鏡頭讓他算
→ : 手機的倒是可以試試看直接開鏡頭讓他算
→ : 祂後來有解出來,你根本完全沒有看就在這裡嗆。唉,107F 12/21 20:25
→ : 程度的差距
→ : 我直接截圖給GPT算都能解答了,有差攝影機嗎?
→ : 嗆人的是腿多久了,還停留在以前的印象
→ : 程度的差距
→ : 我直接截圖給GPT算都能解答了,有差攝影機嗎?
→ : 嗆人的是腿多久了,還停留在以前的印象
噓 : 哪裏有直接開鏡頭不用任何人工輔助讓 o3 解決複雜111F 12/21 20:30
→ : 的幾何問題的影片請丟出來讓大家聞香好嗎?
→ : 的幾何問題的影片請丟出來讓大家聞香好嗎?
推 : 你有付我錢嗎?笑死113F 12/21 20:31
噓 : 還有,ChatGPT o3 通過率 25.2% 的 Frontier Math114F 12/21 20:33
→ : 不是 open problems 好嗎!那些是難度特別高但都已
→ : 經被人類解決了的問題
→ : 不是 open problems 好嗎!那些是難度特別高但都已
→ : 經被人類解決了的問題
→ : 你自己去用看看弄出什麼東西117F 12/21 20:33
→ : 拿不出來就找各種蹩腳藉口了,笑死 wwww118F 12/21 20:34
→ : 炒股畫夢很厲害 一般人用不出來119F 12/21 20:34
→ : 少在那邊誤導人以為 OpenAI o3 能夠解決 open probl120F 12/21 20:36
→ : ems 那樣屌到天邊 wwww
→ : ems 那樣屌到天邊 wwww
推 : AI產品那麼多 我到底要付費訂閱哪個幫我工作?122F 12/21 20:45
推 : 在 OpenAI o3 發佈的官方影片上出現的:123F 12/21 20:50
噓 : "we have early indications that ARC-AGI-2 will r
→ : emain extremely challenging for (OpenAI) o3"
噓 : "we have early indications that ARC-AGI-2 will r
→ : emain extremely challenging for (OpenAI) o3"
[新聞] OpenAI被集體起訴 微軟也遭殃 - Stock板 - Disp BBS
sde7w9xzo 由美國OpenAI公司推出的人工智慧(AI)聊天機器人ChatGPT在去年底橫空出世後,隨即在全球各地引爆熱潮,儘管OpenAI執行長阿特曼(Sam Altman)多次呼籲從業者重視、合理對待AI技
sde7w9xzo 由美國OpenAI公司推出的人工智慧(AI)聊天機器人ChatGPT在去年底橫空出世後,隨即在全球各地引爆熱潮,儘管OpenAI執行長阿特曼(Sam Altman)多次呼籲從業者重視、合理對待AI技
推 : 當然要解決才能對答案呀 這是比較級的 跟其他模型129F 12/21 21:04
→ : 也是 GOOGLE跟META不知道有沒有測
→ : ARC2那邊沒看到有相對人類的發表 再等等吧
→ : 不過我覺得這東西還是跟使用GOOGLE一樣看個人能力
→ : 也是 GOOGLE跟META不知道有沒有測
→ : ARC2那邊沒看到有相對人類的發表 再等等吧
→ : 不過我覺得這東西還是跟使用GOOGLE一樣看個人能力
推 : 根據今年的戰況,Google 很可能會在三個月左右後發133F 12/21 21:08
→ : 表效能相等或更佳的產品
→ : 表效能相等或更佳的產品
推 : ai訓練ai ai自動進化的奇點快到了135F 12/21 21:17
推 : 是啊,對 Google 這工具的掌握度可以讓兩個人學習和136F 12/21 21:22
→ : 工作能力相差十幾倍甚至幾十倍,加入 AI 後可能相差
→ : 到百倍
→ : 工作能力相差十幾倍甚至幾十倍,加入 AI 後可能相差
→ : 到百倍
推 : Google穩超車的 openAI大咖跑掉 其實從最近動作就139F 12/21 21:41
→ : 看得出來密切在跟G合作
→ : 而且G光旗下像youtube背後長期分析的database 就註
→ : 定sora被屌打
→ : 看得出來密切在跟G合作
→ : 而且G光旗下像youtube背後長期分析的database 就註
→ : 定sora被屌打
推 : O1 就已經看的懂圖了。一堆沒在用的以為ai還停留在g145F 12/21 21:50
→ : pt3.5的時代
→ : pt3.5的時代
推 : 不要只會嘴,秀一段 o1 能看懂有深度的數學幾何題147F 12/21 21:55
→ : 目並解答的影片出來啊
噓 : 才剛看到一個在 Google 工作過的軟體工程師拍影片
→ : 讓 OpenAI o1 解台灣指考題目時說 o1 沒辦法直接吃
→ : 題目中的幾何圖形
噓 : 看來 PTT 鍵盤俠比 Google 軟體工程師更懂怎麼運用
→ : 生成式 AI,嘻嘻
噓 : 再強調一次,不能用手機或電腦鏡頭掃瞄數學試卷就
→ : 給出解答的 AI 連 AGI 的最低門檻「整合感官與思考
→ : 推理」都過不了關啦
→ : 人類智慧最基本的功能就是在看一道數學試題時能正確
→ : 分辨那些影像該被解讀成文字說明、那些影像該被解
→ : 讀成符號數學式、那些影像該被解讀成具有特定特徵(e
→ : .g., 座標軸、平行線、橢圓,...)的幾何圖案
→ : 目並解答的影片出來啊
噓 : 才剛看到一個在 Google 工作過的軟體工程師拍影片
→ : 讓 OpenAI o1 解台灣指考題目時說 o1 沒辦法直接吃
→ : 題目中的幾何圖形
噓 : 看來 PTT 鍵盤俠比 Google 軟體工程師更懂怎麼運用
→ : 生成式 AI,嘻嘻
噓 : 再強調一次,不能用手機或電腦鏡頭掃瞄數學試卷就
→ : 給出解答的 AI 連 AGI 的最低門檻「整合感官與思考
→ : 推理」都過不了關啦
→ : 人類智慧最基本的功能就是在看一道數學試題時能正確
→ : 分辨那些影像該被解讀成文字說明、那些影像該被解
→ : 讀成符號數學式、那些影像該被解讀成具有特定特徵(e
→ : .g., 座標軸、平行線、橢圓,...)的幾何圖案
推 : 你說的是兩個月前剛開放o1還沒開放pro那時候吧161F 12/21 22:22
→ : 那時候還沒開200美去輸入圖片
→ : 那時候還沒開200美去輸入圖片
推 : 不是輸入圖片,上面說了 AGI 的最低門檻是整合感官163F 12/21 22:31
→ : 與思考推理 -- 就問有沒有人能秀一段影片證實 OpenA
→ : I 能用鏡頭掃瞄實體的數學試卷就直接算出解答?尤
→ : 其是包含幾何圖案的數學問題
→ : 與思考推理 -- 就問有沒有人能秀一段影片證實 OpenA
→ : I 能用鏡頭掃瞄實體的數學試卷就直接算出解答?尤
→ : 其是包含幾何圖案的數學問題
推 : 你說的指考那影片是當初還沒開放影像輸入功能的限制167F 12/21 22:32
→ : 如果連這都辦不到就不要吹什麼 AGI168F 12/21 22:32
→ : 我看到那影片下面 三天前有人要他用PRO再測一次169F 12/21 22:32
→ : 就請你拿出反駁的影片啊,那麼難嗎???170F 12/21 22:33
→ : 而且我說的指考試題解答,連不含圖片的題目本身都173F 12/21 22:34
→ : 還要依靠人類手動輸入給 o1
→ : 還要依靠人類手動輸入給 o1
→ : 看起來那個ARC 30%(o1)都有點懷疑了175F 12/21 22:35
→ : 24:40那邊他開始測試
→ : https://youtu.be/ln1zq-VpNhw 這應該是指考那片吧
→ : 沒開放的功能當然沒辦法測 7:31那邊有說
→ : 24:40那邊他開始測試
→ : https://youtu.be/ln1zq-VpNhw 這應該是指考那片吧
→ : 沒開放的功能當然沒辦法測 7:31那邊有說
噓 : 你給的影片和我要求的基本人腦能力壓根沒關係179F 12/21 22:38
推 : 如果瞎子可以看數學考卷的圖並算出來就叫神了180F 12/21 22:41
噓 : 你給的影片是做 ARC-1 level 的圖形推理,根本不是181F 12/21 22:41
→ : 掃瞄一個幾何問題後給出解答
→ : 掃瞄一個幾何問題後給出解答
→ : ARC那個代表Pro開放圖片輸入了 這樣才可以達成你說183F 12/21 22:42
→ : 的看考卷的功能
→ : 的看考卷的功能
→ : 問題 AI 並不是瞎子,電腦視覺科技都發展多遠了?!185F 12/21 22:42
→ : 所以數學考卷那題看那個Roger會不會拿Pro玩吧186F 12/21 22:43
→ : 再繼續胡扯吧 =.=187F 12/21 22:43
噓 : 就說解答指考試題時就算是沒有圖案的題目都得靠人
→ : 類輸入題目內容
噓 : 就說解答指考試題時就算是沒有圖案的題目都得靠人
→ : 類輸入題目內容
推 : ㄟ…. 別花時間吵一個未來可以解決的事 毫無意義190F 12/21 22:47
→ : 白生氣的 反正科技巨頭會自己解決
→ : 白生氣的 反正科技巨頭會自己解決
推 : 他當時就沒開放影片或圖像輸入 不靠人輸入文字不然192F 12/21 22:47
→ : 要怎樣輸入?
→ : 要怎樣輸入?
→ : 時間早晚而已194F 12/21 22:48
→ : openAI在吃transformer架構的老本,deepMind一直在195F 12/21 22:48
→ : 研究新架構
→ : 研究新架構
噓 : ARC 那邊則是靠人類輸入電腦能理解的幾何結構,而197F 12/21 22:48
→ : 不是只靠眼睛(鏡頭)掃描就能分辨出並特徵化題目中
→ : 的幾何圖案
→ : 不是只靠眼睛(鏡頭)掃描就能分辨出並特徵化題目中
→ : 的幾何圖案
→ : ARC那一個他在直播內是直接貼圖要答案 只是第一次給200F 12/21 22:49
→ : 的答案不對 所以他想說是不是要說明 但第二次測試
→ : 沒跑完就被斗內的新問題拉走了
→ : 的答案不對 所以他想說是不是要說明 但第二次測試
→ : 沒跑完就被斗內的新問題拉走了
噓 : 要說幾遍???現在連 o3 都公佈了,你就找出一段 O203F 12/21 22:50
→ : penAI 光靠鏡頭掃瞄一道幾何題目就能自動解答的影
→ : 片啊!有那麼那麼難嗎???
噓 : 再稍微看一下你貼的 ARC-1 test -- 笑死!結果是 AI
→ : 連超級簡單的圖案題目都答錯 -- 而且甚至不懂得把(
→ : 錯誤的)答案畫在格子裏!
噓 : 那只證明了 o1 連「只有幾何圖案本身」的超級簡單
→ : 問題都無法回答,而且只能很粗略地理解幾何圖案,
→ : 所以它完全無法把格子塗好
→ : penAI 光靠鏡頭掃瞄一道幾何題目就能自動解答的影
→ : 片啊!有那麼那麼難嗎???
噓 : 再稍微看一下你貼的 ARC-1 test -- 笑死!結果是 AI
→ : 連超級簡單的圖案題目都答錯 -- 而且甚至不懂得把(
→ : 錯誤的)答案畫在格子裏!
噓 : 那只證明了 o1 連「只有幾何圖案本身」的超級簡單
→ : 問題都無法回答,而且只能很粗略地理解幾何圖案,
→ : 所以它完全無法把格子塗好
推 : https://youtu.be/hkTpMmkVAok 這大概是最接近的了212F 12/21 23:11
→ : 因為YT搜出來的o1 pro數學測試還真的複製貼上
→ : 這一個裡面有把幾何圖形跟題目同時貼給o1 pro 但還
→ : 是答錯 他後面的數學題一樣是用複製貼上
→ : 因為YT搜出來的o1 pro數學測試還真的複製貼上
→ : 這一個裡面有把幾何圖形跟題目同時貼給o1 pro 但還
→ : 是答錯 他後面的數學題一樣是用複製貼上
推 : 這還是只把要處理的幾何圖案直接貼給 o1 Pro 的結果216F 12/21 23:13
→ : ,如果幾何圖案是嵌在整個題目裏而且 non-trivial,
→ : 我完全無法想像 OpenAI 要怎麼把幾何圖案切割出來
→ : 而且正確理解它的幾何意義
→ : ,如果幾何圖案是嵌在整個題目裏而且 non-trivial,
→ : 我完全無法想像 OpenAI 要怎麼把幾何圖案切割出來
→ : 而且正確理解它的幾何意義
→ : 不過分數還是在前1~2%220F 12/21 23:13
→ : 這看起來比較像影像辨識它們要去怎樣精進了 文字OK
→ : 但影像就拆不出來
→ : o1在Arc的測試在OPENAI提供的圖 是落在25-32%正確率
→ : 區間 但從那個只貼圖沒有指示的結果看來有點懷疑
→ : 這看起來比較像影像辨識它們要去怎樣精進了 文字OK
→ : 但影像就拆不出來
→ : o1在Arc的測試在OPENAI提供的圖 是落在25-32%正確率
→ : 區間 但從那個只貼圖沒有指示的結果看來有點懷疑
推 : 所以 OpenAI 還是無法正確解答啊!而且原檔是 pdf -225F 12/21 23:22
→ : - 這讓 OpenAI 跳過了分辨哪部分內容是文字/符號,
→ : 哪部分內容是幾乎圖案的重大挑戰耶
推 : 這難度和直接請 AI 用鏡頭看題目並先能正確切割出
→ : 文字敘述、符號數字、幾何圖案(並理解各種幾何特徵)
→ : 相差很遠耶!
→ : - 這讓 OpenAI 跳過了分辨哪部分內容是文字/符號,
→ : 哪部分內容是幾乎圖案的重大挑戰耶
推 : 這難度和直接請 AI 用鏡頭看題目並先能正確切割出
→ : 文字敘述、符號數字、幾何圖案(並理解各種幾何特徵)
→ : 相差很遠耶!
推 : https://youtu.be/pb0mjgk1CtY 從1:29:20-1:34:00231F 12/21 23:52
→ : 他用手機鏡頭去辨識比較難的數學題 看起來影像辨識
→ : 在拆特殊符號時候會認不到
→ : 他用手機鏡頭去辨識比較難的數學題 看起來影像辨識
→ : 在拆特殊符號時候會認不到
→ : 前面到底在爭執agi的定義完全不需要,只要能提升人234F 12/21 23:56
→ : 類能力上限就夠了,人作為意識源,AI作為能力放大
→ : 器。
→ : 類能力上限就夠了,人作為意識源,AI作為能力放大
→ : 器。
→ : 要被淘汰了吧 都快2025還在生成一些玩具幹什麼237F 12/22 00:06
推 : 我在猜那些讓 o3 解答的數學題目是不是都先改寫成 L238F 12/22 00:10
→ : aTeX 格式,包括題目裏所有的圖表和幾何圖案?因為
→ : 這是現今生成式 AI 最方便理解的格式
推 : 不過拋開某些____無謂又無聊的 AGI 執著,OpenAI o3
→ : 在解答數學和程式編寫上的進步讓人印象很深刻
→ : @tsubasawolfy:感謝你一直提供具參考價值的影片
推 : 還好我過幾年就打算退休了,生成式 AI 這兩年進步得
→ : 讓人瞠目結舌
→ : aTeX 格式,包括題目裏所有的圖表和幾何圖案?因為
→ : 這是現今生成式 AI 最方便理解的格式
推 : 不過拋開某些____無謂又無聊的 AGI 執著,OpenAI o3
→ : 在解答數學和程式編寫上的進步讓人印象很深刻
→ : @tsubasawolfy:感謝你一直提供具參考價值的影片
推 : 還好我過幾年就打算退休了,生成式 AI 這兩年進步得
→ : 讓人瞠目結舌
推 : 訓練超級耗電246F 12/22 00:53
→ : 全台灣現下只有3個id 能在codecforces 拿到247F 12/22 01:29
→ : rating 2700, o3有2727金變態
→ : rating 2700, o3有2727金變態
[新聞] AI 太耗電、OpenAI 拚核融合,專家:進度沒那麼快 - Tech_Job板 - Disp BBS
pl132 AI 太耗電、OpenAI 拚核融合,專家:進度沒那麼快 AI 太耗電、OpenAI 拚核融合,專家:進度沒那麼快 | TechNews 科技新報 OpenAI 執行長阿特曼(Sam Altman)
pl132 AI 太耗電、OpenAI 拚核融合,專家:進度沒那麼快 AI 太耗電、OpenAI 拚核融合,專家:進度沒那麼快 | TechNews 科技新報 OpenAI 執行長阿特曼(Sam Altman)
推 : 之前openai本來就沒領先很多 所以之前內鬥才白癡啊250F 12/22 01:52
→ : 他強的就是邏輯能力但是你叫他寫東西出來就是沒有251F 12/22 01:52
→ : 好作品
→ : 跟你說他們根本就是一個熔爐而已
→ : 好作品
→ : 跟你說他們根本就是一個熔爐而已
→ : 之前假道德擔心自家可能開發出危險的AI 但卻忘了254F 12/22 01:53
→ : 自己並沒有領先Meta和google多少 這發展很正常
→ : 自己並沒有領先Meta和google多少 這發展很正常
→ : 因為台灣從來沒看過這東西所以覺得很新奇256F 12/22 01:56
→ : https://tinyurl.com/2xk7gnuc
→ : 不知道你們有沒有看過這個
→ : 洋玩意
→ : 後面代表的是西方的聖火
→ : 每幾百年就會來侵襲一次
→ : https://tinyurl.com/2dnk2v7c
→ : https://tinyurl.com/2xk7gnuc
→ : 不知道你們有沒有看過這個
→ : 洋玩意
→ : 後面代表的是西方的聖火
→ : 每幾百年就會來侵襲一次
→ : https://tinyurl.com/2dnk2v7c
--
※ 看板: Stock 文章推薦值: 0 目前人氣: 0 累積人氣: 39
作者 sam20135 的最新發文:
- AI競爭愈烈 OpenAI測試新AI模型o3與o3 mini 鉅亨網編譯陳又嘉 OpenAI 周五 (20 日) 宣布,目前正在測試其最新的推理 AI 模型 o3 和 o3 mini。此舉 顯示 A …262F 53推 18噓
- 原文標題: 韓聯社:尹錫悅發布緊急戒嚴令 2024-12-03 21:49 聯合報/ 編譯 周辰陽/即時報導 南韓韓聯社3日晚間發出快訊指出,尹錫悅總統發布緊急戒嚴令。 南韓先驅報報導,尹錫悅在記者 …1246F 657推 55噓
- 29F 13推 1噓
- 壽險解約潮持續延燒,保費收入低於保險給付情況恐成「新常態」。保發中心統計顯示, 2024年5月保險給付2,499億元,刷新史上單月最大紀錄;不只如此,今年前五月保險給付 更突破兆元規模、達1兆1,0 …179F 74推 7噓
- 知名運動鞋品牌Nike日前下修2025年財報展望,並指出未來1年銷售將放緩,使得華爾街 對於Nike股價前景跌至近6年來新低,但在此之前,Nike曾經是華爾街分析師的寵兒。 根據《彭博社》報導,Ni …238F 124推 4噓
點此顯示更多發文記錄
→
guest
回列表(←)
分享