作者 icrose (人本良心)標題 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據時間 Thu Jan 30 09:08:09 2025
這篇文章的核心意思就是
我們掌握著一些竅門,可以提升回答質素的那些,我們早就實踐,而且怕被快速追上,所以把他們閉源了
但是這些訣竅被中國人自己研究出來了
還有一些技巧,早就可打破一味堆算力的瘋狂勢頭,但是為了保護美國七巨頭現在
極好的股票上升勢頭。我們把它們擱置了,ds一出,我們不得不把低成本部署的算法都拿出來準備實施了
現在的問題就是,一直靠堆算力堆數據堆電力就能到達AGI的幻境破滅了
投資人的狂熱消散了。起碼第一波狂熱終於被點破了
※ 引述《Lushen (pttlushen)》之銘言:
: OpenAPI 的 Chief Research Officer (首席研究員)
: Mark Chen 2025/01/29 凌晨發了一波推文評價 Deepseek R1 的論文
: https://i.imgur.com/A73X07x.png
: https://i.imgur.com/rjDczVH.png
: 恭喜 DeepSeek 產出了一個 o1 級別的推理模型!他們的研究論文顯示,他們獨立發現了
: 一些我們在通往 o1 道路上所找到的核心理念。
: 不過,我認為外界的反應有些過度,特別是在成本相關的敘事上。擁有兩種範式(預訓練
: 和推理)的一個重要影響是,我們可以在兩個軸向上最佳化能力,而不是只有一個,這將
: 帶來更低的成本。
: 但這也意味著我們有兩個可以擴展的軸向,而我們計劃在這兩個方向上都積極投入算力!
: 隨著蒸餾(distillation)技術的成熟,我們也看到降低成本和提升能力這兩者之間的關
: 係越來越解耦。能夠以更低的成本提供服務(尤其是在較高延遲的情況下),並不代表能
: 夠產生更強的能力。
: 我們將持續改進模型的低成本部署能力,但我們仍對研究路線保持樂觀,並將專注於執行
: 計劃。我們很興奮能在本季度及今年內推出更優秀的模型!
: Congrats to DeepSeek on producing an o1-level reasoning model! Their research
: paper demonstrates that they’ve independently found some of the core ideas
: that we did on our way to o1.
: However, I think the external response has been somewhat overblown,
: especially in narratives around cost. One implication of having two paradigms
: (pre-training and reasoning) is that we can optimize for a capability over
: two axes instead of one, which leads to lower costs.
: But it also means we have two axes along which we can scale, and we intend to
: push compute aggressively into both!
: As research in distillation matures, we're also seeing that pushing on cost
: and pushing on capabilities are increasingly decoupled. The ability to serve
: at lower cost (especially at higher latency) doesn't imply the ability to
: produce better capabilities.
: We will continue to improve our ability to serve models at lower cost, but we
: remain optimistic in our research roadmap, and will remain focused in
: executing on it. We're excited to ship better models to you this quarter and
: over the year!
: : 喊得很大聲,做出來的不過就那樣
--
當心,被擊沉的推文跟班有:
LiXX FaXX LuckXX DrGXX shiriXX downtoearXX stanthemXX liweitseXX
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.89.14.114 (中國)
※ 作者: icrose 2025-01-30 09:08:09
※ 文章代碼(AID): #1dcj3whz (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1738199290.A.AFD.html
※ 同主題文章:
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據
01-30 09:08 icrose
→ laptic: 所以人家的「蒸餾」說 不敢正面回應?(如算式等)1F 01/30 09:09
推 ggian123: 美國狗輸不起了
美國例外論信仰崩塌2F 01/30 09:10
推 sdbb: 推一味,願意好好選字的人越來越少4F 01/30 09:14
噓 Leo4891: 自己腦補就不用硬扯啥人家的意思了5F 01/30 09:14
推 fish813: 要一直保持第一 很累6F 01/30 09:18
推 lusifa2007: 沒吧 應該是更有效率的演算法加上更多的硬體 可以更快達到AGI的目標7F 01/30 09:22
推 xiemark: cudnn效率不是最佳9F 01/30 09:24
推 mamorui: OpenAI不可能開源的,有pretrain data在手,沒必要開源12F 01/30 09:27
→ nobody0522: 在這裏幫DS洗地到底有什麼好處? 看不太懂網路與論這波操作14F 01/30 09:30
推 sdbb: 仿製藥的問題,1.合成2.要有受試者驗證
軟體的話,小魯就不確定會卡在哪邊y16F 01/30 09:30
推 k1k1832002: 會洗地嗎,不就一堆在嘲諷不能查64,造假,抄襲,討論的重點一直都在於更低的成本達到相同效能,這洗什麼地19F 01/30 09:36
→ ookimoo: LLM是到不了AGI的 信徒早點洗洗睡24F 01/30 09:37
→ k1k1832002: 訂閱要花兩百美元現在有低價版,低價版卻變成靶子XD25F 01/30 09:37
→ judy13857: 有錢拿吧,上面Lushen都已經開示了,也洗好幾天了27F 01/30 09:37
→ tctv2002: 好處就是一般需求的人用DS就可以了28F 01/30 09:37
→ ookimoo: 目前的經濟環境 各國經濟自主 美國想用AGI征服世界也不容易 大概需要一次大蕭條的經濟重置29F 01/30 09:37
推 s213092921: AI護城河還沒套利變現,就被DS挖了祖墳,看你氣不氣32F 01/30 09:43
→ ookimoo: 至於版上多蛙 在喊多 都沒意義 要知道民主共和黨
後面站的都是猶太人 只是這次換選共和黨而已
你們在這裡喊多 但是操盤的猶太人要收回資金了
你們會贏嗎 呵呵33F 01/30 09:44
噓 miguel1968: 中國花錢買網軍的實力真的跟DS一樣稱霸世界38F 01/30 09:51
推 Samurai: 什麼叫一般需求夠用?現在AI已經夠了?39F 01/30 09:54
推 NetsFan: 好啦,意見不同先抹黑最實在40F 01/30 09:54
※ 編輯: icrose (223.89.14.114 中國), 01/30/2025 09:59:14
→ newwu: 腦補太多了吧
後半段全部都是你自己在想41F 01/30 09:59
→ fedona …
噓 fedona: 電力股已經開始反彈43F 01/30 10:02
→ aewul: 採訪說要用法律保持科技領先..怪怪44F 01/30 10:08
推 clecer: ai還能幹嘛,說來聽聽46F 01/30 10:17
→ linzero: AI應用應該還有很多領域還沒完善,還是有砸錢搞算力的需求吧,不過可能語言這部分會降低需求
而且應用落實後,研發可能需求降低,但應用方面需求也可能會更多48F 01/30 12:03
--