Re: [新聞] DeepSeek R1來了，追平o1！它現在不 - Stock板

作者 ohlong (強森)
標題 Re: [新聞] DeepSeek R1來了，追平o1！它現在不
時間 Mon Jan 27 20:36:44 2025

這篇有幫大家看過paper了
基本上就是在chain of thought inference 推理的時候
reinforcement跟supervised比例的嘗試

數理問題RL比重高點
需要文法的文字問題supervised比重多一點

感覺是training手法的不同
跟model的運算架構沒啥關係

我是覺得有點過譽辣
RL天馬行空不見得效率會一直比較好
最後還是得靠堆算力

但是deepseek的成功背後代表的事是
人類的思考框架永遠比想像中的蠢=_=
找一個蠢蛋去supervised 只會得到一個蠢蛋

※ 引述《kobebrian》之銘言
: 先說我完全不懂DS的算法也不懂open ai的算法
: 但既然DS開源那大家都能使用的情況下未來AI迭代肯定加速
: 有人說我用1/50的算法就可以做到一樣的功能...是啊大家都可以用這套算法的情況下那

: 還是得拼硬體
: 我用更強大的硬體可以推出更好的產品、服務除非今天硬體本身的上限到了沒辦法再有

: 更好的硬體來加速運算
: 不然這些大公司要怎麼贏過有同樣效率、算法的對手？我硬體先用到頂規再來用軟體拼
: 贏還是有人覺得這些大公司挖金礦敢用次級鏟子？
: 就是那些小公司現在也「可能」有本錢下來市場玩他們可能可以用次一等的鏟子來挖推

: 出沒那麼好但便宜的產品這會讓整個硬體的市場擴大以前只能是最頂規的硬體跟AI有關

: 現在不是
: 而且也就是「可能」而已
: -----
: Sent from MeowPtt on my iPhone
----
Sent from BePTT on my iPhone 15 Pro

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.139.179.137 (臺灣)
※ 作者: ohlong 2025-01-27 20:36:44
※ 文章代碼(AID): #1dbttUNL (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1737981406.A.5D5.html

※ 同主題文章:

Re: [新聞] DeepSeek R1來了，追平o1！它現在不但比OpenAI開放，也

01-27 20:15 kobebrian

Re: [新聞] DeepSeek R1來了，追平o1！它現在不但比OpenAI開放，也

01-27 20:29 icrose

Re: [新聞] DeepSeek R1來了，追平o1！它現在不

01-27 20:36 ohlong

Re: [新聞] DeepSeek R1來了，追平o1！它現在不但比OpenAI開放，也

01-27 21:07 TentoEtsu

Re: [新聞] DeepSeek R1來了，追平o1！它現在不但比OpenAI開放，也

01-27 21:55 breathair

Re: [新聞] DeepSeek R1來了，追平o1！它現在不但比OpenAI開放，

01-28 00:24 a3556959

推 ben108472: 看股市反應成這樣就知道人類真的是白癡1F 01/27 20:37

推 kobebrian: 沒關係你要當沒那麼白痴的那個（不是說你不是白痴也不是罵你白痴2F 01/27 20:40

推 sd2567: 不是人很蠢是你的大腦比想像中更強4F 01/27 20:45

→ lonelyQQ: 看完了台股完蛋5F 01/27 20:48

→ lookapen: 這種手法會有專項偏頗的情況, 應該不容易廣泛適用6F 01/27 21:46

作者 ohlong 的最新發文:

+16 Re: [問題] 買特斯拉一定要裝充電樁嗎？ - car 板

作者: ohlong 223.138.4.102 (台灣) 2025-06-25 08:40:22

90F 20推 4噓
+8 [情報] lies of p DLC shadow dropped - PlayStation 板

作者: ohlong 223.139.125.129 (台灣) 2025-06-06 20:34:22

9F 8推
+72 [分享] 看不出來很壯的金慧成 - Baseball 板

作者: ohlong 42.77.224.231 (台灣) 2025-05-22 14:49:09

起因是在休息室訪問盲西時被拍到然後就被改成這樣了 180cm 80kg穿衣服完全看不出來超壯這女粉絲會瞬爆吧

110F 73推 1噓
+3 Re: [閒聊] 台灣高速公路塞車原因不在於限速100 - car 板

作者: ohlong 42.77.240.79 (台灣) 2025-02-03 09:45:56

11F 3推
+3 Re: [新聞] DeepSeek R1來了，追平o1！它現在不 - Stock 板

作者: ohlong 223.139.179.137 (台灣) 2025-01-27 20:36:44

6F 3推

點此顯示更多發文記錄