※ 本文轉寄自 ptt.cc 更新時間: 2025-02-07 11:04:38
看板 Stock
作者 標題 [情報] 50美元訓練出媲美DeepSeek R1
時間 Thu Feb 6 16:56:06 2025
標題:
李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型
來源:
Futu
網址:
https://tinyurl.com/ydrtdbu8
內文:
李飛飛等斯坦福大學和華盛頓大學研究人員近日以不到50美元的雲計算費用訓練了一個名
叫s1的人工智能推理模型。該模型在數學和編碼能力測試中的表現與OpenAI的o1和DeepSe
ek的R1等尖端推理模型類似。研究人員表示,s1是通過蒸餾法由谷歌推理模型Gemini 2.0
Flash Thinking Experimental提煉出來的。
叫s1的人工智能推理模型。該模型在數學和編碼能力測試中的表現與OpenAI的o1和DeepSe
ek的R1等尖端推理模型類似。研究人員表示,s1是通過蒸餾法由谷歌推理模型Gemini 2.0
Flash Thinking Experimental提煉出來的。
https://i.imgur.com/kFg9GjU.jpeg
![[圖]](https://imgur.disp.cc/44/kFg9GjU.jpeg)
斯坦福大學以及華盛頓大學的研究團隊展示了一種極低成本的 AI 訓練方法,被稱為 S1
。
S1 僅使用 6 美元就能達到 OpenAI o1-preview 級別的推理性能!同時匹敵Deepseek R1
推理時間可控:S1 通過簡單的“Wait”機制,控制大模型的思考時間,提高推理能力。
S1 不是 OpenAI o1 或 DeepSeek R1 的直接復刻,但它揭示了在推理時微調 AI 的潛力
,甚至可以媲美 Reinforcement Learning(強化學習)。
推理時間可控:S1 通過簡單的“Wait”機制,控制大模型的思考時間,提高推理能力。
S1 不是 OpenAI o1 或 DeepSeek R1 的直接復刻,但它揭示了在推理時微調 AI 的潛力
,甚至可以媲美 Reinforcement Learning(強化學習)。
OpenAI 和 DeepSeek 早期研究發現,AI 在回答問題時“思考得更久”,往往能得出更好
的答案。但過去並沒有清楚解釋:如何在推理階段控制 AI 的思考時間?
S1 的創新點: S1 論文提供了推理時間擴展(Inference Scaling)的具體實現方法:
核心思想:
如何在不改變 AI 訓練過程的情況下,提高 AI 解決複雜問題的能力?
方法:讓 AI 在推理時“多想幾秒”,自動檢查自己的答案,從而減少錯誤,提高正確率
!
結果證明,這種方法比 OpenAI o1-preview 還要好!
最重要的是:而且只用了 1000 道題! 這比一般 AI 訓練的數據少了 800 倍,但效果仍
然很強!
此外,該模型可以在筆記本電腦上運行,並且其訓練成本僅為 6 美元。
論文下載
https://arxiv.org/pdf/2501.19393
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.72.195.108 (臺灣)
※ 作者: LimYoHwan 2025-02-06 16:56:06
※ 文章代碼(AID): #1df7afZl (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1738832169.A.8EF.html
※ 同主題文章:
● 02-06 16:56 ■ [情報] 50美元訓練出媲美DeepSeek R1
02-06 17:16 ■ Re: [情報] 50美元訓練出媲美DeepSeek R1
02-06 18:54 ■ Re: [情報] 50美元訓練出媲美DeepSeek R1
02-07 08:14 ■ Re: [情報] 50美元訓練出媲美DeepSeek R1
※ 編輯: LimYoHwan (42.72.195.108 臺灣), 02/06/2025 16:56:28
--
推 : 好便宜!!!1F 02/06 16:56
![[圖]](https://imgur.disp.cc/44/k2IXEC7.jpeg)
推 : ?3F 02/06 16:56
推 : 不用錢,我的腦就是R14F 02/06 16:57
→ : 完了 地動山搖5F 02/06 16:57
推 : R1很強6F 02/06 16:57
→ : Gamini 2.0不是剛出不到一天7F 02/06 16:57
→ : 提煉再提煉8F 02/06 16:58
→ : 你肥肥團隊9F 02/06 16:58
推 : 哈哈 過一陣子 會不會出現0.5美元就可以搞定10F 02/06 16:58
推 : 變伏特加了吧這個11F 02/06 16:58
推 : 這啥 白菜價? 韭菜價?12F 02/06 16:58
→ : 多想幾秒鐘 你可以不要...13F 02/06 16:58
→ : AI白菜價14F 02/06 16:59
推 : openai又要發作了嗎15F 02/06 16:59
推 : 真的白菜價了16F 02/06 16:59
→ : 要遍地AI了17F 02/06 16:59
推 : 那誰要當第一個訓練的?18F 02/06 17:00
→ : 然後發現 這AI我根本很少用到啊19F 02/06 17:00
→ : 丸子 沒有最便宜 只有更便宜 ㄟ唉末日20F 02/06 17:00
→ : 這很常見…不用大驚小怪21F 02/06 17:01
推 : 結果最後大家都去別人的水桶裡面釣魚耶 笑死22F 02/06 17:01
推 : 丸子 原來搞AI那麼便宜23F 02/06 17:01
→ : 以後沒人想開源了 大家自己買nv晶片訓練大模型24F 02/06 17:02
推 : 太唬爛了,能信嗎25F 02/06 17:02
推 : 卷爛26F 02/06 17:02
推 : 你釣他水桶裡的魚,我釣你水桶裡的魚,大隊接力27F 02/06 17:02
→ : 看來ai普及速度極快,終端裝置準備大噴發QQ28F 02/06 17:03
推 : 看不懂29F 02/06 17:03
推 : NV我們不要了30F 02/06 17:03
推 : 你蒸餾我的蒸餾 近親繁殖?31F 02/06 17:03
→ : 蹦蹦32F 02/06 17:03
推 : 50鎂有點太唬爛了33F 02/06 17:03
→ : 阿不就是都在巨頭開發模型基礎上才做得出來34F 02/06 17:04
推 : NV又要一根了嗎?35F 02/06 17:04
推 : 這應該算微調嗎36F 02/06 17:04
推 : gemini :我的魚!!!!37F 02/06 17:05
推 : 連顯卡都不用38F 02/06 17:05
→ : 多想幾秒 連線請教GPT39F 02/06 17:05
推 : NV利空40F 02/06 17:05
→ : 轉包的概念 cc41F 02/06 17:05
→ : NV又要崩崩 TSM崩崩崩42F 02/06 17:06
推 : 崩43F 02/06 17:06
→ : 第一個訓練的都低能兒44F 02/06 17:06
推 : 麥當勞工讀生一天都不只要50鎂45F 02/06 17:07
→ : 蒸餾你的蒸餾的蒸餾的蒸餾的蒸餾46F 02/06 17:07
推 : 直接蒸餾別人的模型沒有版權問題嗎?47F 02/06 17:07
推 : 越來越吹越來越騙,超白吃的哈哈哈48F 02/06 17:07
→ : 工程進步本來就是一直站在前人肩膀上往上一點一點爬49F 02/06 17:07
→ : 50美元我看是員工上廁所的錢50F 02/06 17:07
推 : 真的筆電手機可以跑崩個毛線,超級換機潮要來了51F 02/06 17:07
→ : 雲計算.....52F 02/06 17:07
噓 : 自己人說好不打自己人53F 02/06 17:07
推 : 喜迎換機潮54F 02/06 17:07
→ : 蒸餾來蒸餾去,啊誰要當花錢的人呢?55F 02/06 17:08
推 : 甲甲越想越不對56F 02/06 17:08
推 : NV掰57F 02/06 17:08
→ deann …
→ : ds崩潰 @v@59F 02/06 17:08
推 : 李飛飛是美國國家工程學會院士超強60F 02/06 17:08
→ : 可以的吧61F 02/06 17:08
推 : 急了嗎62F 02/06 17:08
→ : 這個核心是Edge AI應用端啊 推理端負責第一個花錢63F 02/06 17:08
噓 : 下次剩5毛了64F 02/06 17:08
→ : 用AI來訓練AI的概念????????????65F 02/06 17:08
推 : 卷起來66F 02/06 17:09
→ : 翻譯成史丹佛大學比較多人知道67F 02/06 17:09
推 : 白菜價AI68F 02/06 17:10
推 : 三思而後行的體現69F 02/06 17:10
推 : 成本是這樣算的嗎~~ 越來越唬爛了70F 02/06 17:10
→ : 李飛飛是美國公民從小就移民美國了71F 02/06 17:10
推 : 改天就會進步到無料訓練72F 02/06 17:10
噓 : Ai要變成熟製程了73F 02/06 17:11
推 : 蒸餾74F 02/06 17:11
推 : Gemini 很智障,蒸餾錯誤了75F 02/06 17:11
推 : 前面花錢的都白癡76F 02/06 17:11
→ : 也是要靠蒸餾 人家模型不給你用 是要省到哪77F 02/06 17:11
推 : 看那些巨頭怎麼回收 訓練越來越便宜78F 02/06 17:12
推 : 開捲囉~~~79F 02/06 17:12
→ yoyodiy …
推 : 香81F 02/06 17:12
推 : 以後只要釣別人水桶內的好魚就好了 那誰要當漁翁?82F 02/06 17:13
→ : 崩崩崩83F 02/06 17:13
推 : 捲起來 軟體快沒毛利了84F 02/06 17:14
推 : (只有更便宜,)(沒有最便宜!)(嘻嘻。)85F 02/06 17:14
推 : 多想幾秒 大賺百美86F 02/06 17:14
推 : 意料中的事87F 02/06 17:14
推 : 越來越扯了88F 02/06 17:14
推 : Gemini2.0 很智障,蒸餾失敗吧,要蒸也要GPT89F 02/06 17:15
→ : 4090 50收90F 02/06 17:15
推 : 幹成白菜價91F 02/06 17:16
推 : 站在巨巨的巨巨的肩膀上,指數型成長92F 02/06 17:16
噓 : 好了啦93F 02/06 17:17
推 : 丸子,AI要變成白菜價了QQ94F 02/06 17:17
→ : 削價競爭95F 02/06 17:17
推 : 笑死 以後大家都用蒸餾法從別人模型裡學習96F 02/06 17:17
→ : 蒸出來取好的精煉也算效率提升吧(?97F 02/06 17:18
推 : 人工智慧(x)人工智障(o)98F 02/06 17:19
推 : 這樣誰要當第一個 XDD 你蒸餾我的蒸餾99F 02/06 17:19
推 : 筆電一台6美元? 到底在公三小100F 02/06 17:20
推 : 已經有冤大頭當了啊XDD101F 02/06 17:20
推 : 以後誰要?不需要啦102F 02/06 17:20
→ : 他是刷出租雲端空間跑的103F 02/06 17:20
推 : 嗯大地震要來了嗎?104F 02/06 17:20
推 : 笑死 錢都花巨頭的 其他蒸餾就好用啦 巨頭們:乾105F 02/06 17:20
推 : 大AI時代?106F 02/06 17:21
推 : 50美元可以那根本不須硬體 再多公司投入也沒用107F 02/06 17:21
推 : 卷了108F 02/06 17:21
→ : 大蒸餾比賽開打109F 02/06 17:21
推 : 越來越扯110F 02/06 17:21
推 : 大躍進時大家都這樣玩啊,你畝產千斤我畝產萬斤111F 02/06 17:22
推 : 這應該就蒸餾然後在限定領域112F 02/06 17:22
推 : 是誰搬走了我的魚113F 02/06 17:22
→ kimula01 …
推 : 那最近這波中國半導體噴漲要掰了吧,不是只有Deeps115F 02/06 17:22
→ : eek 做得到
→ : eek 做得到
推 : 大蒸餾時代117F 02/06 17:23
推 : 所以說開放api這條路應該要斷了吧118F 02/06 17:23
推 : AI模型多元宇宙119F 02/06 17:23
推 : 突然想到蒸兩手之后 openai是不是告不到了120F 02/06 17:23
→ : 越來越唬爛了,相對論是憑空出現的嗎..121F 02/06 17:23
→ : 跟以前盜版光碟一樣 總要發明防拷技術122F 02/06 17:24
→ : 不給專利誘因那誰要搞技術,通通回去種田123F 02/06 17:24
噓 : 這次熔斷嗎124F 02/06 17:24
→ : 如果不開源 大家就只需按個按鈕切到別的模型去125F 02/06 17:24
→ : 這個沒有蒸兩手啊?126F 02/06 17:24
推 : 大家都站在別人的肩膀 那誰要在地上127F 02/06 17:24
→ : 看錯了 我以為是蒸DS128F 02/06 17:25
推 : 生命之水129F 02/06 17:25
推 : 啊重點就是這些科技巨頭已經在地上了啊XD130F 02/06 17:25
→ : 不需要開源啊 事實上大家都沒錢訓練 以後都不給蒸131F 02/06 17:25
→ : 餾 等防拷技術出來再說
→ : 餾 等防拷技術出來再說
推 : 這是美國自己研發總不能說因為國安不能用吧133F 02/06 17:25
→ : 方向很明確了,大家要玩成本降低,nv 下去134F 02/06 17:25
→ : 要怎麼證明是用誰的模型蒸餾呢?135F 02/06 17:25
→ : NV只會更強 如果要靠蒸餾 只能說吃屎136F 02/06 17:26
→ : 謝謝你 矽谷銀彈137F 02/06 17:26
推 : 都不用設備了,大科技蒸餾大科技138F 02/06 17:26
→ : 不靠蒸餾就能降低成本 NV才會下去139F 02/06 17:26
推 : 丸子 蒸的丸子140F 02/06 17:26
推 : 防拷應該蠻難的141F 02/06 17:26
推 : 看了一下論文 其實哪有那麼便宜 你還要拿GPU來微調142F 02/06 17:26
→ : 以後主權ai都鎖在自己國家實驗室 不給蒸餾143F 02/06 17:26
推 : AI變白菜了144F 02/06 17:27
→ : 他是示範便宜的蒸餾過程成本 不用限定Gemini智障145F 02/06 17:27
→ deann …
→ : 模型內容 還要從59K的問題中找到一千題來微調147F 02/06 17:27
→ : 講說點,就是用別人的AI加以開發...148F 02/06 17:27
推 : 要防蒸餾就是不讓外人使用 但也很難賺錢149F 02/06 17:27
推 : 對人類是大利多 對股民是... ?150F 02/06 17:27
→ : 以後巨頭不敢公開 花大錢別人隨便蒸餾XD151F 02/06 17:27
推 : 重點是不用太貴的GPU吧152F 02/06 17:27
→ : 還不是靠蒸餾153F 02/06 17:27
→ : 開源也只是開放現在gpt蒸餾出來的 等gpt-5出來 這154F 02/06 17:28
→ : 些還是得跪下
→ : 些還是得跪下
推 : 濃縮再濃縮156F 02/06 17:28
→ : 站在別人的肩膀前進157F 02/06 17:28
→ : 但openai最好想好gpt-5如何防拷再開放出來158F 02/06 17:28
→ : 巨頭就通通變成黑盒子 然後還要預防MEA攻擊159F 02/06 17:28
→ : 啊可是Gpt5出來明天就可以再蒸餾了XD160F 02/06 17:28
推 : 開源就很好用了... 你發展你的 消費者用不到那麼深161F 02/06 17:28
→ : 不然就是巨頭自己學會這些蒸餾法 只發布蒸餾好的162F 02/06 17:29
推 : 精粹再精粹163F 02/06 17:29
→ : 唯一的方法是搞出GPT5後還不給外面access 但這樣要164F 02/06 17:29
→ : 玩個雞毛
→ : 玩個雞毛
推 : 又是中國!李飛飛166F 02/06 17:29
→ : 跟以前ps2盜版光碟猖獗一下 接下來就是考驗專利和167F 02/06 17:29
→ : 防拷技術了
→ : 防拷技術了
推 : 學一個智障有啥用169F 02/06 17:29
推 : Openai快變open醬了 被打趴170F 02/06 17:29
推 : 準備崩崩 那些吹AI伺服器的都反應完惹171F 02/06 17:30
推 : 開源只要一打開美國研究機構一堆天才一定玩的比DS更172F 02/06 17:30
推 : 現在就一直蒸餾你的蒸餾嗎173F 02/06 17:30
→ : 猛的174F 02/06 17:30
→ : 你發佈蒸餾版也沒用啊 input output能學就能蒸餾175F 02/06 17:30
推 : 那就蒸餾你的蒸餾 防不了吧176F 02/06 17:30
→ : 要獲利還是要靠閉源吧 哈哈 開源推動的是硬體 但對177F 02/06 17:30
→ : 軟體開發沒幫助 直接讓市場健康不良
→ : 軟體開發沒幫助 直接讓市場健康不良
→ : 沒救 只能像以前google統統關在小黑屋裡179F 02/06 17:30
推 : 最後王者還是要硬體的180F 02/06 17:30
推 : 李飛飛也算大神級人物吧!181F 02/06 17:30
→ : 偶爾放他出來下圍棋秀一下肌肉182F 02/06 17:30
→ : 秀太多次就會被蒸餾QQ
→ : 秀太多次就會被蒸餾QQ
→ : 人手內建AI模型 下一步就民間各自特化模型在賣了184F 02/06 17:31
推 : 使用 16 NVIDIA H100 GPUs with PyTorc 26分鐘微調185F 02/06 17:31
推 : 吹吧,越吹越買NV186F 02/06 17:31
→ : 你蒸餾我的蒸餾!?187F 02/06 17:32
推 : 李飛飛是美國三個大型學會院士當然神,華裔美國人之188F 02/06 17:32
推 : 這個是訓練解單一類型題目而已189F 02/06 17:32
→ : 神阿190F 02/06 17:32
推 : 軟硬體結合才能防蒸餾防拷啊191F 02/06 17:32
推 : 蒸餾不稀奇 現在是要成本越低越有人看484 qq192F 02/06 17:32
推 : 現在大家都來當卡卡西?193F 02/06 17:33
推 : 在一個月就免費訓練了194F 02/06 17:33
推 : 唯一獲利的方法是搞出AGI ASI 然後直接毀滅世界 不195F 02/06 17:33
→ : 然永遠有辦法被蒸餾模仿 誰先做誰傻逼
→ : 然永遠有辦法被蒸餾模仿 誰先做誰傻逼
→ : 以後模型盈利看來只在嵌入式機器裡面了 不給蒸餾197F 02/06 17:33
推 : 這樣對市場好像不太好欸 那誰要回饋給花大錢訓練的198F 02/06 17:33
→ : ?
→ : ?
推 : 笑死200F 02/06 17:33
→ : 邰哥表示 : 提煉再提煉,濃縮再濃縮,才來精緻完成201F 02/06 17:33
→ : 他重點是說要從大模型裡面榨出自己需要的各種專門AI202F 02/06 17:33
→ : 可以很便宜
→ : 可以很便宜
→ : Siri助理一問一答有沒有辦法蒸餾? 我看是很難204F 02/06 17:33
推 : 沒有大模型先做訓練也沒辦法蒸餾,大家都只想收割205F 02/06 17:33
→ : 不想播種,ai發展就會停滯了
→ : 不想播種,ai發展就會停滯了
→ : 蒸餾你的蒸餾 後面費用本來就低吧207F 02/06 17:33
→ : 要浪費太多時間去問208F 02/06 17:34
推 : 50美元,我也來開AI公司209F 02/06 17:34
推 : 我提煉你的提煉210F 02/06 17:34
噓 : 看一下現在deepseek卡住的樣子呵呵211F 02/06 17:34
推 : 就說openai 只有在搞到新聞想要燒錢做出agi 狂人科212F 02/06 17:34
→ : 學家
→ : 學家
推 : 卷卷卷214F 02/06 17:34
推 : 不用就不用花錢 選我正解215F 02/06 17:34
→ : 在資本主義的股票市場 對人類有利多的通常都...216F 02/06 17:34
推 : 貓咪釣魚.gif217F 02/06 17:34
推 : 再騙我阿 誰說一定要買高級鏟子218F 02/06 17:34
推 : 意思就是誰當第一個誰白癡?219F 02/06 17:34
→ : 不過這就跟arm公版cpu我直接照抄去做 還是要付專利220F 02/06 17:34
→ : 一樣
→ : 一樣
推 : 以後法規成熟才能規範吧 現在就互相蒸餾 蠻好笑的222F 02/06 17:34
→ : 看以後有沒有專利收費 老美被搞太不爽應該會立案223F 02/06 17:35
推 : NV表示:224F 02/06 17:35
推 : 提煉再提煉 濃縮再濃縮225F 02/06 17:35
推 : 丸子226F 02/06 17:35
推 : 開始捲了227F 02/06 17:35
推 : 這樣誰會當盤子 弄出來給人家蒸餾XD228F 02/06 17:35
→ : 看哪天誰開始擋蒸餾 後面改版一次換一次就好笑了229F 02/06 17:35
→ : 這樣子便宜的白菜價 真爛大街~~~230F 02/06 17:35
→ : 再捲下去過兩天天網就生成了231F 02/06 17:36
→ : Arm也是啊 我憑什麼要付專利授權 就抄著做 最後還232F 02/06 17:36
→ : 是被搞的要專利授權費
→ : 是被搞的要專利授權費
→ : 你不提出AGI就是直接被卷死了234F 02/06 17:36
噓 : 來了235F 02/06 17:36
推 : 這超連結過去而已吧236F 02/06 17:36
→ : 這樣誰還要訂閱open ai237F 02/06 17:36
推 : 輝達 嘣嘣嘣~238F 02/06 17:36
→ : 好了 NV下去239F 02/06 17:36
推 : 就那個內捲大國會有人願意吧 習慣互卷了240F 02/06 17:37
推 : 提煉再提煉 濃縮再濃縮241F 02/06 17:37
→ : 消息一出 NV要噴了 之後都是擋蒸餾 只能靠自己訓練242F 02/06 17:37
→ : 了 噴噴
→ : 了 噴噴
推 : (請問有人)(用黃金鏟子)(鏟黃金嗎?)244F 02/06 17:37
→ : (用鐵鏟子)(就可以了!)
→ : (用鐵鏟子)(就可以了!)
推 : 算力需求不只訓練吧? 推論也是246F 02/06 17:37
→ : (也可以)(用手和河水)(淘金啊!嘻嘻。)247F 02/06 17:37
→ : 這是技術太快跑在法規前面 之後就是專利戰248F 02/06 17:38
→ : 本來只要AI學少走彎路,現在AI(算法)學會自己生捷徑249F 02/06 17:38
→ : ds吹得飛起然後卡爆 你繼續250F 02/06 17:38
→ : 等專利戰完之後就是授權費保護了251F 02/06 17:38
→ : 就股價來說很慘 但你換個角度 如果開源資料俯拾即是252F 02/06 17:38
→ : 真AI時代的來臨會加速 人類科技樹會點更快 新產業
→ : 也會誕生
→ : 真AI時代的來臨會加速 人類科技樹會點更快 新產業
→ : 也會誕生
推 : 泡泡要破了255F 02/06 17:38
→ : 提出一個方法證明可以較快 馬上破壞市場256F 02/06 17:38
推 : 1月的paper嚕257F 02/06 17:38
→ : 成本都給別人自己就不用成本了 天才258F 02/06 17:38
推 : 模型C站也是這樣吧?259F 02/06 17:38
推 : 又要崩了嗎260F 02/06 17:38
推 : 再卷下去就要變成白菜啦261F 02/06 17:39
→ : 那也可以推論oprn AI可能也不是AGI的解法了XDD262F 02/06 17:39
推 : 只在有明確答案的數學問題上有用263F 02/06 17:39
推 : 釣別人水桶裡的魚不用500萬美金 50塊就夠了264F 02/06 17:39
推 : 現在流行拿鐵鏟子去挖別人桶裡的金礦265F 02/06 17:39
推 : 鏟子丟啦!難怪公公被大賣266F 02/06 17:39
推 : 所以說讓中國做一個超過gpt-4的有沒有可能? 不可267F 02/06 17:39
→ : 能因為得等openai先出
→ : 能因為得等openai先出
推 : 之後變成5美元269F 02/06 17:39
推 : 美國自己的權威研究單位都在卷很難擋270F 02/06 17:39
推 : 我預測NV今天崩50趴 1個禮拜之內崩到2塊271F 02/06 17:39
→ : 50美XDDD笑死了XDDD272F 02/06 17:39
推 : 幹別人的研究成果然後說自己不用花前期伺服器建置273F 02/06 17:39
→ : 成本 站在巨人的肩膀上 說自己成本超低
→ : 成本 站在巨人的肩膀上 說自己成本超低
→ : 那就不用擔心 因為最先端的 老美一定都自己藏起來275F 02/06 17:39
→ : 用
→ : 用
→ : 這樣下去沒人會投入資源去訓練阿 很麻煩的277F 02/06 17:39
→ : 現在主要是大家都開源 你自己單獨公司再努力也比不278F 02/06 17:39
→ : 上開源
→ : 上開源
推 : NV昨天才彈起乃 又要躺下去280F 02/06 17:40
→ : 問題是open ai超越啥了QQ281F 02/06 17:40
→ : 我的視野跟巨人一樣高一樣遠282F 02/06 17:40
→ : 證明LLM可行性 但是成本太高283F 02/06 17:40
推 : 啊問題是這些軟硬體巨頭砸一堆錢就是幻想可以當人284F 02/06 17:40
→ : 上人
→ : 上人
→ : 開源沒屁用啦 開源只能優化算法 但無法解決算力不286F 02/06 17:41
→ : 足的問題
→ : 足的問題
→ : 美股又要崩崩了嗎www288F 02/06 17:41
推 : 聰明的就讓運算設備給白癡去買289F 02/06 17:41
→ : 問題是你巨人再長高阿 自己不長高怪別人追上來290F 02/06 17:41
推 : 盤前沒動啊,不怕不怕291F 02/06 17:41
→ : 現在開源方案直接打到幾乎同校力,還便宜到掉渣292F 02/06 17:41
→ : 結果現在看起來要偷模型完全擋不住293F 02/06 17:41
推 : Ai 要變成熟透製成294F 02/06 17:41
推 : XD295F 02/06 17:41
→ : 其實很合理吧 , 人類世界也是大家都站在巨人肩膀296F 02/06 17:41
推 : 喔297F 02/06 17:41
→ : 模型跟算力都被免費仔偷 慘喔298F 02/06 17:41
推 : 蒸餾^2??下次就是蒸餾^3299F 02/06 17:41
推 : 50美元是怎樣,跑訓練的電費嗎300F 02/06 17:42
推 : 沒有openAI前面花這麼多錢,你DS跟後面的競爭者哪301F 02/06 17:42
→ : 有辦法這樣子
→ : 有辦法這樣子
推 : 50美金是雲計算費用 一堆文盲嗎303F 02/06 17:42
推 : 盤前要動個屁 上禮拜史丹佛研究生30塊就重現了304F 02/06 17:42
→ : 現在就是你獨自創造 這麼貴 然後人家便宜直接收割305F 02/06 17:42
推 : prompt 很常用,但我覺得拿來訓練效果有限306F 02/06 17:42
推 : 以後可能變成0.5美了 無限蒸餾之術307F 02/06 17:42
→ : 就租幾組H100 1小時 謝謝你的模型欸嘿308F 02/06 17:42
→ : 最近open老大去世界各地拉替死鬼 幫QQ309F 02/06 17:42
→ : 你給中國顯卡 可能ai都天緣突破了XDD310F 02/06 17:42
→ : 美國放大量AI顯卡給中國 可能直接天元突破ㄌ
→ : 美國放大量AI顯卡給中國 可能直接天元突破ㄌ
→ : 現在不是煉金術了 是蒸餾術的年代312F 02/06 17:43
噓 : 捲到死!!!313F 02/06 17:44
→ : 人類也不會從頭到尾都自己研究 發明一遍 換成ai314F 02/06 17:44
推 : 幹你嗎的315F 02/06 17:44
推 : 咦316F 02/06 17:44
→ : 不這樣做才挺奇怪的 @n@a317F 02/06 17:44
→ : 中國複製貼上從1~100的卷法 就跟scaling law一樣318F 02/06 17:44
→ : 啊
→ : 啊
→ : 你前面投資都還沒找到回收方案 人家已經追上來了320F 02/06 17:45
→ : 每個人都comparable 每個人都低成本 大吹牛時代321F 02/06 17:45
推 : 你訓練我的訓練的他的訓練322F 02/06 17:45
→ : ai最後要變成無法回收成本的投資嗎?323F 02/06 17:45
推 : 後面會不會出現偶蒸餾你的蒸餾 越來越便宜324F 02/06 17:45
→ : 重點在於產出的東西 有沒有效率 準不準確 好不好用325F 02/06 17:45
推 : 這三洨 不是唬爛的話是要賣菜刀的去死嗎?326F 02/06 17:45
→ : 前期投資者真的哭死327F 02/06 17:46
推 : 來了來了ai大戰328F 02/06 17:46
推 : 笑死 這是在反諷DS吧329F 02/06 17:46
噓 : 唬爛過頭330F 02/06 17:46
推 : 笑死 50 連乞丐都做得出來331F 02/06 17:47
→ : 沒有那麼多h100 都可以當市場毀滅者332F 02/06 17:47
→ : 哇靠 這等於不用錢一樣333F 02/06 17:47
→ : 晶片跟AI股又慘了334F 02/06 17:47
→ : 什麼時候可以用一杯珍奶的價錢訓練出一個model335F 02/06 17:47
推 : 搞得 AI跟垃圾一樣 滿地都是336F 02/06 17:47
→ : 你以為鎖起來逼別人重複造輪就贏了 實際上還是會有337F 02/06 17:47
→ : 人偷出來卷你 你根本擋不住
→ : 人偷出來卷你 你根本擋不住
→ : 那給中國算力更強的顯卡 直接低成本卷死AI世界了吧339F 02/06 17:47
推 : 自問自答可以提升訓練效率的意思340F 02/06 17:48
推 : 好喔 然後?341F 02/06 17:48
噓 : 「雲計算」342F 02/06 17:48
推 : 那些自以為算力天下第一的 最後還不是要被人家收割343F 02/06 17:48
→ : 除非你能用國家安全為由 不准別人蒸餾模型@@a344F 02/06 17:48
→ : 被抓到就關起來@n@
→ : 被抓到就關起來@n@
推 : 開捲 中國鑽進去的行業注定爛掉346F 02/06 17:49
→ : 可是別的國家一定會想竟辦法偷,除非網路都不連@@a347F 02/06 17:49
→ : 你花一堆錢買算力 好不容易訓練出來 人家直接低成本348F 02/06 17:49
推 : 越來越符合openAI當初的設定 非營利組織349F 02/06 17:49
→ : 蒸餾 屌打你350F 02/06 17:49
→ : 抓到就關起來 但不給你抓(O351F 02/06 17:49
→ : 不愧是elon musk 真有遠見352F 02/06 17:50
噓 : 下一篇 50越南盾353F 02/06 17:50
→ : 按照目前這種進度 我看ai真的要變成公益性質啦354F 02/06 17:50
→ : 不是已經不用錢了嗎?XD355F 02/06 17:50
推 : 這種東西拿來發paper看起來會很猛,但商用一定會跟d356F 02/06 17:50
→ : eepseek一樣遇到一堆法律問題,搞不好類似方法最後
→ : 還會被google捧回去開發新模型
→ : eepseek一樣遇到一堆法律問題,搞不好類似方法最後
→ : 還會被google捧回去開發新模型
→ : 美吹殖人沒看到這次是美國自己幹的 割七巨頭這個大359F 02/06 17:51
→ : 韭菜 狠多囉www
→ : 韭菜 狠多囉www
→ : 這94所謂的AI精華液嗎 ??361F 02/06 17:51
推 : 哪有 伊隆馬砸了一堆錢在grok上362F 02/06 17:51
推 : 那川普還要搞什麼5000億Stargate嗎?363F 02/06 17:51
→ : 你算力很強? 有蒸餾省錢嗎?364F 02/06 17:51
→ : 我是指用戶端 不用錢啦365F 02/06 17:51
推 : 以後拼多多,幾毛就能訓練出AI還包郵366F 02/06 17:51
→ : 當初OPENAI就是elon musk成立的阿 目標開源非營利367F 02/06 17:51
推 : 壞了五十收368F 02/06 17:52
推 : 她就是goolge前副總裁兼首席科學家啊,根本一家人好369F 02/06 17:52
→ : 嗎
→ : 嗎
→ : 結果被現在CEO搞成close AI371F 02/06 17:52
推 : 我都請時薪200的坐在裡面372F 02/06 17:52
→ : 捲到你變成公益ai373F 02/06 17:52
推 : 我蒸餾你蒸餾的蒸餾374F 02/06 17:52
推 : 不過應用上chatGTP更好用375F 02/06 17:52
推 : (卷哥!)(卷姐!)376F 02/06 17:52
→ : 問題勢必要每個用戶端 都去蒸餾一個模型嗎?377F 02/06 17:52
推 : 蒸餾法是啥?378F 02/06 17:52
推 : 謝謝大家的錢錢 前人種樹 後人乘涼379F 02/06 17:52
推 : 川普發現自己的研究團隊也做出便宜AI更喜歡啊380F 02/06 17:52
→ : 前有DS開源高性能 後有人家花50鎂直接拿需要的模型381F 02/06 17:52
![[圖]](https://i.imgur.com/WRfIeYNh.jpeg)
→ : 自己玩 喔 50鎂搞不好也是用免費租用換到的 笑死惹w383F 02/06 17:52
→ : ww
→ : ww
→ : *有必要?385F 02/06 17:53
推 : 算力用租的就好了 訓練完我們就不要了 NV掰掰386F 02/06 17:53
→ : 人人有ai 那美國真的只能靠三戰當霸主了嗎QQ387F 02/06 17:53
→ : 到時候各國都有自己的ai @@a388F 02/06 17:53
推 : 算力需求低 邊緣運算產業鏈要起飛了吧389F 02/06 17:53
→ : 因為這種東西 正常來說不會允許被別國掌控390F 02/06 17:53
→ : 主要是現在ai沒有賺錢手段 成本無法回收 還沒回收成391F 02/06 17:54
→ : 本就開始卷低價
→ : 本就開始卷低價
→ : 現在就是炒手機PC換機潮阿393F 02/06 17:54
→ : 反正只要蒸餾在自己改一改就堪用了@n@a394F 02/06 17:54
→ : 話說這是幾天前的東西了395F 02/06 17:54
→ : NV回老本行改賣顯卡啊 大家都玩AI就這樣 安啦396F 02/06 17:54
推 : 花大錢堆顯卡預訓練大模型的公司表示:操397F 02/06 17:54
推 : 現在就在漲機器人跟工業電腦了398F 02/06 17:54
→ : 等於你花錢訓練ai真的是在做慈善399F 02/06 17:54
→ dostey …
→ : 賽鴿 你要自己蒸餾一個AI問她去哪喝茶比較安全便宜?401F 02/06 17:55
推 : 洪水療法 大家都來低價AI 讓NV重返榮耀402F 02/06 17:55
推 : 美國政府不會反對自己人在卷啦,資本主義就這樣403F 02/06 17:55
推 : 比手速了 XD404F 02/06 17:55
→ : 來看看這次要怎麼防堵啊 國安問題又要上場囉啊?www405F 02/06 17:55
→ : 你信?406F 02/06 17:55
→ : 硬體成本都不用算就對了
→ : 硬體成本都不用算就對了
推 : 我蒸餾你的蒸餾他的蒸餾全部蒸餾408F 02/06 17:56
推 : 因為是用租的 可能只租兩小時409F 02/06 17:56
推 : 真假= =?410F 02/06 17:56
→ : 這次美國自己人發明的還要國安糖漿?411F 02/06 17:56
→ : 要什麼硬體成本 他直接租幾小時就完事了412F 02/06 17:57
推 : 對~矽谷的人都是白癡413F 02/06 17:57
推 : 改天手機眼鏡手錶都可以跑,大換機潮要來了414F 02/06 17:57
推 : AMD利多?415F 02/06 17:57
推 : 免費版AI 公用版AI 專業版AI416F 02/06 17:57
→ : 應該有人開始抓想要的套在各種產品上了 抓穩囉417F 02/06 17:57
→ : 以後的AI手機跟PC如果能本地端單機訓練特化需求的AI418F 02/06 17:57
→ : 就真的屌 學歷也會貶值 變成認證制 因為大部分知識
→ : 你在家跟AI學就好了 學校變成是交朋友兼托兒所
→ : 就真的屌 學歷也會貶值 變成認證制 因為大部分知識
→ : 你在家跟AI學就好了 學校變成是交朋友兼托兒所
推 : 以後就是大我蒸餾你的蒸餾時代421F 02/06 17:58
→ : 三次蒸餾,愛爾蘭威士忌嗎422F 02/06 17:58
→ : 人類的知識發展快要被機器學完了423F 02/06 17:58
→ : 你各位 之前示範過一次了~ 現在應該知道了吧424F 02/06 17:58
推 : 蒸餾你的蒸餾425F 02/06 17:58
→ : 好想看矽谷+華爾街全線崩潰426F 02/06 17:58
→ : 看來真正的AGI來臨前會先被卷死或是嚴重拖延 梁文峰427F 02/06 17:59
→ : 說五年內會有AGI誕生太樂觀了
→ : 說五年內會有AGI誕生太樂觀了
推 : 以後直接發明電子腦輔助工具哪裡需要學習429F 02/06 17:59
推 : 為啥會全面崩潰?不就堆算力崩潰而已 公司這麼多又要430F 02/06 17:59
→ : 不是只有ai算力
→ : 不是只有ai算力
推 : 文雅一點的講法就是參考隔壁同學答案432F 02/06 18:00
推 : 丸了433F 02/06 18:00
推 : 就駭客任務那樣 知識直接下載嗎434F 02/06 18:00
推 : 好啊 你開放你的API 比deepseek便宜算你贏435F 02/06 18:00
→ : 會不會背後有一堆人在聊天XD436F 02/06 18:00
→ : agi看起來需要公益慈善才做的出來阿437F 02/06 18:00
→ : 粗暴點的說法就是釣你水桶的魚XD438F 02/06 18:00
→ : 真的扯 卷到股價不值錢439F 02/06 18:00
推 : 大便AI蒸餾會變宿便AI嗎?440F 02/06 18:00
→ : AGI 跟這種狹義的AI 是完全不同的世界441F 02/06 18:00
推 : AI股看來要爆跌再爆跌了442F 02/06 18:00
→ : 用租的 哈哈哈哈哈哈 中國在會卷也想不到有這招吧443F 02/06 18:01
推 : 完惹 NV崩444F 02/06 18:01
→ : 訓練出AGI不也是能蒸餾一下帶走嗎?445F 02/06 18:01
推 : 所以現實是資本主義美國人更愛捲446F 02/06 18:01
→ : XDD 沒用的 而且出人命誰要負責447F 02/06 18:02
推 : 放心了 一堆人看崩 今天該加碼了448F 02/06 18:02
推 : 先發酵一個月才會有反應449F 02/06 18:02
推 : s1看起來概念很簡單,就是你準備要射了,就wait,再450F 02/06 18:02
→ : 抽差幾下,再推理,再wait,再推理,弄幾次才準你射
→ : 。
→ : 抽差幾下,再推理,再wait,再推理,弄幾次才準你射
→ : 。
→ : 感覺人類知識應該在三年內會被ai學完 之後就是ai產453F 02/06 18:03
→ : 生知識給人類了
→ : 生知識給人類了
推 : AI該不會要血崩了吧455F 02/06 18:03
推 : 夜盤沒有崩 表示市場沒在怕456F 02/06 18:03
推 : gemini那麼爛 蒸餾他可以媲美openai?457F 02/06 18:03
→ : 你敢蒸餾我的蒸餾 波特?458F 02/06 18:03
→ : 我也覺得 gemini 不好用459F 02/06 18:03
推 : 太卷了吧460F 02/06 18:04
→ : 現在不準沒關係啊 反正會持續研究要怎麼蒸餾性價比461F 02/06 18:04
→ : 最高 嘻嘻 還是遠遠小於七巨頭的成本
→ : 最高 嘻嘻 還是遠遠小於七巨頭的成本
推 : s1都出來三天了拜託 崩屁啊崩463F 02/06 18:04
推 : nv崩464F 02/06 18:04
![[圖]](https://i.imgur.com/6HDSJmzh.jpeg)
推 : 傻鳥需要引進這個 多想一下再發廢文467F 02/06 18:05
推 : 單純市場還沒完全理解吧 今年這氛圍遲早發酵468F 02/06 18:05
推 : DS蒸餾技術是最好的 嘻嘻嘻嘻嘻469F 02/06 18:05
→ : 不用為NV 擔心,讓時間證明就好,很快就會回去了470F 02/06 18:06
→ : 盤子才當第一個 感謝openai的付出471F 02/06 18:06
→ : 李飛飛學界很有名,應該不是唬爛吧472F 02/06 18:07
噓 : NV崩潰473F 02/06 18:07
推 : 這樣誰要當第一個啊474F 02/06 18:07
→ : 現在市場還沒反應吧 當初DS也是過了幾個月才爆紅 那475F 02/06 18:08
→ : 時候也是少數人知道DS開創新的路徑
→ : 時候也是少數人知道DS開創新的路徑
→ : 成本下降會引來對算力需求的大爆發 抓穩了477F 02/06 18:08
→ : 其實就是openai進步的不夠快 @@a478F 02/06 18:08
推 : 算力過剩 讓closeAI去當SB就好479F 02/06 18:08
推 : 建立在前人的基礎上說成本多低都是假的,我高中就480F 02/06 18:09
→ : 學會一堆牛頓運動定律的應用了,牛頓還要搞到4X歲
→ : 才發表,這代表我比牛頓聰明,花的時間更少?
→ : 學會一堆牛頓運動定律的應用了,牛頓還要搞到4X歲
→ : 才發表,這代表我比牛頓聰明,花的時間更少?
推 : 你蒸餾我 我蒸餾你 以後誰想第一個砸大錢……483F 02/06 18:09
推 : openAI當初自己做死自己要怪誰484F 02/06 18:09
推 : 卷485F 02/06 18:09
→ : 知識發現成本高 學習成本低 本來就是這樣@n@a486F 02/06 18:10
→ : 科學本來就是踩在巨人肩膀上進步的487F 02/06 18:10
→ : 不然你要自己從頭再做實驗推導一次萬有引力嗎 @n@?488F 02/06 18:10
推 : 破盤價489F 02/06 18:10
→ : 拜託下來讓我上車490F 02/06 18:11
→ : 不準用牛頓發明的定律,用了我就要打你抓你@n@?491F 02/06 18:11
推 : 蒸餾大賽開始492F 02/06 18:11
推 : 重複造輪的事情就交給AI跟機器人 直到AGI實現493F 02/06 18:12
→ : 你就算要訂法律 ai不準蒸餾也能限制自己國家的@n@494F 02/06 18:12
→ : 別的國家誰理你@n@?
→ : 別的國家誰理你@n@?
推 : 蒸餾再蒸餾 精煉再精鍊496F 02/06 18:12
→ : 美國輸定了 看了真爽www497F 02/06 18:13
→ : 有夠捲XDDDDDD498F 02/06 18:13
推 : 壓縮再壓縮 提煉再提煉499F 02/06 18:13
推 : 李飛飛,這就不可能是吹牛的了500F 02/06 18:13
推 : 美國不會輸但是openAI肯定完蛋501F 02/06 18:14
推 : closeAI應該撐不久了 其他CSP廠沒差502F 02/06 18:14
推 : 美國輸定了?李飛飛是美國人欸...?503F 02/06 18:14
推 : 蒸餾模型正夯504F 02/06 18:14
推 : 越來越扯505F 02/06 18:14
→ : 這玩法應該是擋不住了 你只能限制自己國家的對手506F 02/06 18:14
→ : 以前讀李飛飛論文 就只是包裝的很好 但沒啥用507F 02/06 18:14
推 : SamAlt 會自己跳出來,我捲自己更大力給你看508F 02/06 18:15
→ : 如果真的好用為什麼不花個500鎂訓練?509F 02/06 18:15
→ : 下一波AI手機準備大爆炸510F 02/06 18:15
→ : 谷歌的AI系統也是李飛飛做的阿511F 02/06 18:15
→ : 大概UC Berkley一個月前就出花450鎂訓練的論文512F 02/06 18:15
推 : tsm要打成不良品了513F 02/06 18:15
→ : 比分數輸了?514F 02/06 18:16
推 : NV: 吼 你們不要這樣子啦515F 02/06 18:16
推 : 開卷516F 02/06 18:16
推 : 便宜治百病517F 02/06 18:17
→ : 作弊不就你抄我 我抄你最後答案都一樣518F 02/06 18:17
推 : 你也蒸餾 我也蒸餾 大家都是一樣的519F 02/06 18:17
噓 : 笑死 根本公開嘲諷DS 用租的就贏DS了520F 02/06 18:17
推 : 好可憐 OpenAI被整碗端走521F 02/06 18:17
推 : 笑死做研究與大規模完全不一樣522F 02/06 18:18
推 : 以後都玩精煉數安術就好 大精鍊時代 做基礎資料都是523F 02/06 18:18
→ : 白痴 大公司不要弄了
→ : 白痴 大公司不要弄了
→ : 還是得要有創新的東西吧525F 02/06 18:18
推 : GG高階晶片怎麼辦,要變雞蛋價格了526F 02/06 18:18
→ : 李飛飛是google副總裁跟首席科學家 用google成果527F 02/06 18:19
→ : 還好啦
→ : 還好啦
→ : 抱歉更正,查完成績。UC Berkley的模型比較弱529F 02/06 18:19
→ : 好像有點東西。
→ : 好像有點東西。
推 : 像極了t1姑媽 蛋雕531F 02/06 18:19
推 : 以後全人類都能用上便宜AI了532F 02/06 18:20
→ : 現在不用擔心ai會取代人類了533F 02/06 18:21
推 : 沒人想當第一個了。結束534F 02/06 18:21
推 : 白菜價要來了嗎535F 02/06 18:21
推 : ai整個白菜價了!!!!536F 02/06 18:22
推 : 白菜都沒那麼便宜537F 02/06 18:22
推 : 雞 雞精 滴雞精538F 02/06 18:22
→ : NV不用買了(?)539F 02/06 18:22
推 : 吹牛吹成這樣540F 02/06 18:22
→ : 急!!求現在在用200鎂的內心陰影面積541F 02/06 18:22
推 : 下一篇:只要3美元542F 02/06 18:22
推 : 以後去逛夜市會看到有人賣LLM嗎543F 02/06 18:22
→ : 去別人的水桶釣魚當然很容易544F 02/06 18:22
推 : 最早的智慧手機也不是蘋果發明,不是第一就是贏家545F 02/06 18:23
推 : 蒸餾到後面會不會沒東西546F 02/06 18:23
推 : 五次蒸餾 變成伏特加547F 02/06 18:23
→ : DS其實不是蒸餾,這個才是真蒸餾,DS那個降成本比548F 02/06 18:24
→ : 較有意義
→ : 較有意義
→ : 蒸餾只會蒸出個差不多的,並不會提升AI整體的能力550F 02/06 18:24
推 : 蒸餾蒸餾再蒸餾551F 02/06 18:25
→ : 這個其實有提升,用了這個wait機制後比被蒸餾的模552F 02/06 18:25
→ : 型準確
→ : 型準確
→ : 現在最恐怖的是一般大眾不需要高算力設備 就連大企554F 02/06 18:25
→ : 業和研究設施搞不好也不需要 讓七巨頭繼續當七冤頭
→ : ??
→ : 業和研究設施搞不好也不需要 讓七巨頭繼續當七冤頭
→ : ??
推 : 幹 再吹啊 下次變5元台幣557F 02/06 18:25
→ : 那可以用SLM的成本做出LLM的效果了嗎558F 02/06 18:25
→ : 再過幾天 就有零成本的559F 02/06 18:25
推 : 應該是DS加上這個做模型會非常便宜560F 02/06 18:25
→ : 直接用別人資料庫(O)561F 02/06 18:26
噓 : 給我時薪40美元,丟問題給我,我可以幫你問Chatgpt562F 02/06 18:27
→ : 任何
→ : 任何
推 : (要比卷,)(誰能贏對面?)(嘻嘻!)564F 02/06 18:28
推 : 笑了~六美元是只算電費喔XD565F 02/06 18:28
推 : 七巨頭買GPU要用來訓練還是推理都可以566F 02/06 18:29
→ : 看其他網站gemini 2.0 Flash math500 是90 GPQA是59567F 02/06 18:29
→ : 需求不會降低,其他家的顯卡免費送也對NV沒有競爭568F 02/06 18:29
推 : 下次一元訓練569F 02/06 18:29
→ : 力,就讓時間證明吧。570F 02/06 18:29
推 : 50塊就可玩?571F 02/06 18:30
→ : 她用Qwen當base model加上wait機制就贏gemini?572F 02/06 18:30
推 : 以後就是開發AI,AI還會先轉帳給你錢了573F 02/06 18:31
推 : 用ai寫ai574F 02/06 18:31
噓 : fine tuning 好嗎 論文附了自己沒看?575F 02/06 18:32
→ : 差不多是以前網際網路從貝爾實驗室到突然每個人家576F 02/06 18:33
→ : 裡一台14.4Kbps數據機的轉變
→ : 裡一台14.4Kbps數據機的轉變
推 : 吹牛大賽 開始578F 02/06 18:34
推 : 中國又贏了 (疑?)579F 02/06 18:35
![[圖]](https://i.imgur.com/YwVBIG0.jpeg)
推 : 大家請補貼捕魚人582F 02/06 18:37
→ : 蒸餾技術早就有了,只是Deepseek首先公開不要臉地583F 02/06 18:37
→ : 使用還當作自己的成就,相當符合中國人
→ : 使用還當作自己的成就,相當符合中國人
推 : 可以預期雲端伺服器租金會有不小提升585F 02/06 18:37
→ : DS是用算法實打實的降成本哦,不是蒸餾
→ : DS是用算法實打實的降成本哦,不是蒸餾
→ : 李飛飛是真的很神587F 02/06 18:38
→ : 任何人有50美元都能來碗大模型588F 02/06 18:39
→ : 不是蒸餾那你說說看他是用算法降哪裡的成本?589F 02/06 18:40
→ : 好可憐啊 還有人在造謠DS是蒸餾 你怎麼不把同樣的問590F 02/06 18:40
→ : 題的去問DS和gpt 啊 看看回答內容就知道是不是蒸餾
→ : 囉www
→ : 題的去問DS和gpt 啊 看看回答內容就知道是不是蒸餾
→ : 囉www
→ : 軟體股利多593F 02/06 18:41
推 : 太強了 你的國594F 02/06 18:41
→ : 蒸餾後加個自己的算法就能算是自創?595F 02/06 18:41
推 : 所以今晚跌多少??596F 02/06 18:42
→ : 就很多人問過了,連Deepseek自己都回答是了597F 02/06 18:42
推 : 阿貓阿狗都出來了598F 02/06 18:42
→ : 看來有人搞不懂蒸餾的意義呢www599F 02/06 18:43
推 : 其實這個並沒有比較厲害,但不管怎麼樣這波都是開源600F 02/06 18:43
→ : 的贏,除非閉源能搞出新花招跟新數據,要不然在現有
→ : 數據使用完的情況下,開源會一直有優勢,呵呵!
→ : 的贏,除非閉源能搞出新花招跟新數據,要不然在現有
→ : 數據使用完的情況下,開源會一直有優勢,呵呵!
推 : 接下來訓練出模型沒有倒賺還花錢的都不是個咖了603F 02/06 18:45
推 : DS確實不錯就是吹過頭604F 02/06 18:45
→ : 中國的東西都是這樣
→ : 中國的東西都是這樣
推 : ??真的假的606F 02/06 18:45
→ : 所以以前都在配合矽谷跟華爾街的炒股故事不公開嗎XD607F 02/06 18:45
噓 : 用別人的訓練資料,然後說很便宜…這是偷吧,如果608F 02/06 18:46
→ : 這合法,誰要當第一個花大錢訓練的冤大頭。
→ : 這合法,誰要當第一個花大錢訓練的冤大頭。
→ : 既然中國已經先捅破窗戶紙 美國這邊也不用裝了610F 02/06 18:46
![[圖]](https://i.imgur.com/WLjWspHh.jpeg)
推 : 居然還有人不知道DeepSeek說自己是CHATGPT613F 02/06 18:47
推 : 可怕,台股又要崩盤了嗎QQ614F 02/06 18:47
推 : 1000題目微調是要多少錢 合理 AI不值錢了615F 02/06 18:47
![[圖]](https://i.imgur.com/gTHNcvvh.jpeg)
推 : OpenAI也偷,有人是不懂哪來那麼多數據喔?你以為數617F 02/06 18:48
→ : 據都沒有版權嗎?搞大語言模型的很多都心照不宣,另
→ : 外數據集也有開源的,不懂的就以為什麼都偷,笑死!
→ : 據都沒有版權嗎?搞大語言模型的很多都心照不宣,另
→ : 外數據集也有開源的,不懂的就以為什麼都偷,笑死!
推 : 我蒸餾你的蒸餾620F 02/06 18:48
→ : 尤其幾乎全部AI算圖模型都是小偷,拿別人的版權圖片621F 02/06 18:50
→ : 照片算出來的,呵呵!
→ : 照片算出來的,呵呵!
推 : 多想幾秒就可以便宜這麼多=.=?623F 02/06 18:50
噓 : 這訓練了個寂寞624F 02/06 18:50
→ : 阿不就偷人家訓練完的數據而已625F 02/06 18:50
→ : 不要什麼東西都亂扯一通626F 02/06 18:50
推 : 哇喔要捲爆了吧627F 02/06 18:51
噓 : 史丹佛好不好628F 02/06 18:51
→ : 自己去看看那些算圖AI的產品,一眼望去到處是別人風629F 02/06 18:51
→ : 格的畫作跟照片,就知道那些訓練材料是怎麼來的了,
→ : 呵呵!
→ : 格的畫作跟照片,就知道那些訓練材料是怎麼來的了,
→ : 呵呵!
→ : gemini補習班 教了考試技巧 分配時間+檢查632F 02/06 18:52
推 : Ai越來越cheap惹633F 02/06 18:52
→ : AI的進展越來越快了 人類也就634F 02/06 18:52
推 : 爽,多來點,戳破美國的AI的泡沫635F 02/06 18:54
推 : 我蒸餾你的蒸餾636F 02/06 18:54
→ : 酸酸繼續說偷,結果OpenAI等閉源公司也在偷,偷開源637F 02/06 18:55
→ : 技術來用,假如你閉源公司不讓別人用卻要用別人的技
→ : 術,遲早會搞出GNU授權,到時候閉源就都別用呀!笑
→ : 死!
→ : 技術來用,假如你閉源公司不讓別人用卻要用別人的技
→ : 術,遲早會搞出GNU授權,到時候閉源就都別用呀!笑
→ : 死!
推 : 越來越便宜641F 02/06 18:56
推 : 提煉再提煉 濃縮再濃縮642F 02/06 18:56
→ : 成本根本亂算 訓練原始模型不用錢啊643F 02/06 18:56
→ : 然後莫忘DS吹說幾百萬 新加坡偷買77億644F 02/06 18:57
→ : 這跟智慧型手機的發展很像啊 接下來就看下一個蘋果645F 02/06 18:57
推 : 蒸餾永動機646F 02/06 18:57
推 : 16塊h100跑半小時 用租的647F 02/06 18:57
→ : 人家佛心開源用MIT授權讓你發展人類的AI技術,閉源648F 02/06 18:58
→ : 低調用就好,要鬧事搞到浮上檯面用GNU授權,直接代
→ : 低調用就好,要鬧事搞到浮上檯面用GNU授權,直接代
→ : 崩爛650F 02/06 18:58
→ : 碼污染把你變開源,人家Altman也不是笨蛋好嗎?呵呵651F 02/06 18:58
推 : OpenAI GG652F 02/06 18:58
→ : !653F 02/06 18:58
推 : 什麼妳說NV會跌到50654F 02/06 18:59
推 : 樓下支援釣魚統桶貓的圖655F 02/06 19:00
推 : 丸了,晚上美股又要蹦了656F 02/06 19:00
推 : 釣魚大賽,看前面是誰的水桶657F 02/06 19:01
![[圖]](https://i.imgur.com/n8JQWqjh.jpeg)
推 : 開始卷了,下一個不用五美元659F 02/06 19:01
推 : 今天NV要幾%660F 02/06 19:03
推 : 哇操 好猛661F 02/06 19:03
推 : 又有甜甜價可撿囉662F 02/06 19:04
推 : 趕快上線免費AI服務吧663F 02/06 19:04
推 : 好啦好啦通通泡沫化啦664F 02/06 19:05
推 : 筆電就可以,6塊的成本是?665F 02/06 19:05
推 : 要崩了嗎666F 02/06 19:08
推 : 這次誰再沒上NV車就是___667F 02/06 19:09
推 : 李飛飛真的神668F 02/06 19:10
![[圖]](https://i.imgur.com/ocBCXHKh.jpeg)
推 : 崩670F 02/06 19:11
推 : AI遊蕩彈藥671F 02/06 19:12
推 : 我提煉你的提煉672F 02/06 19:12
→ : 就像這位老哥說的,吸籌罷了。如果華爾街這次還沒673F 02/06 19:12
→ : 買爽就會再下去,反之就沒反應
→ : 買爽就會再下去,反之就沒反應
推 : 跳蚤上的跳蚤上的跳蚤675F 02/06 19:16
推 : 會不會到時候模型互相開始對話676F 02/06 19:16
推 : 站在巨人的肩膀677F 02/06 19:16
→ : 丸678F 02/06 19:16
噓 : 就是一個理智的回答而已 有甚麼好高潮679F 02/06 19:17
推 : 是在低能啥小 電費都超過50美680F 02/06 19:18
推 : 釣水桶裡的魚效率不錯喔681F 02/06 19:19
推 : OpenAi又中槍了682F 02/06 19:22
推 : 好 準備變槽灰搭683F 02/06 19:22
→ : 一個比一個唬爛 。遲早靠專利回收啊684F 02/06 19:22
→ : 下次是不是1美元就可以了685F 02/06 19:23
推 : NV又要漲了 AI需求大提升 每個人都在用AI686F 02/06 19:23
→ : 山寨大國大逆襲了687F 02/06 19:25
推 : 大家都在蹭熱度xdd 事實證明NV根本不需要賣那麼多就688F 02/06 19:26
→ : 夠用了
→ : 夠用了
推 : 多一點這種芭樂消息 懂的人自然會繼續爽爽低接690F 02/06 19:26
推 : 笑死 繼續吹691F 02/06 19:29
推 : AI大飛耀692F 02/06 19:29
→ : 下一篇5分錢693F 02/06 19:31
推 : (本來是)(高級料理,)(現在要變成)(平民小吃694F 02/06 19:31
→ : 了!)
→ : (某族群崩潰!)(嘻嘻。)
→ : 了!)
→ : (某族群崩潰!)(嘻嘻。)
推 : 笑死 就是盜別人的再說自己的 非常便宜欸697F 02/06 19:32
推 : 一堆不懂的在推文也可以推到600多則xd698F 02/06 19:32
→ : 50美元指的是雲端計算訓練費699F 02/06 19:33
→ : 這種東西管NVDA屁事 看不懂 是不是一堆連內文都不看
→ : 的
→ : 這種東西管NVDA屁事 看不懂 是不是一堆連內文都不看
→ : 的
推 : 就連線到gemini等答案啊702F 02/06 19:34
推 : 股板要變科技板了,整天PO AI的文章XD703F 02/06 19:36
推 : 幾大巨頭花大錢幫大家做前處理,中小型企業爽到了704F 02/06 19:37
推 : 有意義705F 02/06 19:37
推 : 誰當第一個誰是白痴,我蒸餾你的蒸餾706F 02/06 19:39
→ : 李飛飛不可能做只有等答案這種研究吧707F 02/06 19:39
→ : 只是站在巨人的肩膀上708F 02/06 19:40
推 : 慘,AI商轉沒多久就變白菜價709F 02/06 19:42
推 : 專利我猜就是AI會有個性,會從使用者對外的聊天方式710F 02/06 19:44
→ : ,找出使用者最喜歡的對話模式,簡單來說,就是網軍
→ : 跟詐騙在做的事
→ : ,找出使用者最喜歡的對話模式,簡單來說,就是網軍
→ : 跟詐騙在做的事
推 : 左腳踩右腳要飛了713F 02/06 19:44
推 : 大蒸餾時代來臨714F 02/06 19:44
→ : 飛飛715F 02/06 19:44
推 : 我會了!蒸餾再蒸餾+問AI確定正確嗎?716F 02/06 19:47
→ : 幹 超屌 反觀717F 02/06 19:47
推 : 李飛飛大概就龍母等級 養很多隻龍 懂?718F 02/06 19:53
→ : AI 早就轉商了,只是台灣沒在用,連對岸都用ㄧ堆A719F 02/06 19:55
→ : I
→ : I
推 : 中又贏721F 02/06 19:59
推 : 這個李飛飛不是普通人,應該是真的722F 02/06 20:00
→ : 結果跌下神壇的是OpenAI 而不是輝達723F 02/06 20:00
推 : 太扯惹724F 02/06 20:01
→ WD640G …
推 : 幹NV一直漲欸,還以為能跌到一百以下,結果就這?我726F 02/06 20:02
→ : 還沒上車啊==
→ : 還沒上車啊==
→ : 以後誰要當第一個開發的?都給人白嫖欸728F 02/06 20:04
推 : OKLO 先崩一波729F 02/06 20:04
推 : 青鳥:蒸餾法不就抄襲!730F 02/06 20:06
推 : DS不是蒸餾OpenAI的吧 畢竟OpenAI沒有開源啊 哪能731F 02/06 20:09
→ : 蒸餾?頂多可能謊報訓練成本
→ : 蒸餾?頂多可能謊報訓練成本
推 : 他們是不是對成本誤會了什麼?733F 02/06 20:10
推 : 方法:請他再想兩下734F 02/06 20:10
推 : OPENAI有開放阿735F 02/06 20:13
→ : 你是不是對於蒸餾有誤會 蒸餾就是一個問一個答學習
→ : 而已 又不用代碼
→ : 你是不是對於蒸餾有誤會 蒸餾就是一個問一個答學習
→ : 而已 又不用代碼
→ : 窮人思維 唯一支持200億台灣之光AI麵線外送APP738F 02/06 20:14
推 : 這故事不就告訴你,大家互相蒸餾的結果就是算力大量739F 02/06 20:16
→ : 缺乏
→ : 缺乏
→ : 有開源嗎?沒開源沒被檢視,看起來只是在吹而已741F 02/06 20:18
推 : Andrej Karpathy就是李飛飛的學生742F 02/06 20:26
→ : 特斯拉的前FSD首席工程師
→ : 特斯拉的前FSD首席工程師
噓 : 真的完蛋了 科技股崩爛744F 02/06 20:29
推 : 算力才是根本,繼續噴了啦745F 02/06 20:41
噓 : 還不是抄襲746F 02/06 20:41
→ : 老黃哭爛、747F 02/06 20:42
推 : 成本亂算一通,負責組電腦的人要不要算成本?根本只748F 02/06 20:45
→ : 是為了壓低而都不算吧,吹牛也要有點邏輯吧
→ : 是為了壓低而都不算吧,吹牛也要有點邏輯吧
推 : CS231n 就是李飛飛的課程 入門幾乎必看750F 02/06 20:46
推 : 明天電梯向751F 02/06 20:46
推 : 今天電梯向752F 02/06 20:47
→ : 李飛飛美國人啦==
→ : 李飛飛美國人啦==
→ : gemini不是很爛嗎754F 02/06 20:48
推 : 居然有人不知道李飛飛755F 02/06 20:53
推 : 提煉再提煉XD756F 02/06 20:57
→ : 大家都繞過去就好了757F 02/06 20:59
推 : 銅板價AI758F 02/06 21:20
推 : 我以前養的鸚鵡叫小飛飛759F 02/06 21:20
→ : ASIC炸裂760F 02/06 21:22
推 : 不是 這種前提是有一個強大的模型給你蒸餾啊 那個強761F 02/06 21:27
→ : 大模型是要成本的
→ : 大模型是要成本的
噓 : 沒聽過小李飛刀?763F 02/06 21:28
→ : 以後大咖都要關門自己玩了,沒模型可以幹了怎麼搞764F 02/06 21:45
→ : 最後會知道還不就那樣 好的就是好的 鳥的還是鳥765F 02/06 21:45
推 : 又是蒸餾法...看來open ai當了那個先鋒烈士...766F 02/06 21:51
→ : 除非open aiGPT5有很大的突破
→ : 除非open aiGPT5有很大的突破
推 : 果然是蒸蒸日上768F 02/06 21:54
推 : 李飛飛中國出生,所以也算中國贏769F 02/06 21:56
推 : 銅板價,很好!770F 02/06 21:57
→ : 有Nvidia GPU可以買,不會有人傻到買ASIC771F 02/06 21:58
→ : GPU訓練就好,幹麻花大錢請肥貓還不一定成功
→ : GPU訓練就好,幹麻花大錢請肥貓還不一定成功
推 : 濃縮再濃縮 提煉再提煉773F 02/06 22:02
推 : 美國:我們的中國人比你們的中國人強774F 02/06 22:15
推 : DS不是不用錢?775F 02/06 22:20
推 : 結論 老黃又贏 算力又贏776F 02/06 22:23
推 : 以後就不給民間私企蒸餾惹 只有政府軍方能用
推 : 以後就不給民間私企蒸餾惹 只有政府軍方能用
推 : 我蒸餾你的蒸餾778F 02/06 22:30
推 : 真有趣讚讚779F 02/06 22:30
推 : 還不就是搞蒸餾這套780F 02/06 22:54
→ : 都提煉別人的781F 02/06 23:10
推 : S1很頂 麻美 宇都宮 三上 河北782F 02/06 23:25
→ : openai就在賣蒸餾服務了783F 02/06 23:25
→ : 跟iphone一樣 電錶倒轉784F 02/06 23:33
推 : 老黃的股票又要跌了,哈哈(反串註明785F 02/06 23:33
推 : 只有中國人才能互捲 其他人撐不住阿786F 02/06 23:35
推 : 噴787F 02/06 23:47
推 : 笑鼠!Ai又要快被捲爛788F 02/07 00:01
推 : 好像真的,原本用人工輸入訓練,現在用AI輸入訓練,789F 02/07 00:26
→ : 真的不用錢
→ : 真的不用錢
推 : 就合成CoT數據而已791F 02/07 00:40
推 : AI奇點要來了792F 02/07 00:46
→ : 好厲害793F 02/07 01:05
→ : 說中國成本大降的是虎爛 結果美國的更豪洨 50美元794F 02/07 01:16
噓 : 說巨頭盤的 正因為這樣別人才是巨頭好嗎? 跟在別795F 02/07 03:34
→ : 人屁股後面的永遠都不會是巨頭
→ : 人屁股後面的永遠都不會是巨頭
推 : 蒸餾你的蒸餾797F 02/07 03:58
→ : 嘖嘖 時代在進化798F 02/07 04:16
→ : 想要用蒸餾就得要有巨頭先驅799F 02/07 04:27
推 : 我相信傑文斯悖論800F 02/07 06:44
推 : 這篇文一定會製造出一波韭菜亂砍,嘻嘻801F 02/07 07:36
推 : NVDA繼續跌802F 02/07 08:16
推 : 笑死 所以設備人力都不用錢?803F 02/07 08:24
推 : 好啊 大家都等開源來提煉就好了804F 02/07 08:36
--
※ 看板: Stock 文章推薦值: 0 目前人氣: 0 累積人氣: 1100
作者 LimYoHwan 的最新發文:
- 13F 8推 2噓
- 標題: 無 來源: X 網址: 內文: DOGE is seeking help from the public! Please DM this account with insights on f …80F 44推 1噓
- 標題: 無 來源: X 網址: 內文: BREAKING: Warren Buffett and Berkshire Hathaway have sold 100% of their $SPY a …165F 94推 12噓
- 標題: 字節跳動發布AI模型「OmniHuman-1」:讓黃仁勳變Rapper、泰勒絲唱日文歌…網讚超逼 真 來源: Blocktempo 網址: 內文: 在中國 AI 新創公司 DeepSeek …82F 48推 3噓
- 標題: 李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型 來源: Futu 網址: 內文: 李飛飛等斯坦福大學和華盛頓大學研究人員近日以不到50美元的雲計算費用訓練了一個名 叫 …804F 402推 23噓
點此顯示更多發文記錄
→
guest
回列表(←)
分享