※ 本文轉寄自 ptt.cc 更新時間: 2025-01-28 08:29:16
看板 Stock
作者 標題 Re: [新聞] DeepSeek傳偷用5萬顆輝達H100晶片
時間 Mon Jan 27 19:31:04 2025
如題
就是純來黑的
看了一下被採訪的人 美國亞裔不意外香蕉人
美國這些搞生成式ai的就是被看破手腳
尤其是那個奧特曼 就是來純搞錢的
直接看deepseek內部人員 截了三點
在去年五月的deepseekv2推出時
在知乎的回答
——————-
羅福莉
DeepSeek
- 親自答 此回答由問題相關方親自撰寫
今天忙飛,深夜,簡單寫幾點:
1. 單論 DeepSeek-V2 模型*的中文水平(來自 20 多個微信群用戶反饋),是真實處在
國內外閉源模型的第一梯隊(GPT4、文心 4.0*等),因為沒做 RAG(檢索增強*)等功能
,所以實際在官網(@deepseek.com)的體感可能略微沒那麼驚艷,但這不妨礙 API 效果
哦!外加 1 元 / 百萬輸入 Tokens 的價格,只有 GPT4 價格的 1/100,性價比之王!
國內外閉源模型的第一梯隊(GPT4、文心 4.0*等),因為沒做 RAG(檢索增強*)等功能
,所以實際在官網(@deepseek.com)的體感可能略微沒那麼驚艷,但這不妨礙 API 效果
哦!外加 1 元 / 百萬輸入 Tokens 的價格,只有 GPT4 價格的 1/100,性價比之王!
2. 怎麼兼顧模型效果和成本的?基本純靠:模型結構創新(MLA+DeepSeekMoE)+ 超強In
fra。MLA妙就妙在,它既是 training efficient MQA,也是 inference efficient MHA
。從今天起,放棄MHA/GQA,全面擁抱MLA吧。同時,不嚴謹來說,DeepSeekMoE也算是開
啟了“共享expert+細粒度expert分割”的sparse框架風 -- 完全不同於Mixtral MoE的做
法。簡而言之:創新力就是第一生產力!
啟了“共享expert+細粒度expert分割”的sparse框架風 -- 完全不同於Mixtral MoE的做
法。簡而言之:創新力就是第一生產力!
4. 未來還會持續給大家帶來更驚豔的開源模型(希望有機會可以「明目張膽」地說超過
了GPT4-Turbo),所以大家不用擔心模型斷更,也不用擔心API漲價(目前就是大規模服
務的價格,不虧本,利潤率超50%)。
了GPT4-Turbo),所以大家不用擔心模型斷更,也不用擔心API漲價(目前就是大規模服
務的價格,不虧本,利潤率超50%)。
。
——————-
去年五月就說了 自己純靠模型創新
就你那幫美國人山姆奧特曼只想搞錢
之前還想騙台積電蓋七兆鎂工廠
Deepseek這樣都沒虧本了
https://i.imgur.com/njL6sdD.jpeg
![[圖]](https://imgur.disp.cc/43/njL6sdD.jpeg)
難怪美國這幫搞生成ai的人
真的慌了 封鎖中國硬體
逼迫中國在軟體上搞創新 要來搶飯碗了
生於憂患 死於安樂
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.10.45.26 (臺灣)
※ 作者: ggian123 2025-01-27 19:31:04
※ 文章代碼(AID): #1dbsvwDJ (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1737977466.A.353.html
推 : 推整理,講得很清楚1F 01/27 19:32
※ 編輯: ggian123 (101.10.45.26 臺灣), 01/27/2025 19:34:08推 : 謝謝美國爸爸揠苗助長2F 01/27 19:34
推 : 這什麼ID3F 01/27 19:34
→ : 別說那麼多,我要看實測4F 01/27 19:34
https://i.imgur.com/U9JDfuA.jpeg![[圖]](https://imgur.disp.cc/43/U9JDfuA.jpeg)
推 : 仇中的會看不進去5F 01/27 19:34
※ 編輯: ggian123 (101.10.45.26 臺灣), 01/27/2025 19:35:04推 : 這樣投資人被騙嗎XD6F 01/27 19:34
推 : 美國爽死吧,中國去卷軟體,開源處理美國照抄7F 01/27 19:35
推 : 那個男人可以來穩定軍心一下嗎 a十個0消失好久了8F 01/27 19:35
→ : 我不仇中,我只是要看實測對比9F 01/27 19:35
→ : 七傷拳 把算力弄成白菜價 只是讓美國無法商業化而已10F 01/27 19:36
噓 : 支那自吹的文章就不用貼過來了11F 01/27 19:36
→ : deepseek 在手機就可以下載來玩了啊12F 01/27 19:36
→ : 離 GPT 還遠的勒..13F 01/27 19:36
→ : 蠢投資人就是會信你這套才賠死14F 01/27 19:36
推 : 羅福莉本人在知乎的回答15F 01/27 19:39
推 : 老謝救命啊16F 01/27 19:39
噓 : 文如其帳17F 01/27 19:40
推 : 10億個腦袋,只要出個ㄧ萬個AI天才,建構的模型演18F 01/27 19:40
→ : 算法邏輯上絕對比老美強,這google前ceo就有預言了
→ : 。
→ : 算法邏輯上絕對比老美強,這google前ceo就有預言了
→ : 。
推 : 葬送的福利連21F 01/27 19:40
推 : 中國人說純靠模型創新你就信,蠻搞笑的22F 01/27 19:40
→ : 羅福利是誰?很屌嗎23F 01/27 19:41
→ : 路人帳號講的你也信喔
→ : 路人帳號講的你也信喔
推 : 那怎麼印度還沒飛天 人比中國還多25F 01/27 19:43
推 : 過去12hr出來的技術文章 美國人發台灣人發 都說技26F 01/27 19:44
→ : 術確實很有料 只剩ptt部分鄉民還在民智未開 好好笑
→ : 術確實很有料 只剩ptt部分鄉民還在民智未開 好好笑
推 : 應讓每個人都用得起AI28F 01/27 19:45
→ : 讓子彈飛一下29F 01/27 19:45
→ : 看完資料 感覺沒料 硬要吹...30F 01/27 19:46
推 : 真的超強 太猛了31F 01/27 19:46
推 : 美股台股提前熊市今年是陸港股起漲點上看一萬32F 01/27 19:46
→ : 壓低AI價格 就當贏了 根本沒考慮能不能用33F 01/27 19:47
推 : 不要在嚇剛買老美市值型ETF的韭菜了!!讓人過年好嗎34F 01/27 19:47
推 : 的確不能用。但是已經能夠讓股價跌10%了35F 01/27 19:48
推 : 印度現在科研進步的很快喔,Nature Index 目前排世36F 01/27 19:49
→ : 界第九,碾壓台灣,這兩年提升的幅度很明顯
→ : 界第九,碾壓台灣,這兩年提升的幅度很明顯
![[圖]](https://imgur.disp.cc/43/EeIfhC4.png)
→ : 或許在跌管制破口要被封?39F 01/27 19:51
推 : 中國在廿年前也是一片科研沙漠,和台灣差不多甚至40F 01/27 19:52
→ : 更糟,
→ : ;中國科研大約是在七八年前開始快速起飛,現在頂尖
→ : 科學和工程期刊很明顯就是美中爭霸的局面
→ : 更糟,
→ : ;中國科研大約是在七八年前開始快速起飛,現在頂尖
→ : 科學和工程期刊很明顯就是美中爭霸的局面
推 : 葬送的福利羅44F 01/27 19:52
推 : 印度的人口是跟中國比 怎麼還輸45F 01/27 19:53
噓 : 一堆這幾年沒賺到錢的中吹都浮上來透氣惹46F 01/27 19:53
推 : 反觀台灣還在點麵線 可憐47F 01/27 19:53
噓 : 台灣你看跟老黃合照的那批人全都老人你還期待什麼?48F 01/27 19:54
推 : 人口多、生活環境改善、國家願意砸大錢發展科技,49F 01/27 19:55
→ : 科學和工程水準本來就會提升,差在成長曲線而已。
→ : 中國人絕對不笨,印度人可能更聰明(但或許比較懶散
→ : ?)
→ : 科學和工程水準本來就會提升,差在成長曲線而已。
→ : 中國人絕對不笨,印度人可能更聰明(但或許比較懶散
→ : ?)
推 : ptt本來就是聊天打屁用的 2300萬人的論壇是要多有53F 01/27 19:56
→ : 水準
→ : ai的東西你一定要看美國論壇
→ : 台灣零ai人才 這是一個全新的領域
→ : 水準
→ : ai的東西你一定要看美國論壇
→ : 台灣零ai人才 這是一個全新的領域
推 : 因為印度科研開始起飛的時間點比中國晚了快十年,57F 01/27 19:56
→ : 而且兩國政府的有錢程度還是差蠻多的...
→ : 而且兩國政府的有錢程度還是差蠻多的...
推 : 沒ai也沒差,沒ptt,dcard,google就慘了59F 01/27 19:57
→ : 看ptt投資ai 跟看哲哲投資ai 一樣 你會輸光 還輸更60F 01/27 19:57
→ : 快
→ : ai目前就中美兩強而已
→ : 快
→ : ai目前就中美兩強而已
→ : 反正沒弄死中國ai,美國應該很幹63F 01/27 19:58
推 : 這兩年在 ACM STOC, JACM 這種 CS 投稿難度最高的64F 01/27 19:59
→ : 頂會、頂刊都可以看到來自印度國內大學的論文了,印
→ : 度進步的速度也蠻驚人的
→ : 頂會、頂刊都可以看到來自印度國內大學的論文了,印
→ : 度進步的速度也蠻驚人的
推 : 台灣AI人才很多好嗎67F 01/27 19:59
→ : 印度電力設備應該很差,也玩不了吧68F 01/27 19:59
→ : 印度可能要先改善空汙不然誰敢去69F 01/27 20:00
→ : 這是來釣魚的嗎XDD70F 01/27 20:00
推 : 雲端巨頭業者這幾個月會把deepseek的開源碼 能抄的71F 01/27 20:02
→ : 抄光
→ : 這代表 這些雲端業者目前「欲訓練的資料量 ,其所
→ : 需的算力,在過去兩年已經預先超標購買50倍」
→ : 抄光
→ : 這代表 這些雲端業者目前「欲訓練的資料量 ,其所
→ : 需的算力,在過去兩年已經預先超標購買50倍」
推 : ai不就是模型多應用少嗎75F 01/27 20:02
→ : 未來他們的財報很重要 要開始注意會不會砍資本支出76F 01/27 20:04
推 : 這樣算幫輝達打廣告嗎? 噴爆?77F 01/27 20:05
→ : AI應用終究才是有資格成為市值第一的公司 而不是賣78F 01/27 20:05
→ : 鏟子的
→ : 特斯拉終極要成為 市值第一大企業
→ : 並且 市值大於蘋果+輝達
→ : 鏟子的
→ : 特斯拉終極要成為 市值第一大企業
→ : 並且 市值大於蘋果+輝達
推 : 台灣「頂尖」的 AI 人才很少 -- 數字會說話,去翻82F 01/27 20:14
→ : 翻 AI 頂會 NeurIPS, ICML, IJCAI,... 的 Proceedin
→ : gs,來自台灣的論文一直很少,早就是美中兩強爭霸
→ : 的局面
→ : 翻 AI 頂會 NeurIPS, ICML, IJCAI,... 的 Proceedin
→ : gs,來自台灣的論文一直很少,早就是美中兩強爭霸
→ : 的局面
推 : 科技戰啊 看美國那邊有沒有突然有爆出什麼好料的86F 01/27 20:14
推 : 台灣頂尖都去美國 不然就在半導體業吧87F 01/27 20:16
推 : 印度似乎對 AI 比較沒那麼熱衷,他們表現比較亮眼88F 01/27 20:20
→ : 的是在理論電腦科學等比較抽象思考的 CS 子領域
→ : 的是在理論電腦科學等比較抽象思考的 CS 子領域
推 : 台灣人不意外90F 01/27 20:21
→ : 嗯,應該說台灣頂尖的 AI 人才幾乎都去美國了,這91F 01/27 20:21
→ : 樣的講法比較公平
→ : 樣的講法比較公平
→ : 台灣人就爛,早點被統一統實在,現在那些跑美國的93F 01/27 20:25
→ : 應該後悔沒去中國了
→ : 應該後悔沒去中國了
推 : 我的女同學幾乎都在美國 嫁也在美國 生命微生物系95F 01/27 20:26
推 : 加油,讓我們看看不靠硬體能弄到什麼地步96F 01/27 20:28
→ : 反觀台灣拿一堆補助卻做出搞笑的東西97F 01/27 20:29
→ : 統屁啦98F 01/27 20:29
![[圖]](https://i.imgur.com/LpAZBuf.jpeg)
→ : 葬送的芙莉蓮100F 01/27 20:40
噓 : 打繁體字的翻牆仔101F 01/27 20:41
推 : 開源就是給你抄啊 你越抄 就是被控制越深102F 01/27 20:43
噓 : 呵呵 羅福莉也不認識我勸你還是別投資了103F 01/27 20:52
→ : 去玩刮刮樂算了 呵呵
→ : 去玩刮刮樂算了 呵呵
推 : 台灣人短視近利 未來直接被吃掉105F 01/27 21:25
推 : 成本降低就是能讓更多人進來AI這領域106F 01/27 21:44
→ lpsa …
推 : 感謝分享108F 01/27 22:18
推 : 羅福利 95后後,年薪破億。109F 01/27 22:43
推 : 所以那些吹台積電的現在被打臉很難受阿...之前吹的110F 01/27 23:22
→ : 硬體...
→ : 硬體...
噓 : 中國最強了...112F 01/28 01:57
--
※ 看板: Stock 文章推薦值: 0 目前人氣: 0 累積人氣: 327
→
guest
回列表(←)
分享