作者 sxy67230 (charlesgg)標題 Re: [新聞] 敏感詞達35萬 DeepSeek使用率從50%跌至3%時間 Mon Jul 14 19:34:58 2025
※ 引述 《sunbysea》 之銘言:
: 敏感詞達35萬 DeepSeek使用率從50%跌至3%
: https://i.ntdtv.com/assets/uploads/2025/07/id104002656-GettyImages-2200111369-
: 868x488.jpg
: 2025年2月21日,上海人工智慧產業協會在上海舉辦的全球開發者大會上展示了Deepseek
: 的標誌。(Photo by Hector RETAMAL / AFP)
其實用戶下降要從好幾個層面來看啦!
以To C來說,想衝高流量其實DeepSeek大可以分成海內版跟海外版,海外版不設置使用限制
,海內版設置敏感詞做Guardrails。
當前很多Agentic的方法是確實有辦法依據各國法律來制定服務政策的,不過我想關鍵原因
可能還是DeepSeek手上握有的卡效能跟算力都存在瓶頸,尤其是美國從年初對高階顯卡的管
制是真的有掐住大部分中國AI公司短期的痛點。DeepSeek當前的內部研究可能是急缺顯卡的
狀態的,這種狀態要在提供To C用戶其實負荷是蠻高的。
我看媒體上說是缺乏數據我反而感覺是有點問題的,主因就是如果真的缺乏數據那V3、R1的
更新理論上也會有問題才是,但是開源版R1、V3確是有更新而且performance 是可以直追Op
enAI o3系列的,我自己體感拿一些新的benchmark測試也是跟o3不分上下,有些題目表現反
而反超o3。
我自己感覺R2沒有發佈除了研究本來就不是線性發展外,更大可能是算力缺乏。以過往
梁文峰的一些採訪片段,如果只是單純的數據或是模型大小提升可能不是他要的,R2感覺更
多會是架構或是訓練範式的改進,但純無模型的RL訓練其實是不太好做的而且算力需求可能
會不小,我更傾向讓子彈飛一會。
我感覺很多媒體把很多研究型公司強硬要對標服務型公司其實是不太好的,研究型公司其實
產品週期會比很多人想像的長投入更高,服務型公司就是單純建構在既有技術上為用戶服務
迭代的。關鍵還是DeepSeek對自己公司的定位,反而需要去關注創始人的看法跟營運目標了
。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.10.216.21 (臺灣)
※ 作者: sxy67230 2025-07-14 19:34:58
※ 文章代碼(AID): #1eTEjb2d (Tech_Job)
※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1752492901.A.0A7.html
※ 編輯: sxy67230 (101.10.216.21 臺灣), 07/14/2025 19:36:14
→ freeunixer: ds有點像專長是奇門遁甲、五鬼搬運述然後幫人辦事收費又便宜.
把一堆人引來了之後,讓一堆徒弟去接案你聘他的徒弟在你館裡等客人上門,
他收費很低,但你開個館場地人事費很高1F 60.250.90.238 台灣 07/14 19:43
推 ptta: ds審查是model內建的,你從 抱臉下載的也有審查,哪有分什麼海內海外6F 114.44.193.194 台灣 07/14 19:46
你說的部分是模型本身價值對齊的部分,但是DeepSeek Web服務是還有另外一套檢測的機制
避免模型被jailbreak。幾乎所有有做成服務的LLM都有做兩套檢測機制,像OpenAI其實背後
也有另一個模型偵測黃賭毒的回應直接蓋掉LLM的回答,這邊新聞說的35萬的敏感詞審查就
是外
部系統。
→ freeunixer: 結果你看來生意很好但月結發現虧很大.最後是他賺到名氣,但你的加盟店倒了8F 60.250.90.238 台灣 07/14 19:47
※ 編輯: sxy67230 (36.228.2.95 臺灣), 07/14/2025 20:11:36
※ 編輯: sxy67230 (36.228.2.95 臺灣), 07/14/2025 20:12:13
推 steven8411: 現在最新的已經是kimi k2了10F 114.33.193.163 台灣 07/14 22:28
噓 cityhunter04: 慢跟難用就是事實!沒人用的Ai要幹嘛?養金魚嘛…11F 114.24.67.188 台灣 07/15 02:00
噓 quartics: 雞同鴨講,都花了30%的精力再處理關鍵字,當然慢13F 114.24.208.216 台灣 07/15 03:11
跟算力關係比較大,OpenAI也有類似的系統做偵測屏蔽敏感內容生成但是人家在足夠算力下
還是有辦法維持服務。依照現代的Similarly DB 35萬個詞根本構不成問題,工程上都可以
做到的事情你卻相信沒有工程背景加上署名爆料的媒體?
附註一下,比起這些不知道哪裡來的新聞,我更相信專業機構的報導
https://semianalysis.com/2025/07/03/deepseek-debrief-128-days-later/
※ 編輯: sxy67230 (36.228.2.95 臺灣), 07/15/2025 06:50:16
※ 編輯: sxy67230 (101.10.216.21 臺灣), 07/15/2025 07:32:49
※ 編輯: sxy67230 (101.10.216.21 臺灣), 07/15/2025 07:45:03
--