看板 Stock
作者 jeff0025 (無法顯示人物名稱)
標題 [新聞] DeepSeek 公布最新V3模型 意圖超越 Open
時間 Tue Mar 25 16:18:20 2025



ETtoday新聞雲 2025年03月25日 16:10

DeepSeek 公布最新V3模型 意圖超越 OpenAI

DeepSeek 昨日(24)針對其「DeepSeek V3-0324」模型悄悄發布了更新,雖非外界預期

的R2 模型,但仍然有不少亮點。



V3模型無預警地在本週的 Hugging Face 上發布,此次更新聲稱能夠「有效且準確地解決

現實世界中的挑戰」。今年一月,DeepSeek 一度超越 ChatGPT,成為蘋果美國應用程式

商店中最受歡迎的免費軟體。V3 模型是一款強大的混合專家(MoE)語言模型,擁有

6710 億個總參數,其中處理每個 token(即每個單詞或符號)時,模型會動態選擇並啟

動370億個參數來進行計算,這種方法使得模型能夠在保持高效運行的同時,利用大量參

數來提高預測的準確性和性能。在預訓練之後,V3 進行了知識蒸餾,從 DeepSeek-R1 模

型中提取知識,這一過程進一步提升了模型的性能和應用能力。





本次更新展示了 DeepSeek 在技術創新方面的持續努力,並預示著未來 AI 技術將更加高

效。隨著競爭的加劇,DeepSeek 的進步無疑將對全球 AI 產業產生深遠影響,更突顯了

這家中國 AI 新創公司保持領先競爭對手的意圖。




https://www.ettoday.net/news/20250325/2931329.htm
DeepSeek 公布最新V3模型 意圖超越 OpenAI | ETtodayAI科技新聞 | ETtoday新聞雲
[圖]
DeepSeek昨日(24)針對其「DeepSeek V3-0324」模型悄悄發布了更新,雖非外界預期的R2 模型,但仍然有不少亮點,(OpenAI,DeepSeek,V3) ...

 



穩了?

昨天DeepSeek更新V3模型 雖然非預期的R2模型

V3擁有6710億個參數處理單詞或符號  模型會動態啟動370億個參數計算

V3使用知識蒸餾從DeepSeek R1提取知識 提升模型的性能和應用能力

--
https://i.imgur.com/hW5h5gU.gif   https://i.imgur.com/kJV8Xpi.gif
https://i.imgur.com/mus9aa2.jpeg   https://i.imgur.com/xsoSdOK.jpeg
https://i.imgur.com/Rq7dbDm.jpg    https://i.imgur.com/3JFrFUW.jpg
https://i.imgur.com/fpRblKK.jpeg   https://i.imgur.com/xxuciis.jpeg
https://i.imgur.com/sYpst6n.gif     https://i.imgur.com/DEKfHhV.jpeg
https://i.imgur.com/90i6C8z.jpg

--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.218.53.138 (臺灣)
※ 作者: jeff0025 2025-03-25 16:18:20
※ 文章代碼(AID): #1ducRFmF (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1742890703.A.C0F.html
Gavatzky 
Gavatzky: 科技上能跟美國抗衡的看起來只剩中國了1F 03/25 16:21
kuojames2580: 中國或許發明打不贏美國 但一定能捲贏美國2F 03/25 16:22
lepidoptera: 老黃:買越多 越便宜..3F 03/25 16:22
QooSnow: (一級棒!)4F 03/25 16:22
h0103661: 反了吧,是美國能跟中國抗衡5F 03/25 16:22
hsu0612: 開捲了 好爽6F 03/25 16:23
Lenney33: NV快沒呼吸了...99老黃7F 03/25 16:23
Jaline5566: 中國AI就是吹8F 03/25 16:23
hsu0612: 還可以更便宜9F 03/25 16:23
gk1329: 不如預期 崩
中國多印點鈔投資半導體鴨 坐等顯卡白菜價10F 03/25 16:24
b9513227: 新加坡又偷買了嗎12F 03/25 16:26
cityhunter04: 越公布越虛弱…還要吹多久呢?13F 03/25 16:27
OhtaniHR: 不然美國幹嘛頃全力封鎖 不給台積電代工也不讓他們買先進的輝達 只要封鎖繼續中國基本上都很難追上
除非他們真能自己練出光刻機還追上台積電 但就算能也是十年以上的事情了14F 03/25 16:27
stanleyplus: 中又贏麻18F 03/25 16:27
[圖]
piece1: 讚讚!卷起來...免費仔蹭就好..等便宜的顯卡20F 03/25 16:28
tsaiweili: 好棒!消費者的福音!21F 03/25 16:28
c928: 蒸餾再蒸餾,以後就看誰蒸餾比較濃22F 03/25 16:28
tsaiweili: 難不成要花大錢去買沒啥用的XX?23F 03/25 16:29
tony1768: 越吹90卡越漲24F 03/25 16:29
poeoe: 真的是追著Open AI打欸 這麼狠嗎25F 03/25 16:30
drpepperfish: 心得除了「穩了」之外都是節錄文章內容,
覺得你進桶比較穩26F 03/25 16:31
gbman: 中文世界以後就DS主主導!英美Open AI CC28F 03/25 16:31
kotorichan: EUV有機會吧 如果是由華為主導負責
便宜治百病 拒絕使用壟斷付費的AI29F 03/25 16:32
wwwcom71: 有空生成這麼多圖不如好好研究心得怎麼寫31F 03/25 16:35
IBIZA: DeepSeek現在就是用不同模型之間在互相調教
他那個不是單純蒸餾而已32F 03/25 16:36
permanent27: 又回答不出4634F 03/25 16:37
hamasaki7788: 隨便了啦35F 03/25 16:37
sdbb: 若能弄到GB300,豈不飛天36F 03/25 16:38
fatb: 便宜真的治百病 各家公司都開始自己偷偷架DS玩37F 03/25 16:38
joe0934: 中國只要靠便宜就贏了38F 03/25 16:38
newgo1776: TSMC:還不是要用我的晶片?39F 03/25 16:39
amazingwow: 過氣了啦 nv需求依然猛40F 03/25 16:39
newgo1776: Nvidia:還不是要用我的晶片?41F 03/25 16:40
zombiepigman: 煩死了
什麼都要卷42F 03/25 16:40
appledick: TSMC 還不是都要靠我
偷偷架???有三小好偷偷架的 北七喔44F 03/25 16:41
PoLyGyNy: 費半又被嚇崩了46F 03/25 16:42
appledick: 上層他媽的只要便宜又好用 管你是用三小
小娜瞬殺就這個喔?47F 03/25 16:42
suzu1: 台灣又站錯邊,台股應該沒戲了49F 03/25 16:43
Lowpapa: 反觀台灣50F 03/25 16:45
opoping123: 費半gg51F 03/25 16:47
zxcv12300: 用過很難用52F 03/25 16:48
Swave: 孫正義是不是又要虧死了53F 03/25 16:48
reall860523: 又是死媽DS利空54F 03/25 16:48
junior020486: 好了啦,你偷買多少Blackwell系列的伺服器
新加坡偷賣多少啦
不bang新加坡,中國一直偷買一直爽55F 03/25 16:49
ola1a1217: 樂觀其成58F 03/25 16:52
junior020486: Ban啦幹59F 03/25 16:52
realmd: DS問世後NV就沒站上之前的價格  晶片溢價賣不動了60F 03/25 16:52
jvor0719: 淫麻了 好爽喔61F 03/25 16:52
junior020486: 笑死,沒站上?前一陣子回到140叫做DS問世以後沒站上,你活在平行世界噢XD62F 03/25 16:53
jumilin927: 崩崩崩64F 03/25 16:53
junior020486: 中期回檔一個多月就一堆散戶在那邊:啊~算力過剩65F 03/25 16:54
EZTW0000: 阿不是用不到這麼多硬體怎4090已經9萬66F 03/25 16:57
LMgogo: 這家用gb200吧 目前gb200這拉基沒人要67F 03/25 17:00
ededws1: 不就V3的小版本,等出V4或R2再說68F 03/25 17:00
pornpig32: 蒸餾捲起來69F 03/25 17:07
leo1217000: 過氣了吧70F 03/25 17:09
ts0045851127: 中國ai不敢信71F 03/25 17:09
lucakooptt: 又想圈錢72F 03/25 17:13
rbelldandy: 美國總會有自實其果的時候,現在只能搶錢73F 03/25 17:14
GooglePixel: 軟體帶動需求 硬體不會少74F 03/25 17:14
WTF55665566: 拉進垃圾車75F 03/25 17:15
raxxar82: 大家來拼降低AI成本了76F 03/25 17:15
kenbo: 鬼故事連發77F 03/25 17:28
CYL009: 美吹殖人出來透氣我就放心了 打臉準備ww78F 03/25 17:36
Jeff1989: 沒有大場面QQ79F 03/25 17:38
uller: 開源就是爽 等等回家載80F 03/25 17:39
ken123321987: 各位偉大的中國人 打倒美帝就在眼前 革命尚未成功同志仍須努力 中國爸爸不會忘記彎彎的81F 03/25 17:42
Everybody99: 過氣了吧 之前還出包83F 03/25 17:42
bigpan: 人礦才是中國最強的地方84F 03/25 17:52
alau: 蒸餾完畢85F 03/25 17:54
hydra7: 徹底的蒸餾86F 03/25 17:54
kobebrian: 啊美國就沒用讓人一直偷啊87F 03/25 17:54
odyssey: 股版邊酸邊用DS?88F 03/25 18:07
jei01: 把一顆大腦學習的精華去升級另一顆智商更高的大腦要就怪open AI要做close ,遇到開源的DS只能打價格戰了89F 03/25 18:08
hero613: Grok比較好用,尤其是一些道德底線的問題。92F 03/25 18:10
Lhmstu: 穩,OpenAI最近出那個貴死人的東西真的沒用93F 03/25 18:12
kausan: 蛤 gpt不是早看不到車尾燈了94F 03/25 18:19
jei01: Gpt是訓練成本太高,目前稍勝DS一些
但DS出世讓Gpt成本要回收很難,只能繼續燒錢95F 03/25 18:26
tw11509: 中國本來就是卷死人的地方,但開源還真沒什麼好嫌97F 03/25 18:35
syoritoo: 已反應 下去吧99F 03/25 18:37
jboys75: 以後科技公司徵人都找待過酒廠的100F 03/25 18:38
s213092921: DS V3新模型效能相當Claude 3.7,重點是免費開源隨便用
恭喜Google可以下去了
https://reurl.cc/2KrVga101F 03/25 19:00

 
visadanny: I dot car 用過其他模型 再回頭用deepseek 就會發現ds慢死了 優點只有便宜而已105F 03/25 19:15
tkc7: 卷死你107F 03/25 19:22
k1k1832002: 說真的GPT是真的難用,不說DEEPSEEK,用Claude3.7都覺得效用比他強(單論資料整理)108F 03/25 19:26
stocktonty: 難怪這幾天又拉資服110F 03/25 20:03
ruei1999: 感恩DS,不然Gemini,openAi,grok也不可能那麼快把一堆花錢貨給免錢玩lol111F 03/25 20:10
jei01: 你想用快的DS,那你可以自己建計算中心魔改DS
都開源給你了,你厲害就不必用他的算力113F 03/25 20:15
k1k1832002: 不買個DGX SPARK嗎 (x115F 03/25 20:19
fmp1234: V3火箭116F 03/25 20:39
CaTkinGG: 因為文字的關係 台灣以後好用的AI服務應該要靠中國持續發展117F 03/25 21:05
TaiwanUp: 不要仰望惡鄰居119F 03/25 21:24
c00jsw00: 剛剛使用真的編程能力強大120F 03/25 22:44
smart1989: 意圖都出來了121F 03/25 23:11
wahaha711233: 26捲起來,消費者舒服,米國佬吃屎122F 03/26 10:01
slothman: 根本超廢 卡起來123F 03/26 10:44
mdkn35: Zzz124F 03/26 12:20

--
作者 jeff0025 的最新發文:
點此顯示更多發文記錄
(jeff0025.): [新聞] DeepSeek 公布最新V3模型 意圖超越 OpenAI - Stock板