看板 Stock作者 jeff0025 (無法顯示人物名稱)標題 [新聞] DeepSeek 公布最新V3模型 意圖超越 Open時間 Tue Mar 25 16:18:20 2025
ETtoday新聞雲 2025年03月25日 16:10
DeepSeek 公布最新V3模型 意圖超越 OpenAI
DeepSeek 昨日(24)針對其「DeepSeek V3-0324」模型悄悄發布了更新,雖非外界預期
的R2 模型,但仍然有不少亮點。
V3模型無預警地在本週的 Hugging Face 上發布,此次更新聲稱能夠「有效且準確地解決
現實世界中的挑戰」。今年一月,DeepSeek 一度超越 ChatGPT,成為蘋果美國應用程式
商店中最受歡迎的免費軟體。
V3 模型是一款強大的混合專家(MoE)語言模型,擁有
6710 億個總參數,其中處理每個 token(即每個單詞或符號)時,模型會動態選擇並啟
動370億個參數來進行計算,這種方法使得模型能夠在保持高效運行的同時,利用大量參
數來提高預測的準確性和性能。在預訓練之後,V3 進行了知識蒸餾,從 DeepSeek-R1 模
型中提取知識,這一過程進一步提升了模型的性能和應用能力。
本次更新展示了 DeepSeek 在技術創新方面的持續努力,並預示著未來 AI 技術將更加高
效。隨著競爭的加劇,DeepSeek 的進步無疑將對全球 AI 產業產生深遠影響,更突顯了
這家中國 AI 新創公司保持領先競爭對手的意圖。
https://www.ettoday.net/news/20250325/2931329.htm
穩了?
昨天DeepSeek更新V3模型 雖然非預期的R2模型
V3擁有6710億個參數處理單詞或符號 模型會動態啟動370億個參數計算
V3使用知識蒸餾從DeepSeek R1提取知識 提升模型的性能和應用能力
--
https://i.imgur.com/hW5h5gU.gif https://i.imgur.com/kJV8Xpi.gif
https://i.imgur.com/mus9aa2.jpeg https://i.imgur.com/xsoSdOK.jpeg
https://i.imgur.com/Rq7dbDm.jpg https://i.imgur.com/3JFrFUW.jpg
https://i.imgur.com/fpRblKK.jpeg https://i.imgur.com/xxuciis.jpeg
https://i.imgur.com/sYpst6n.gif https://i.imgur.com/DEKfHhV.jpeg
https://i.imgur.com/90i6C8z.jpg
--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.218.53.138 (臺灣)
※ 作者: jeff0025 2025-03-25 16:18:20
※ 文章代碼(AID): #1ducRFmF (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1742890703.A.C0F.html
→ Gavatzky …
推 Gavatzky: 科技上能跟美國抗衡的看起來只剩中國了1F 03/25 16:21
推 Lenney33: NV快沒呼吸了...99老黃7F 03/25 16:23
推 gk1329: 不如預期 崩
中國多印點鈔投資半導體鴨 坐等顯卡白菜價10F 03/25 16:24
推 OhtaniHR: 不然美國幹嘛頃全力封鎖 不給台積電代工也不讓他們買先進的輝達 只要封鎖繼續中國基本上都很難追上
除非他們真能自己練出光刻機還追上台積電 但就算能也是十年以上的事情了14F 03/25 16:27
推 piece1: 讚讚!卷起來...免費仔蹭就好..等便宜的顯卡20F 03/25 16:28
推 c928: 蒸餾再蒸餾,以後就看誰蒸餾比較濃22F 03/25 16:28
→ poeoe: 真的是追著Open AI打欸 這麼狠嗎25F 03/25 16:30
推 gbman: 中文世界以後就DS主主導!英美Open AI CC28F 03/25 16:31
推 kotorichan: EUV有機會吧 如果是由華為主導負責
便宜治百病 拒絕使用壟斷付費的AI29F 03/25 16:32
噓 wwwcom71: 有空生成這麼多圖不如好好研究心得怎麼寫31F 03/25 16:35
→ IBIZA: DeepSeek現在就是用不同模型之間在互相調教
他那個不是單純蒸餾而已32F 03/25 16:36
推 sdbb: 若能弄到GB300,豈不飛天36F 03/25 16:38
推 fatb: 便宜真的治百病 各家公司都開始自己偷偷架DS玩37F 03/25 16:38
推 joe0934: 中國只要靠便宜就贏了38F 03/25 16:38
→ newgo1776: Nvidia:還不是要用我的晶片?41F 03/25 16:40
→ appledick: TSMC 還不是都要靠我
偷偷架???有三小好偷偷架的 北七喔44F 03/25 16:41
→ appledick: 上層他媽的只要便宜又好用 管你是用三小
小娜瞬殺就這個喔?47F 03/25 16:42
推 suzu1: 台灣又站錯邊,台股應該沒戲了49F 03/25 16:43
推 Swave: 孫正義是不是又要虧死了53F 03/25 16:48
推 junior020486: 好了啦,你偷買多少Blackwell系列的伺服器
新加坡偷賣多少啦
不bang新加坡,中國一直偷買一直爽55F 03/25 16:49
推 realmd: DS問世後NV就沒站上之前的價格 晶片溢價賣不動了60F 03/25 16:52
→ junior020486: 笑死,沒站上?前一陣子回到140叫做DS問世以後沒站上,你活在平行世界噢XD62F 03/25 16:53
推 EZTW0000: 阿不是用不到這麼多硬體怎4090已經9萬66F 03/25 16:57
→ LMgogo: 這家用gb200吧 目前gb200這拉基沒人要67F 03/25 17:00
推 ededws1: 不就V3的小版本,等出V4或R2再說68F 03/25 17:00
推 kenbo: 鬼故事連發77F 03/25 17:28
推 CYL009: 美吹殖人出來透氣我就放心了 打臉準備ww78F 03/25 17:36
推 uller: 開源就是爽 等等回家載80F 03/25 17:39
噓 ken123321987: 各位偉大的中國人 打倒美帝就在眼前 革命尚未成功同志仍須努力 中國爸爸不會忘記彎彎的81F 03/25 17:42
推 bigpan: 人礦才是中國最強的地方84F 03/25 17:52
推 alau: 蒸餾完畢85F 03/25 17:54
→ hydra7: 徹底的蒸餾86F 03/25 17:54
推 odyssey: 股版邊酸邊用DS?88F 03/25 18:07
推 jei01: 把一顆大腦學習的精華去升級另一顆智商更高的大腦要就怪open AI要做close ,遇到開源的DS只能打價格戰了89F 03/25 18:08
推 hero613: Grok比較好用,尤其是一些道德底線的問題。92F 03/25 18:10
推 Lhmstu: 穩,OpenAI最近出那個貴死人的東西真的沒用93F 03/25 18:12
→ kausan: 蛤 gpt不是早看不到車尾燈了94F 03/25 18:19
推 jei01: Gpt是訓練成本太高,目前稍勝DS一些
但DS出世讓Gpt成本要回收很難,只能繼續燒錢95F 03/25 18:26
推 tw11509: 中國本來就是卷死人的地方,但開源還真沒什麼好嫌的97F 03/25 18:35
推 jboys75: 以後科技公司徵人都找待過酒廠的100F 03/25 18:38
→ visadanny: I dot car 用過其他模型 再回頭用deepseek 就會發現ds慢死了 優點只有便宜而已105F 03/25 19:15
推 tkc7: 卷死你107F 03/25 19:22
推 k1k1832002: 說真的GPT是真的難用,不說DEEPSEEK,用Claude3.7都覺得效用比他強(單論資料整理)108F 03/25 19:26
推 ruei1999: 感恩DS,不然Gemini,openAi,grok也不可能那麼快把一堆花錢貨給免錢玩lol111F 03/25 20:10
推 jei01: 你想用快的DS,那你可以自己建計算中心魔改DS
都開源給你了,你厲害就不必用他的算力113F 03/25 20:15
推 CaTkinGG: 因為文字的關係 台灣以後好用的AI服務應該要靠中國持續發展117F 03/25 21:05
→ c00jsw00: 剛剛使用真的編程能力強大120F 03/25 22:44
--