顯示廣告
隱藏 ✕
※ 本文為 Knuckles 轉寄自 ptt.cc 更新時間: 2025-01-30 23:18:21
看板 Gossiping
作者 app325 (艾波)
標題 [問卦] DeepSeek成本這麽低的原因是啥?
時間 Thu Jan 30 15:33:10 2025


Deepseek 橫空出世

應該讓大家都嚇了一跳

程式碼是開源的

有高手看的出來訓練成本這麼低的原因是啥嗎?

--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 180.217.153.240 (臺灣)
※ 作者: app325 2025-01-30 15:33:10
※ 文章代碼(AID): #1dcoiuWe (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1738222392.A.828.html
QEMU: 演算法1F 49.159.24.75 台灣 01/30 15:33
venomsoul: 因為支那賤畜命不值錢,不過別誤會,2F 111.83.240.34 台灣 01/30 15:34
venomsoul: 這可能反而是國力呢
firose: 長期耕耘4F 114.25.142.91 台灣 01/30 15:34
Yude0109: 搞你心態成本隨便說你也信5F 114.137.105.242 台灣 01/30 15:34
fony1029: 養套殺 你看過蝦皮模式就知道了6F 223.137.12.136 台灣 01/30 15:34
dingading: https://i.imgur.com/g10pOKo.png7F 1.162.106.74 台灣 01/30 15:34
[圖]
ncc5566: 樓下賣屁股為什麼這麼便宜8F 1.164.82.161 台灣 01/30 15:34
cpblgu 
cpblgu: 演算法,算力不足,算法來補9F 119.77.182.87 台灣 01/30 15:34
iaminnocent: 他數據集從OpenAI蒸餾過來,GPT3.510F 125.228.63.38 台灣 01/30 15:34
iaminnocent: 的成本裡面有7-9成都是用在數據集建
iaminnocent: 立,你大概能猜到為什麼他那麼便宜
iaminnocent: 了
railman: 答案準確率很低算ai嗎?14F 114.136.251.220 台灣 01/30 15:35
jma306: 後台躲著習近平15F 114.26.73.228 台灣 01/30 15:35
TexasFlood: 就蒸餾啊,OpenAI都講了16F 42.74.142.159 台灣 01/30 15:35
set852064: 演算法17F 220.135.221.137 台灣 01/30 15:36
kevin061799: 1偷的東西最便宜18F 49.216.18.138 台灣 01/30 15:36
meta41110: 凸( ゚д゚)凸文組很難跟你解釋滾贛19F 116.89.136.65 台灣 01/30 15:36
xupmc: 抄20F 49.158.131.39 台灣 01/30 15:36
hour371: 有張貓貓釣魚圖蠻貼切的21F 36.227.41.223 台灣 01/30 15:37
s213092921: 演算法優化22F 1.172.23.183 台灣 01/30 15:37
hkcdc: 遊戲也是 有跑很慢 跟跑很順的23F 125.228.166.241 台灣 01/30 15:37
johnny3: 演算法24F 111.82.47.197 台灣 01/30 15:37
hkcdc: 所以才說叫技術突破25F 125.228.166.241 台灣 01/30 15:37
loloman: 給進去的資料是都處理過的,這方面省很大26F 42.77.106.217 台灣 01/30 15:38
gbooss: 因為沒有藍白砍預算27F 111.242.181.224 台灣 01/30 15:38
shokotan: 牛逼遙遙領先 祖國已經超越美帝科技封鎖28F 111.250.152.121 台灣 01/30 15:38
loloman: 後續只要有新的應用需要重頭來過deepseek29F 42.77.106.217 台灣 01/30 15:38
loloman: 沒辦法從任何來源得到精緻的資料源時依然
loloman: 還是要跟人拚硬體資源計算能力
gg86300: 抄襲點麵線軟體32F 101.9.99.161 台灣 01/30 15:40
loloman: 上面已經有人解釋,用蒸餾形容滿貼切的33F 42.77.106.217 台灣 01/30 15:40
meta41110: 凸( ゚д゚)凸蔡英文那4年的數位部拿的34F 116.89.136.65 台灣 01/30 15:41
meta41110: n倍錢只能出點麵線平台砍預算客氣了好
meta41110: 嗎
zebra101: 童工啊,強迫勞動37F 38.92.25.9 美國 01/30 15:42
noreg0393933: 中國基本時薪多少你知道嗎?38F 42.72.82.248 台灣 01/30 15:42
lpbrother: 不是養套沙?39F 180.176.65.253 台灣 01/30 15:43
suzer: 用蒸餾你參數也要調成總是能抓到 feature40F 114.137.188.80 台灣 01/30 15:45
suzer: s啊,這是他們高明的地方
d8751102: 吹的42F 180.217.157.193 台灣 01/30 15:45
neil0611: 中國人命不值錢43F 118.231.137.71 台灣 01/30 15:46
andymi: 為什麼盜版windows賣這麼便宜?44F 61.231.166.238 台灣 01/30 15:47
city1230: 中國不就最愛換皮嗎45F 118.171.85.239 台灣 01/30 15:48
potionx: 就教授念了很多書 寫出一本教材46F 111.240.104.71 台灣 01/30 15:54
potionx: 然後學生拿教材改了一些 當然很省事
humorforever: 低階人才一堆啊,哪像台灣一流AI人48F 36.227.136.189 台灣 01/30 16:02
humorforever: 才都在網上抓網軍,問64.溫馨。
IDfor2010: 東方神秘魔力50F 150.116.221.194 台灣 01/30 16:04
fireda: 成本很多都是人事成本51F 223.137.126.165 台灣 01/30 16:05
dispptt: 就唬爛的啊52F 27.247.3.228 台灣 01/30 16:05
goodhike: 直接拿別人訓練好的ai來幫忙訓練 當然便53F 42.70.82.236 台灣 01/30 16:13
goodhike: 宜啊
CCPenis: https://i.imgur.com/Jse07pR.jpeg55F 27.242.1.71 台灣 01/30 16:14
[圖]
ShockG: cost down可以一次降這麼多,有點誇張56F 125.229.48.16 台灣 01/30 16:14
kotorichan: 直接串openai的api57F 42.71.188.105 台灣 01/30 16:18
tecopon: 數發部的台灣價值不容你質疑58F 118.232.69.226 台灣 01/30 16:18
ffaatt: 唐鳳都可以下載來玩 不就是證明59F 42.78.63.70 台灣 01/30 16:19
dovepacket: 山寨60F 111.253.136.241 台灣 01/30 16:27
c7683fh6: 抄61F 49.228.246.242 泰國 01/30 16:27
c7683fh6: 中國人的尿性怎麼會不知道
ff0755201: 抄作業63F 49.216.191.112 台灣 01/30 16:30
Leo4891: open ai把資料撈好  ds直接拿來用 成本64F 36.231.10.118 台灣 01/30 16:31
Leo4891: 當然省
asdkmm5050: 不是用蒸餾形容貼切吧,那就是蒸餾法66F 180.217.158.211 台灣 01/30 16:32
asdkmm5050: 啊
sustto: 就小語言模型68F 42.73.37.77 台灣 01/30 16:40
Diver123: 蒸餾69F 42.72.102.163 台灣 01/30 16:47
aglet: 用演算法榨出工作排程,避免有閒置單位70F 223.136.83.64 台灣 01/30 16:59
wind93: 抄他家71F 49.217.201.188 台灣 01/30 17:02
JQK2: 有沒有可能成本是假的?人家說什麼就信什麼72F 114.136.206.103 台灣 01/30 17:03
cosmite: 蒸餾73F 218.172.0.83 台灣 01/30 17:05
DUFTON: 低報啊74F 42.73.250.18 台灣 01/30 17:22
yellow528: 不過他們的中文比gpt順暢很多,這就很75F 223.140.103.206 台灣 01/30 17:32
yellow528: 好用的
kasim15: 人家說什麼就信什麼 美國股市都是天才嗎77F 101.12.146.80 台灣 01/30 17:38
gueswmi: https://i.imgur.com/KpeGxeK.png78F 125.224.136.199 台灣 01/30 17:49
gueswmi: 幫你18分看完deepseek論文在講甚麼
[圖]
w3aki: 偷用美國限制的高階晶片當然不能說啊80F 1.200.131.6 台灣 01/30 18:13
hamnett17th: 天才數量的量體不同81F 219.70.181.65 台灣 01/30 18:32
paufan: 因為有200億資金82F 114.24.30.133 台灣 01/30 18:42
wayne28: 偷來的東西你說呢83F 111.80.149.250 台灣 01/30 18:47
LiamTiger: 站在巨人的肩膀上84F 39.12.80.252 台灣 01/30 19:13
holiybo: 大外宣 他只是說舊版本的成本 但一堆藍85F 114.40.76.2 台灣 01/30 19:27
holiybo: 莓把它吹成最新版的成本
adamyang2000: 東方唯一能与美國霸權抗衡祇有中國87F 110.30.96.109 台灣 01/30 19:41
shadowdio: 憨直不懂商業刀法撈錢88F 114.39.110.181 台灣 01/30 19:51
ohmylove347: 論文自己看89F 61.61.191.166 台灣 01/30 21:50

--
※ 看板: Gossiping 文章推薦值: 1 目前人氣: 0 累積人氣: 336 
作者 app325 的最新發文:
點此顯示更多發文記錄
分享網址: 複製 已複製
1樓 時間: 2025-01-31 00:25:18 (台灣)
  01-31 00:25 TW
訓練一次成本的算法是?假設資料集都一樣!硬體、電費和時間?
2樓 時間: 2025-01-31 06:14:36 (台灣)
  01-31 06:14 TW
根本就不是AI了吧 要一直更新
3樓 時間: 2025-01-31 11:35:25 (台灣)
  01-31 11:35 TW
資訊都是外部來的...
不是自己本身去獲取...
可能都是拿別人廣站的統計或蒐集來的資料...
網路爬來的資料當作是自己的
4樓 時間: 2025-01-31 11:39:46 (澳大利亞)
  01-31 11:39 AU
14億人/12星座=1.2億人
花錢跟唐老師買一份今日處女座運勢詳批
蒸餾成1.2億份不同的精簡分析
每份只要1/120000000的成本
什麼?不是每個問題都這麼多人問?
怕啥?大數平均下來能攤平就賺爛了呀
5樓 時間: 2025-01-31 15:32:42 (台灣)
     (編輯過) TW
偷Toyota的車
內裝改成賓士
貼中國牌
引擎研發成本都省了
創新!
6樓 時間: 2025-02-03 13:36:24 (台灣)
  02-03 13:36 TW
因為言論審查系統早就有了,copy一個AI來加上去,不用多花很多精力吧?
r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇