顯示廣告
隱藏 ✕
※ 本文轉寄自 ptt.cc 更新時間: 2025-01-30 18:55:00
看板 Stock
作者 ng101281 ()
標題 [新聞] OpenAI內部人士:有證據顯示DeepSeek盜
時間 Wed Jan 29 21:03:16 2025


原文標題:
OpenAI內部人士:有證據顯示DeepSeek盜用我們的模型

原文連結:
https://reurl.cc/WAgO0e
OpenAI內部人士:有證據顯示DeepSeek盜用我們的模型 | 國際焦點 - 太報 TaiSounds
[圖]
中國新創企業的DeepSeek AI引擎,對美國矽谷解造成大震撼,因為號稱用幾十分之一的成本、很少的算力就能達到與業界龍頭OpenAI同等級的成果。《金融時報》報導,OpenAI內部人士指出,他們有證據顯示DeepSeek使用「蒸餾」(distillation),盜用OpenAI的成果。 ...

 

發布時間:

2025-01-29 15:10 / 作者 陳家齊

原文內容:

中國新創企業的DeepSeek AI引擎,對美國矽谷造成大震撼,因為號稱用幾十分之一的成本
、很少的算力就能達到與業界龍頭OpenAI同等級的成果。《金融時報》報導,OpenAI內部人
士指出,他們有證據顯示DeepSeek使用「蒸餾」(distillation)的技巧,盜用OpenAI的成
果。


「蒸餾」這個技法是AI開發者常用的技術,這是利用其他更大AI模型所計算輸出的結果,訓
練自己開發中的較小AI模型。如果《金融時報》的報導獲得證實,則DeepSeek可以用極低算
力、極低成本達成媲美OpenAI等級的成果,就不再是個謎:DeepSeek等於是寄生在OpenAI身
上,自然不必自己投入大成本建構算力。


OpenAI的服務條款規定,使用者不得「複製」其任何服務,或「使用OpenAI的輸出結果來開
發與OpenAI 競爭的模型」。DeepSeek若利用了OpenAI開發出DeepSeek-R1這個震驚各界、和
OpenAI競爭的模型,就違反了使用條款。


據另一名知情人士透露,OpenAI 及其合作夥伴微軟去年秋天調查了據信屬於DeepSeek的帳
戶,這些帳戶使用了OpenAI的API(應用程式介面),以違反服務條款的方式進行蒸餾,遭
到封鎖。這些調查最早由彭博新聞報導。


DeepSeek表示,其V3 AI模型僅使用2048張輝達H800顯示卡,只花費560萬美元進行訓練,擁
有6710億個參數,成本僅為OpenAI和Google類似規模模型的幾十分之一。

部分專家指出,DeepSeek模型的輸出結果,顯示其可能接受過OpenAI GPT-4輸出的內容訓練
,這違反OpenAI的服務條款。業界人士指出,在中國和美國的AI實驗室中,使用來自OpenAI
等大型AI企業的輸出進行訓練是常見做法,較小型的企業往往藉此「搭便車」。


對於OpenAI這些最前線的AI模型開發公司而言,他們必須耗費金錢與心力搭建龐大的算力中
心,接受人工輸入的反饋,以訓練出更好的AI模型。這個過程耗時而且非常昂貴。

加州柏克萊大學(UC Berkeley)AI博士生古普塔(Ritwik Gupta)表示:「新創公司和學
術界普遍會使用商業化的大型語言模型(LLM),像是ChatGPT的輸出,來訓練自己的模型。
這樣一來,他們便能免費獲得人類回饋訓練的結果。我不會驚訝DeepSeek採用了相同方法。
如果確實如此,要完全杜絕這種做法可能相當困難。


心得/評論:
幾天之內 一下捧上天 一下又人人攻擊
還好台股過年可以停看聽一下
不然差點 DeepSeek引力抓不住你



----
Sent from BePTT on my Google Pixel 6

--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.215.56.15 (臺灣)
※ 作者: ng101281 2025-01-29 21:03:16
※ 文章代碼(AID): #1dcYSOUf (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1738155800.A.7A9.html
ggian123    : Close Ai輸不起就別玩1F 01/29 21:04
etset       : 中又贏 遙遙領先 遙遙領先2F 01/29 21:04
cosmite     : 穩了3F 01/29 21:04
loopdiuretic: 抗議 他學我?4F 01/29 21:04
gino0717    : 這又是哪家野雞雜誌5F 01/29 21:05
KISS1979    : 有一群人崩潰精神錯亂了6F 01/29 21:05
s1612316    : 等等 盜用?要不要先定義什麼是盜用7F 01/29 21:05
liscp       : 等等這串所有的中國id 通通水桶8F 01/29 21:07
※ 編輯: ng101281 (49.215.56.15 臺灣), 01/29/2025 21:08:11
alau        : 人家有明文規定不能拿API來訓練模型吧?9F 01/29 21:08
tradeent    : 蒸餾不等於盜用10F 01/29 21:08
tradeent    : 然後蒸餾不代表成績就會好
tradeent    : 最後是蒸餾在現行法律不違法
fool5566    : http://i.imgur.com/Wgh1BHF.jpg13F 01/29 21:09
[圖]
gbman       : google表示以後搜尋引擎自己開發不要用我的CC14F 01/29 21:09
fool5566    : http://i.imgur.com/3c1frTP.jpg15F 01/29 21:09
[圖]
hihi29      : 美國輸不起 好扯==16F 01/29 21:09
ethan0419   : 只有我覺得結果是如何根本不重要嗎17F 01/29 21:10
ketter      : 兩天就翻車,比黑悟空還快~18F 01/29 21:11
bobokeke    : 大紀元還是新唐人?19F 01/29 21:12
amd3dnow    : '蒸餾'又是哪個文組發明的詞??20F 01/29 21:12
set852064   : 急了.jpg21F 01/29 21:12
tonyparker18: 牆倒眾人推22F 01/29 21:13
gsc0478     : 買空賣空 所以只能算是一支介面程式23F 01/29 21:13
gbman       : 這樣玩就能贏!那OPENAI真的爛CC24F 01/29 21:14
Homeparty   : 原本就打算美國1個人可以寫10個人程式,中國再會9925F 01/29 21:15
Homeparty   : 6也贏不了。
acake       : 蒸溜是專業術語好嗎27F 01/29 21:17
fashsboy    : 把證據拿出來阿= =28F 01/29 21:18
linzero     : 可能也知道也可能告不贏或者告了也不能怎樣,但也算29F 01/29 21:19
linzero     : 一種表態、證明
Jeff1989    : 等等支那賤畜韭菜們會出來洗地XD31F 01/29 21:19
bobogei81123: 我也覺得distill直接翻蒸餾很搞笑32F 01/29 21:21
paericsson  : 中國玩得真溜~~33F 01/29 21:21
bighouse    : 不意外34F 01/29 21:22
linzero     : 以前好像就有人翻譯用蒸餾了35F 01/29 21:22
liu1030     : distill學術界很常用阿36F 01/29 21:22
Leo4891     : 不論有沒有盜用  肯定的是 ds也是得靠前人研究成果37F 01/29 21:22
Leo4891     : 才能再進步
repast      : 垃圾支那不意外 還一堆低能兒在吹39F 01/29 21:23
easonli000  : 聽起來像是稱讚DS的自我監督技巧有效40F 01/29 21:24
bobogei81123: OpenAI的TOS是真的有說不能用ChatGPT的結果來訓練別41F 01/29 21:25
bobogei81123: 的AI 但之前有判例完全由AI產的東西沒有Copyright
bobogei81123: 應該是告不太成
sspider0829 : 笑死44F 01/29 21:26
set852064   : 所以證據要公佈了嗎?還是苦無?45F 01/29 21:26
square      : 美國輸不起 笑死46F 01/29 21:26
gbman       : 要告google就告拉CC47F 01/29 21:26
Wand 
Wand        : 「DS是站在巨人的肩膀上」「證據呢」呵呵48F 01/29 21:26
tonyparker18: 拉回就是跟你買的 很多人搞不清楚 還在泡沫49F 01/29 21:27
c1951       : 程式碼完全開源 找一下就可以知道哪條程式碼在搞鬼50F 01/29 21:27
finly1023   : 輸不起翻桌51F 01/29 21:27
horseorange : 笑死 有人看不懂就說人文組52F 01/29 21:28
s213092921  : 開始抹黑了,熟悉的套路XDD53F 01/29 21:28
gbman       : DS自己有講有用開源AI訓練!不只OPENAI54F 01/29 21:28
eric112     : 那如果是這樣頂尖AI公司也沒有技術護城河,隨便都55F 01/29 21:28
eric112     : 可以被蒸餾也沒辦法禁止這樣誰還要花大錢去訓練,
eric112     : 而且在中國根本無法可管
basslife    : 北七 一堆AI都馬盜用你的東西怎不說58F 01/29 21:28
brain9453   : 你們的人 要不要打一架 風向很亂59F 01/29 21:28
firemothra  : 蛤?是不是真的怕了?60F 01/29 21:29
[圖]
sellgd      : 你自己生成式AI沒盜用網路上圖文創作內容?62F 01/29 21:30
strlen      : 其實這一直是有問題的地方 到底AI公司隨便抓資料訓63F 01/29 21:30
strlen      : 練版權問題到底該怎麼算?
eric112     : 那openAI乾脆開放給大家既然沒辦法防止65F 01/29 21:31
KTFGU       : 這樣就可以名正言順的 美國封鎖中國軟體了66F 01/29 21:31
gbman       : 管你的!當然爽爽免費用最好阿XD67F 01/29 21:31
Acce0912    : 急了68F 01/29 21:33
matlab1106  : 這不就鄉民常用的跟我想的一樣?69F 01/29 21:33
uniz        : DS承認是用Chtgpt的http://i.imgur.com/A0TL3C8.jpg70F 01/29 21:33
[圖]
bobogei81123: 可以看這篇 https://tinyurl.com/yda2aten71F 01/29 21:33
DeepSeek FAQ – Stratechery by Ben Thompson
[圖]
DeepSeek has completely upended people’s expectations for AI and competition with China. What is it, and why does it matter? ...

 
linzero     : 使用蒸餾的情況跟AI未經授權抓資料來訓練不一樣吧?72F 01/29 21:33
gbman       : 美國就閉源啊!開源還怕人家用!就關門自己玩CC73F 01/29 21:34
bobogei81123: 作者有提到 distillation 讓先出的 model 頗吃虧74F 01/29 21:34
strlen      : 只要你資料是來自於其它地方 就是會有問題75F 01/29 21:34
strlen      : 除非你有一個一個的去跟資料擁有者拿版權
xzcb2008 
xzcb2008    : 說越多越慘歐 資本已經動搖了77F 01/29 21:35
strlen      : 但這幾乎沒有一間AI公司做到 版權到底怎麼算78F 01/29 21:35
xzcb2008 
xzcb2008    : 看今晚就知道了79F 01/29 21:35
strlen      : OpenAI Meta Google xAI一眾都有問題80F 01/29 21:35
joke3547    : 所以證明是真的但是是抄你們的?81F 01/29 21:36
eric112     : 所以這種東西就是沒有技術護城河,你砸錢也沒辦法82F 01/29 21:36
eric112     : 防止被偷,而且那些東西本來就來自普羅大眾
bobogei81123: 我猜以後 OpenAI 再出更強的 model 可能就不放出來84F 01/29 21:36
bobogei81123: 給每個人用了 變成要用的公司分別來簽約了
strlen      : 拿他們的東西作訓練 也有問題86F 01/29 21:36
ian01050    : 蒸餾是深度學習的技巧 不懂的文組不要亂叫可以嗎…87F 01/29 21:36
strlen      : 但我看大概也沒人管 沒辦法管吧88F 01/29 21:36
gm3252      : 中國不意外89F 01/29 21:36
squelch     : 內部人士是誰啊 要放話就公司公開宣告啊90F 01/29 21:37
linzero     : 證明是蒸餾的話,可以說這種模式本就會省時省力,就91F 01/29 21:37
set852064   : 感覺說愈多愈顯得...92F 01/29 21:37
jcwang      : 理組申請蒸餾專利了?93F 01/29 21:37
linzero     : 可以跟金主跟美國政府表示我們不是在浪費錢砸算力94F 01/29 21:38
Nighty7222  : 上次騰訊才把別人的程式碼整個copy回來用被抓包。算95F 01/29 21:38
Nighty7222  : 了吧
stanleyplus : 中又贏麻97F 01/29 21:38
xzcb2008 
xzcb2008    : 如果他不開放 那怎麼繼續圈資本 這棋很難下了98F 01/29 21:39
a0913       : 蒸餾不是支語99F 01/29 21:39
a0808996    : ai公司 網路上一直撈資料 也沒問過人阿~100F 01/29 21:39
xzcb2008 
xzcb2008    : 對岸就是要你為畏縮縮玩不是嗎101F 01/29 21:41
rayisgreat  : 要回噴了!!!102F 01/29 21:41
ra88872     : 這是做空嗎?盜用還是內賊差很多,盜用的話open  ai103F 01/29 21:41
ra88872     :  麻煩可大了。
linzero     : 撈資料跟蒸餾雖然都可以說是未經允許,但本質上不同105F 01/29 21:42
joke3547    : Transformer 開發團隊表示:那我是不是...欸?!106F 01/29 21:42
qxpbyd      : 很難證明吧 這史無前例107F 01/29 21:42
gbman       : 不是有人說次DS是開源的勝利!有點意思CC108F 01/29 21:42
a0808996    : ds開源 道德上已經占盡優勢了109F 01/29 21:43
linzero     : 有點不洽當比方,撈資料是撈食材,蒸餾是學烹飪技巧110F 01/29 21:43
a0808996    : 我沒私藏 大家一起成長111F 01/29 21:43
liscp       : Ds 幫openai 開源 潮到出水112F 01/29 21:44
c00jsw00    : 那個內部人士 不敢具名 87113F 01/29 21:44
dosiris     : OpenAI也挖了不少中國網頁的資料吧114F 01/29 21:44
a0808996    : 歡迎COPY115F 01/29 21:44
SYMS        : 輸不起,翻桌了116F 01/29 21:45
ohlong      : 急了117F 01/29 21:45
qxpbyd      : https://i.imgur.com/gBzps4A.png DS員工的解釋 看118F 01/29 21:45
[圖]
aa00788     : 中吹崩潰了119F 01/29 21:45
qxpbyd      : 你信誰囉120F 01/29 21:45
laogiby     : 白豬又要耍賴了 哭R121F 01/29 21:47
tw12321     : 呵。那人家成本低是事實也是青出於藍122F 01/29 21:47
a0808996    : 對岸也沒再管版權的123F 01/29 21:47
Aliensoul   : 這是做新聞給股市看的吧124F 01/29 21:48
a0808996    : 偷了魔改 你能怎樣125F 01/29 21:48
joke3547    : 確實也管不到對岸,嘻嘻126F 01/29 21:48
tim855042   : 支那要人要崩潰了 吹2天的泡泡就破了127F 01/29 21:49
linzero     : 當初鴻蒙不是就replace不夠乾淨嗎?128F 01/29 21:49
DrowningPool: Jordan表示:first time?129F 01/29 21:50
jhihheng    : 早說了 詐騙垃圾130F 01/29 21:51
fywei       : ds就是垃圾131F 01/29 21:52
pikaaco     : 就算是也沒辦法怎樣吧 中國有在怕的嗎132F 01/29 21:54
luten       : 我比較喜歡翻成「雙修」133F 01/29 21:54
iamfreefrog : 這應該會是川普決心玩死中國的最後一根稻草134F 01/29 21:56
kdh         : 開源程式直接拿來驗證就知道了135F 01/29 21:57
Sashaaaa    : 中國人不意外136F 01/29 21:58
lmc66       : 中國哪個東西不是偷來的 學術界本來就特別寬容中國137F 01/29 21:58
lmc66       : 的盜竊行為
s0920151048 : 駐版台吹興奮了139F 01/29 22:01
low1219     : Open AI 沒有Open ,太陽餅裡面沒有太陽。140F 01/29 22:01
stanleyplus : 誰玩誰還不知道XDD141F 01/29 22:02
tcypost     : 看人解釋DS,本來裡面就公開說是用蒸餾的啊142F 01/29 22:04
lmc66       : 蒸餾就是違反OpenAI使用守則啊 就是偷啊 就不是他143F 01/29 22:07
lmc66       : 們在吹的”從零開始”
tonylolz    : 等下就告訴你誰崩潰囉145F 01/29 22:08
phoenixtwo  : 不意外  中國那次遙遙領先不是這樣146F 01/29 22:08
flipflap    : 遙遙領先 中或贏 雙贏就是中國贏兩次147F 01/29 22:12
ev331       : OPENAI的金主爸爸微軟不缺錢吧148F 01/29 22:12
rex03187    : 蒸餾代表你省去從海量垃圾資料去判斷的過程149F 01/29 22:16
polaroidd   : 又要抽稅了嗎150F 01/29 22:16
rickyhoney  : 還沒上車啊,別那麼快恢複151F 01/29 22:18
strlen      : 呃...DS員工那對話...是在證實他的AI輸出都幻覺嗎152F 01/29 22:19
strlen      : 哪個內鬼截這白癡圖啊?應該是假的
mangle      : 輿論一條龍來了 可憐啊154F 01/29 22:20
lovepork    : 重新定義盜用?155F 01/29 22:21
zombiepigman: 滯台支那人急著洗地中156F 01/29 22:21
qxpbyd      : 現在哪個AI沒有幻覺 推薦一下157F 01/29 22:23
a134        : 1500excel 即時感158F 01/29 22:24
qxpbyd      : OpenAI的轉錄語音的都有Whisper了159F 01/29 22:24
qxpbyd      :               whisper模型 幻覺
alphish     : 中國人用英文寫程式  怎樣都是抄襲英美161F 01/29 22:25
qxpbyd      : 那是TG公開頻道162F 01/29 22:26
eelse       : 用你的連結套個皮就是新的AI了,中國式創新163F 01/29 22:28
milandi     : 中國豬: 輸不起啦 ~~~164F 01/29 22:34
FatFatQQ    : 美國也開始維穩了嗎 真滑稽165F 01/29 22:35
FatFatQQ    :  https://i.imgur.com/wMkV5yP.jpeg
[圖]
Lhmstu      : 美國公司怕了XD,不過中國應該不屌才對167F 01/29 22:35
s10112 
s10112      : 笑死 那CLOSEAI不就盜用全網民資料 真是畜生一隻168F 01/29 22:37
NEWinx      : 中國不偷才是新聞吧169F 01/29 22:41
Bachack000  : 中國意外嗎?騙、偷、搶樣樣來170F 01/29 22:47
pttouch     : 不知道要說啥,我是覺得不用一直洗一直洗一直洗一171F 01/29 22:49
pttouch     : 直洗一直洗一直洗一直洗一直洗一直洗一直洗一直洗
pttouch     : 一直洗一直洗一直洗一直洗一直洗一直洗一直洗一直
pttouch     : 洗一直洗一直洗一直洗一直洗一直洗
copybrown   : 哪個內部人士?笑死175F 01/29 22:49
black205    : 說一直洗的搞笑人士不如趕快把ChatDPP弄回來啊176F 01/29 22:51
black205    : 不知道要說啥 改說說廢物唐部長拿兩百億做什麼垃圾
bitcch      : 一堆無腦言論 一堆公開paper都在做 連Google都在玩178F 01/29 22:54
bitcch      : 蒸餾本來就是正常的模型壓縮技術 只是這次ds做的特
bitcch      : 好
pttouch     : 看不懂這是在炒股的搞笑人士請不要又泛政治化…這181F 01/29 23:23
pttouch     : 就是在話題炒股,韭菜不要在那邊什麼都要滑坡好嗎
pttouch     : ==
Chien996    : 綠蝇精神勝利法 很在意台灣輸慘XD184F 01/29 23:24
takeda3234  : 如果繼續蒸餾下去 硬體成本是不是會變越低就能達成185F 01/29 23:26
pttouch     : 哇靠我還左轉出去看吧我是不是在股版,奇怪了明明186F 01/29 23:27
pttouch     : 是在討論股票的事情,係咧==
jason613    : 那明天劇本是 deepsuck188F 01/29 23:59
noseng      : 這次……兩天?……果然還是無視就好189F 01/30 00:09
stanleyplus : 多蛙丸子190F 01/30 00:18
sanos168    : 哈哈哈.果然是畝產萬斤糧的翻版,什麼最節省成本..191F 01/30 00:48
logitech2004: 大家都是這樣做的好嗎?192F 01/30 00:53
solarem     : 嘻嘻 就說你是抄的 有美國可以抄襲 中國要懂的感激193F 01/30 00:54
ljh109      : 中吹又要森七七了194F 01/30 02:08
Brioni      : 現在最燒屁股的是星門專案吧,投資機構一個閃現就變195F 01/30 03:12
Brioni      : 閉門專案
mdkn35      : 結果還真的被說對了?柵欄仔又翻了?197F 01/30 06:53
NexusPrime  : 學術研究的paper用蒸餾沒問題啊,但是你DS是商業化198F 01/30 09:31
NexusPrime  : 的app
SRNOB       : 開源免費的 什麼商業化zz200F 01/30 10:36
sid3        : 他抄襲我的髮型201F 01/30 15:32

--
※ 看板: Stock 文章推薦值: 0 目前人氣: 0 累積人氣: 68 
作者 ng101281 的最新發文:
點此顯示更多發文記錄
分享網址: 複製 已複製
guest
x)推文 r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇