※ 本文轉寄自 ptt.cc 更新時間: 2025-01-30 18:55:00
看板 Stock
作者 標題 [新聞] OpenAI內部人士:有證據顯示DeepSeek盜
時間 Wed Jan 29 21:03:16 2025
原文標題:
OpenAI內部人士:有證據顯示DeepSeek盜用我們的模型
原文連結:
https://reurl.cc/WAgO0e
OpenAI內部人士:有證據顯示DeepSeek盜用我們的模型 | 國際焦點 - 太報 TaiSounds
中國新創企業的DeepSeek AI引擎,對美國矽谷解造成大震撼,因為號稱用幾十分之一的成本、很少的算力就能達到與業界龍頭OpenAI同等級的成果。《金融時報》報導,OpenAI內部人士指出,他們有證據顯示DeepSeek使用「蒸餾」(distillation),盜用OpenAI的成果。 ...
![[圖]](https://image.taisounds.com/newsimages/img/2025/0129/6934f728bdcc4e59898ad9217d67de3f.jpg)
發布時間:
2025-01-29 15:10 / 作者 陳家齊
原文內容:
中國新創企業的DeepSeek AI引擎,對美國矽谷造成大震撼,因為號稱用幾十分之一的成本
、很少的算力就能達到與業界龍頭OpenAI同等級的成果。《金融時報》報導,OpenAI內部人
士指出,他們有證據顯示DeepSeek使用「蒸餾」(distillation)的技巧,盜用OpenAI的成
果。
、很少的算力就能達到與業界龍頭OpenAI同等級的成果。《金融時報》報導,OpenAI內部人
士指出,他們有證據顯示DeepSeek使用「蒸餾」(distillation)的技巧,盜用OpenAI的成
果。
「蒸餾」這個技法是AI開發者常用的技術,這是利用其他更大AI模型所計算輸出的結果,訓
練自己開發中的較小AI模型。如果《金融時報》的報導獲得證實,則DeepSeek可以用極低算
力、極低成本達成媲美OpenAI等級的成果,就不再是個謎:DeepSeek等於是寄生在OpenAI身
上,自然不必自己投入大成本建構算力。
練自己開發中的較小AI模型。如果《金融時報》的報導獲得證實,則DeepSeek可以用極低算
力、極低成本達成媲美OpenAI等級的成果,就不再是個謎:DeepSeek等於是寄生在OpenAI身
上,自然不必自己投入大成本建構算力。
OpenAI的服務條款規定,使用者不得「複製」其任何服務,或「使用OpenAI的輸出結果來開
發與OpenAI 競爭的模型」。DeepSeek若利用了OpenAI開發出DeepSeek-R1這個震驚各界、和
OpenAI競爭的模型,就違反了使用條款。
發與OpenAI 競爭的模型」。DeepSeek若利用了OpenAI開發出DeepSeek-R1這個震驚各界、和
OpenAI競爭的模型,就違反了使用條款。
據另一名知情人士透露,OpenAI 及其合作夥伴微軟去年秋天調查了據信屬於DeepSeek的帳
戶,這些帳戶使用了OpenAI的API(應用程式介面),以違反服務條款的方式進行蒸餾,遭
到封鎖。這些調查最早由彭博新聞報導。
戶,這些帳戶使用了OpenAI的API(應用程式介面),以違反服務條款的方式進行蒸餾,遭
到封鎖。這些調查最早由彭博新聞報導。
DeepSeek表示,其V3 AI模型僅使用2048張輝達H800顯示卡,只花費560萬美元進行訓練,擁
有6710億個參數,成本僅為OpenAI和Google類似規模模型的幾十分之一。
部分專家指出,DeepSeek模型的輸出結果,顯示其可能接受過OpenAI GPT-4輸出的內容訓練
,這違反OpenAI的服務條款。業界人士指出,在中國和美國的AI實驗室中,使用來自OpenAI
等大型AI企業的輸出進行訓練是常見做法,較小型的企業往往藉此「搭便車」。
,這違反OpenAI的服務條款。業界人士指出,在中國和美國的AI實驗室中,使用來自OpenAI
等大型AI企業的輸出進行訓練是常見做法,較小型的企業往往藉此「搭便車」。
對於OpenAI這些最前線的AI模型開發公司而言,他們必須耗費金錢與心力搭建龐大的算力中
心,接受人工輸入的反饋,以訓練出更好的AI模型。這個過程耗時而且非常昂貴。
加州柏克萊大學(UC Berkeley)AI博士生古普塔(Ritwik Gupta)表示:「新創公司和學
術界普遍會使用商業化的大型語言模型(LLM),像是ChatGPT的輸出,來訓練自己的模型。
這樣一來,他們便能免費獲得人類回饋訓練的結果。我不會驚訝DeepSeek採用了相同方法。
如果確實如此,要完全杜絕這種做法可能相當困難。
術界普遍會使用商業化的大型語言模型(LLM),像是ChatGPT的輸出,來訓練自己的模型。
這樣一來,他們便能免費獲得人類回饋訓練的結果。我不會驚訝DeepSeek採用了相同方法。
如果確實如此,要完全杜絕這種做法可能相當困難。
心得/評論:
幾天之內 一下捧上天 一下又人人攻擊
還好台股過年可以停看聽一下
不然差點 DeepSeek引力抓不住你
----
Sent from BePTT on my Google Pixel 6
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.215.56.15 (臺灣)
※ 作者: ng101281 2025-01-29 21:03:16
※ 文章代碼(AID): #1dcYSOUf (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1738155800.A.7A9.html
噓 : Close Ai輸不起就別玩1F 01/29 21:04
推 : 中又贏 遙遙領先 遙遙領先2F 01/29 21:04
推 : 穩了3F 01/29 21:04
推 : 抗議 他學我?4F 01/29 21:04
推 : 這又是哪家野雞雜誌5F 01/29 21:05
推 : 有一群人崩潰精神錯亂了6F 01/29 21:05
噓 : 等等 盜用?要不要先定義什麼是盜用7F 01/29 21:05
噓 : 等等這串所有的中國id 通通水桶8F 01/29 21:07
※ 編輯: ng101281 (49.215.56.15 臺灣), 01/29/2025 21:08:11推 : 人家有明文規定不能拿API來訓練模型吧?9F 01/29 21:08
→ : 蒸餾不等於盜用10F 01/29 21:08
→ : 然後蒸餾不代表成績就會好
→ : 最後是蒸餾在現行法律不違法
→ : 然後蒸餾不代表成績就會好
→ : 最後是蒸餾在現行法律不違法
![[圖]](https://i.imgur.com/Wgh1BHFh.png)
推 : google表示以後搜尋引擎自己開發不要用我的CC14F 01/29 21:09
![[圖]](https://i.imgur.com/3c1frTPh.png)
推 : 美國輸不起 好扯==16F 01/29 21:09
→ : 只有我覺得結果是如何根本不重要嗎17F 01/29 21:10
推 : 兩天就翻車,比黑悟空還快~18F 01/29 21:11
→ : 大紀元還是新唐人?19F 01/29 21:12
→ : '蒸餾'又是哪個文組發明的詞??20F 01/29 21:12
噓 : 急了.jpg21F 01/29 21:12
推 : 牆倒眾人推22F 01/29 21:13
推 : 買空賣空 所以只能算是一支介面程式23F 01/29 21:13
→ : 這樣玩就能贏!那OPENAI真的爛CC24F 01/29 21:14
推 : 原本就打算美國1個人可以寫10個人程式,中國再會9925F 01/29 21:15
→ : 6也贏不了。
→ : 6也贏不了。
→ : 蒸溜是專業術語好嗎27F 01/29 21:17
→ : 把證據拿出來阿= =28F 01/29 21:18
→ : 可能也知道也可能告不贏或者告了也不能怎樣,但也算29F 01/29 21:19
→ : 一種表態、證明
→ : 一種表態、證明
→ : 等等支那賤畜韭菜們會出來洗地XD31F 01/29 21:19
推 : 我也覺得distill直接翻蒸餾很搞笑32F 01/29 21:21
推 : 中國玩得真溜~~33F 01/29 21:21
推 : 不意外34F 01/29 21:22
→ : 以前好像就有人翻譯用蒸餾了35F 01/29 21:22
→ : distill學術界很常用阿36F 01/29 21:22
→ : 不論有沒有盜用 肯定的是 ds也是得靠前人研究成果37F 01/29 21:22
→ : 才能再進步
→ : 才能再進步
推 : 垃圾支那不意外 還一堆低能兒在吹39F 01/29 21:23
→ : 聽起來像是稱讚DS的自我監督技巧有效40F 01/29 21:24
→ : OpenAI的TOS是真的有說不能用ChatGPT的結果來訓練別41F 01/29 21:25
→ : 的AI 但之前有判例完全由AI產的東西沒有Copyright
→ : 應該是告不太成
→ : 的AI 但之前有判例完全由AI產的東西沒有Copyright
→ : 應該是告不太成
噓 : 笑死44F 01/29 21:26
→ : 所以證據要公佈了嗎?還是苦無?45F 01/29 21:26
推 : 美國輸不起 笑死46F 01/29 21:26
推 : 要告google就告拉CC47F 01/29 21:26
→ Wand …
推 : 拉回就是跟你買的 很多人搞不清楚 還在泡沫49F 01/29 21:27
推 : 程式碼完全開源 找一下就可以知道哪條程式碼在搞鬼50F 01/29 21:27
推 : 輸不起翻桌51F 01/29 21:27
推 : 笑死 有人看不懂就說人文組52F 01/29 21:28
推 : 開始抹黑了,熟悉的套路XDD53F 01/29 21:28
推 : DS自己有講有用開源AI訓練!不只OPENAI54F 01/29 21:28
推 : 那如果是這樣頂尖AI公司也沒有技術護城河,隨便都55F 01/29 21:28
→ : 可以被蒸餾也沒辦法禁止這樣誰還要花大錢去訓練,
→ : 而且在中國根本無法可管
→ : 可以被蒸餾也沒辦法禁止這樣誰還要花大錢去訓練,
→ : 而且在中國根本無法可管
噓 : 北七 一堆AI都馬盜用你的東西怎不說58F 01/29 21:28
→ : 你們的人 要不要打一架 風向很亂59F 01/29 21:28
推 : 蛤?是不是真的怕了?60F 01/29 21:29
![[圖]](https://i.imgur.com/zu8RQACh.jpeg)
推 : 你自己生成式AI沒盜用網路上圖文創作內容?62F 01/29 21:30
推 : 其實這一直是有問題的地方 到底AI公司隨便抓資料訓63F 01/29 21:30
→ : 練版權問題到底該怎麼算?
→ : 練版權問題到底該怎麼算?
推 : 那openAI乾脆開放給大家既然沒辦法防止65F 01/29 21:31
推 : 這樣就可以名正言順的 美國封鎖中國軟體了66F 01/29 21:31
推 : 管你的!當然爽爽免費用最好阿XD67F 01/29 21:31
推 : 急了68F 01/29 21:33
噓 : 這不就鄉民常用的跟我想的一樣?69F 01/29 21:33
![[圖]](https://i.imgur.com/A0TL3C8.jpeg)
DeepSeek FAQ – Stratechery by Ben Thompson
DeepSeek has completely upended people’s expectations for AI and competition with China. What is it, and why does it matter? ...
![[圖]](https://i0.wp.com/stratechery.com/wp-content/uploads/2018/03/cropped-android-chrome-512x512-1.png?fit=512%2C512&ssl=1)
→ : 使用蒸餾的情況跟AI未經授權抓資料來訓練不一樣吧?72F 01/29 21:33
→ : 美國就閉源啊!開源還怕人家用!就關門自己玩CC73F 01/29 21:34
→ : 作者有提到 distillation 讓先出的 model 頗吃虧74F 01/29 21:34
→ : 只要你資料是來自於其它地方 就是會有問題75F 01/29 21:34
→ : 除非你有一個一個的去跟資料擁有者拿版權
→ : 除非你有一個一個的去跟資料擁有者拿版權
→ xzcb2008 …
→ : 但這幾乎沒有一間AI公司做到 版權到底怎麼算78F 01/29 21:35
→ xzcb2008 …
→ : OpenAI Meta Google xAI一眾都有問題80F 01/29 21:35
推 : 所以證明是真的但是是抄你們的?81F 01/29 21:36
推 : 所以這種東西就是沒有技術護城河,你砸錢也沒辦法82F 01/29 21:36
→ : 防止被偷,而且那些東西本來就來自普羅大眾
→ : 防止被偷,而且那些東西本來就來自普羅大眾
→ : 我猜以後 OpenAI 再出更強的 model 可能就不放出來84F 01/29 21:36
→ : 給每個人用了 變成要用的公司分別來簽約了
→ : 給每個人用了 變成要用的公司分別來簽約了
→ : 拿他們的東西作訓練 也有問題86F 01/29 21:36
推 : 蒸餾是深度學習的技巧 不懂的文組不要亂叫可以嗎…87F 01/29 21:36
→ : 但我看大概也沒人管 沒辦法管吧88F 01/29 21:36
推 : 中國不意外89F 01/29 21:36
噓 : 內部人士是誰啊 要放話就公司公開宣告啊90F 01/29 21:37
→ : 證明是蒸餾的話,可以說這種模式本就會省時省力,就91F 01/29 21:37
推 : 感覺說愈多愈顯得...92F 01/29 21:37
推 : 理組申請蒸餾專利了?93F 01/29 21:37
→ : 可以跟金主跟美國政府表示我們不是在浪費錢砸算力94F 01/29 21:38
推 : 上次騰訊才把別人的程式碼整個copy回來用被抓包。算95F 01/29 21:38
→ : 了吧
→ : 了吧
噓 : 中又贏麻97F 01/29 21:38
→ xzcb2008 …
推 : 蒸餾不是支語99F 01/29 21:39
推 : ai公司 網路上一直撈資料 也沒問過人阿~100F 01/29 21:39
→ xzcb2008 …
推 : 要回噴了!!!102F 01/29 21:41
→ : 這是做空嗎?盜用還是內賊差很多,盜用的話open ai103F 01/29 21:41
→ : 麻煩可大了。
→ : 麻煩可大了。
→ : 撈資料跟蒸餾雖然都可以說是未經允許,但本質上不同105F 01/29 21:42
推 : Transformer 開發團隊表示:那我是不是...欸?!106F 01/29 21:42
推 : 很難證明吧 這史無前例107F 01/29 21:42
推 : 不是有人說次DS是開源的勝利!有點意思CC108F 01/29 21:42
推 : ds開源 道德上已經占盡優勢了109F 01/29 21:43
→ : 有點不洽當比方,撈資料是撈食材,蒸餾是學烹飪技巧110F 01/29 21:43
→ : 我沒私藏 大家一起成長111F 01/29 21:43
→ : Ds 幫openai 開源 潮到出水112F 01/29 21:44
→ : 那個內部人士 不敢具名 87113F 01/29 21:44
推 : OpenAI也挖了不少中國網頁的資料吧114F 01/29 21:44
→ : 歡迎COPY115F 01/29 21:44
推 : 輸不起,翻桌了116F 01/29 21:45
推 : 急了117F 01/29 21:45
![[圖]](https://i.imgur.com/gBzps4Ah.png)
噓 : 中吹崩潰了119F 01/29 21:45
→ : 你信誰囉120F 01/29 21:45
噓 : 白豬又要耍賴了 哭R121F 01/29 21:47
推 : 呵。那人家成本低是事實也是青出於藍122F 01/29 21:47
推 : 對岸也沒再管版權的123F 01/29 21:47
推 : 這是做新聞給股市看的吧124F 01/29 21:48
→ : 偷了魔改 你能怎樣125F 01/29 21:48
推 : 確實也管不到對岸,嘻嘻126F 01/29 21:48
推 : 支那要人要崩潰了 吹2天的泡泡就破了127F 01/29 21:49
→ : 當初鴻蒙不是就replace不夠乾淨嗎?128F 01/29 21:49
推 : Jordan表示:first time?129F 01/29 21:50
推 : 早說了 詐騙垃圾130F 01/29 21:51
→ : ds就是垃圾131F 01/29 21:52
→ : 就算是也沒辦法怎樣吧 中國有在怕的嗎132F 01/29 21:54
推 : 我比較喜歡翻成「雙修」133F 01/29 21:54
→ : 這應該會是川普決心玩死中國的最後一根稻草134F 01/29 21:56
推 : 開源程式直接拿來驗證就知道了135F 01/29 21:57
推 : 中國人不意外136F 01/29 21:58
→ : 中國哪個東西不是偷來的 學術界本來就特別寬容中國137F 01/29 21:58
→ : 的盜竊行為
→ : 的盜竊行為
→ : 駐版台吹興奮了139F 01/29 22:01
推 : Open AI 沒有Open ,太陽餅裡面沒有太陽。140F 01/29 22:01
噓 : 誰玩誰還不知道XDD141F 01/29 22:02
推 : 看人解釋DS,本來裡面就公開說是用蒸餾的啊142F 01/29 22:04
推 : 蒸餾就是違反OpenAI使用守則啊 就是偷啊 就不是他143F 01/29 22:07
→ : 們在吹的”從零開始”
→ : 們在吹的”從零開始”
推 : 等下就告訴你誰崩潰囉145F 01/29 22:08
推 : 不意外 中國那次遙遙領先不是這樣146F 01/29 22:08
→ : 遙遙領先 中或贏 雙贏就是中國贏兩次147F 01/29 22:12
→ : OPENAI的金主爸爸微軟不缺錢吧148F 01/29 22:12
推 : 蒸餾代表你省去從海量垃圾資料去判斷的過程149F 01/29 22:16
推 : 又要抽稅了嗎150F 01/29 22:16
推 : 還沒上車啊,別那麼快恢複151F 01/29 22:18
推 : 呃...DS員工那對話...是在證實他的AI輸出都幻覺嗎152F 01/29 22:19
→ : 哪個內鬼截這白癡圖啊?應該是假的
→ : 哪個內鬼截這白癡圖啊?應該是假的
噓 : 輿論一條龍來了 可憐啊154F 01/29 22:20
噓 : 重新定義盜用?155F 01/29 22:21
噓 : 滯台支那人急著洗地中156F 01/29 22:21
推 : 現在哪個AI沒有幻覺 推薦一下157F 01/29 22:23
→ : 1500excel 即時感158F 01/29 22:24
→ : OpenAI的轉錄語音的都有Whisper了159F 01/29 22:24
→ : whisper模型 幻覺
→ : whisper模型 幻覺
→ : 中國人用英文寫程式 怎樣都是抄襲英美161F 01/29 22:25
→ : 那是TG公開頻道162F 01/29 22:26
推 : 用你的連結套個皮就是新的AI了,中國式創新163F 01/29 22:28
推 : 中國豬: 輸不起啦 ~~~164F 01/29 22:34
![[圖]](https://i.imgur.com/wMkV5yPh.jpeg)
推 : 美國公司怕了XD,不過中國應該不屌才對167F 01/29 22:35
→ s10112 …
→ : 中國不偷才是新聞吧169F 01/29 22:41
噓 : 中國意外嗎?騙、偷、搶樣樣來170F 01/29 22:47
噓 : 不知道要說啥,我是覺得不用一直洗一直洗一直洗一171F 01/29 22:49
→ : 直洗一直洗一直洗一直洗一直洗一直洗一直洗一直洗
→ : 一直洗一直洗一直洗一直洗一直洗一直洗一直洗一直
→ : 洗一直洗一直洗一直洗一直洗一直洗
→ : 直洗一直洗一直洗一直洗一直洗一直洗一直洗一直洗
→ : 一直洗一直洗一直洗一直洗一直洗一直洗一直洗一直
→ : 洗一直洗一直洗一直洗一直洗一直洗
推 : 哪個內部人士?笑死175F 01/29 22:49
推 : 說一直洗的搞笑人士不如趕快把ChatDPP弄回來啊176F 01/29 22:51
→ : 不知道要說啥 改說說廢物唐部長拿兩百億做什麼垃圾
→ : 不知道要說啥 改說說廢物唐部長拿兩百億做什麼垃圾
噓 : 一堆無腦言論 一堆公開paper都在做 連Google都在玩178F 01/29 22:54
→ : 蒸餾本來就是正常的模型壓縮技術 只是這次ds做的特
→ : 好
→ : 蒸餾本來就是正常的模型壓縮技術 只是這次ds做的特
→ : 好
推 : 看不懂這是在炒股的搞笑人士請不要又泛政治化…這181F 01/29 23:23
→ : 就是在話題炒股,韭菜不要在那邊什麼都要滑坡好嗎
→ : ==
→ : 就是在話題炒股,韭菜不要在那邊什麼都要滑坡好嗎
→ : ==
→ : 綠蝇精神勝利法 很在意台灣輸慘XD184F 01/29 23:24
推 : 如果繼續蒸餾下去 硬體成本是不是會變越低就能達成185F 01/29 23:26
推 : 哇靠我還左轉出去看吧我是不是在股版,奇怪了明明186F 01/29 23:27
→ : 是在討論股票的事情,係咧==
→ : 是在討論股票的事情,係咧==
推 : 那明天劇本是 deepsuck188F 01/29 23:59
推 : 這次……兩天?……果然還是無視就好189F 01/30 00:09
→ : 多蛙丸子190F 01/30 00:18
噓 : 哈哈哈.果然是畝產萬斤糧的翻版,什麼最節省成本..191F 01/30 00:48
→ : 大家都是這樣做的好嗎?192F 01/30 00:53
→ : 嘻嘻 就說你是抄的 有美國可以抄襲 中國要懂的感激193F 01/30 00:54
推 : 中吹又要森七七了194F 01/30 02:08
→ : 現在最燒屁股的是星門專案吧,投資機構一個閃現就變195F 01/30 03:12
→ : 閉門專案
→ : 閉門專案
推 : 結果還真的被說對了?柵欄仔又翻了?197F 01/30 06:53
→ : 學術研究的paper用蒸餾沒問題啊,但是你DS是商業化198F 01/30 09:31
→ : 的app
→ : 的app
推 : 開源免費的 什麼商業化zz200F 01/30 10:36
推 : 他抄襲我的髮型201F 01/30 15:32
--
※ 看板: Stock 文章推薦值: 0 目前人氣: 0 累積人氣: 68
作者 ng101281 的最新發文:
- 微博一直呼喊大S老婆 都忘記他現任老婆了嗎 內心其實還是愛著大S嗎 還是已經傷心到瘋了 Sent from JPTT on my Google Pixel 6.129F 52推 20噓
- 美國總統川普下令4日起將對中國、加拿大、墨西哥徵關稅,貿易戰2.0風雨欲來。經濟部表示,近年在供應鏈重組趨勢下,台廠赴墨投資家數已超過300家,以EMS、機械和汽車零組件為主,將持續關注美方政策後續發 …327F 166推 11噓
- 剛剛客機直升機相撞事故 川普記者會直播,大概聽了一下: 川普: FAA政府部門應該僱用最聰明最傑出的人來領導,而不是根據種族來挑選。 根據DEI挑選的人 反而還會害他們短命,因為壓力太大。 從歐巴馬 …351F 163推 15噓
- 中國新創企業的DeepSeek AI引擎,對美國矽谷造成大震撼,因為號稱用幾十分之一的成本 、很少的算力就能達到與業界龍頭OpenAI同等級的成果。《金融時報》報導,OpenAI內部人 士指出,他們 …201F 90推 19噓
點此顯示更多發文記錄
→
guest
回列表(←)
分享