看板 Stock作者 andy3021515 ()標題 [新聞] OpenAI:已掌握DeepSeek盜用模型證據時間 Wed Jan 29 21:37:22 2025
中央社
OpenAI:已掌握DeepSeek盜用模型證據
2025/1/29 20:59(1/29 21:17 更新)
https://www.cna.com.tw/news/aopl/202501290140.aspx
(中央社倫敦29日綜合外電報導)中國新創公司「深度求索」(DeepSeek)引發的疑慮日
增。OpenAI今天表示已掌握證據,顯示DeepSeek盜用其模型進行開發;業界也指DeepSeek
握有大量輝達H100高階晶片,形同直接挑戰美國出口管制規定。
中國的DeepSeek因標榜低成本也能訓練出強大人工智慧(AI)模型,顛覆AI訓練不能沒有
精密昂貴晶片的刻板印象,引發市場強烈震盪。
不過,總部設在美國舊金山(San Francisco)的OpenAI公司向英國「金融時報」(
Financial Times)證實,已掌握疑似DeepSeek利用「蒸餾」(distillation)技術的證
據。OpenAI是聊天機器人ChatGPT的開發商。
蒸餾技術可讓開發者利用更大、更強的模型輸出成果,在較小模型獲得更出色的表現,並
讓他們在特定任務上以更低廉的成本得到類似結果。
儘管蒸餾是AI業界常見做法,但DeepSeek若利用蒸餾技術來打造自家模型,並與OpenAI競
爭,將違反OpenAI服務條款,因此產生疑慮。
OpenAI婉拒進一步說明或提供證據細節。根據該公司的服務條款,用戶不得「複製」任何
OpenAI的服務,或是「利用輸出結果,來開發與OpenAI競爭的模型」。
彭博(Bloomberg News)28日引述知情人士說法報導,微軟(Microsoft)和OpenAI正在
調查一群與DeepSeek有關聯的人是否以未經授權的方式,不當取得OpenAI技術輸出的資訊
。
報導指,微軟維安研究員2024年秋天觀察到有人利用OpenAI應用程式介面(API)輸出大
筆數據,他們認為這些人可能與DeepSeek有關。
美國總統川普政府的AI專家塞克斯(David Sacks)也在福斯新聞(Fox News)訪談中提
及蒸餾技術,並稱有「大量證據」顯示DeepSeek是仰賴OpenAI模型輸出,以協助開發自家
技術,但他也沒有進一步提出證據。
另一方面,美國Scale AI執行長汪滔(Alexandr Wang)日前表示,DeepSeek應握有多達5
萬顆輝達(Nvidia)H100晶片,以開發現有模型。美國億萬富豪馬斯克(Elon Musk)也
在社群平台X回應相關推文,並加上「顯而易見」的評論,似乎同意這項說法。
由於H100晶片被禁止向中國出口,這形同直接挑戰美國出口管制政策。有分析直指,
DeepSeek繞道囤積大量晶片以規避美國管制,因此其真實開發成本恐怕遠高於宣稱的558
萬美元(約新台幣1.83億元),未來也勢必將引發美方加強管制。(譯者:楊昭彥/核稿
:施施)1140129
心得/評論:
彭博又是哪裡來的野雞雜誌,我們Deepseek 最強啦
nvidia 股價溜滑梯到底了嗎
如果這是真的
那代表這幾天的新聞不過就是中國的大外宣
跟韓國的室溫超導體,中國的雲巴智軌一樣
喊得很大聲,做出來的不過就那樣
--
https://i.imgur.com/lgd6KYR.jpg https://i.imgur.com/LZubvsy.jpg
https://i.imgur.com/lNyXE2Y.jpg https://i.imgur.com/XwEt1Ds.jpg
https://i.imgur.com/BhNMV1m.jpg https://i.imgur.com/EGkv9Yy.jpg
https://i.imgur.com/fM7VVSC.jpg https://i.imgur.com/Lw2DDyz.jpg
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 106.64.82.233 (臺灣)
※ 作者: andy3021515 2025-01-29 21:37:22
※ 文章代碼(AID): #1dcYyNnN (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1738157847.A.C57.html
※ 同主題文章:
[新聞] OpenAI:已掌握DeepSeek盜用模型證據
01-29 21:37 andy3021515
推 c1951: 看來準備要進入美國白宮嚴選節奏的下一家中國公司3F 01/29 21:39
推 Kobe5210: 峰迴路轉,真相大白,台股躲崩成功?5F 01/29 21:41
推 Fezico: 是不是一堆人被套爛了,笑死8F 01/29 21:41
推 abc21086999: 裡面引述金融時報啊,金融時報這麼名不見經傳
什麼野雞小報9F 01/29 21:42
→ Fezico: 先不管真假,OpenAI每天開門都在燒錢盈利不起來11F 01/29 21:42
推 Lecwei: 愛支病的人崩潰了16F 01/29 21:45
→ liscp: 恩…有待商榷18F 01/29 21:45
推 gary4: 豬隊友阿里巴巴表示:我也會 我也會!選我選我!19F 01/29 21:46
推 okderla: 為什麼一定要用NV的晶片,難道我們祖國開發不出來嗎?21F 01/29 21:47
咱們中特有制度的優越性,東升西降
美國打著所謂民主的幌子,剝奪中國正當發展的權利,無疑是在搬石頭砸自己的腳
中國或成最大贏家
推 Axwell: 標題的盜用是指蒸餾技術嗎23F 01/29 21:48
※ 編輯: andy3021515 (106.64.82.233 臺灣), 01/29/2025 21:53:39
推 cvnn: 講結論 罵完之後呢?24F 01/29 21:48
→ vltw5v: 感覺美國真的急了25F 01/29 21:48
→ Axwell: 而且openAI在意的點是「競爭」
標題怎麼會用盜用啊?27F 01/29 21:49
噓 spen2005: 論文不就有說他們是用distillation33F 01/29 21:51
噓 tsukirit: 美國公司向英國媒體證實,誰? 名字不敢說喔34F 01/29 21:51
→ spen2005: 還是某些人的標準 finetune是盜用 distillation 也是盜用 那以後大家就從頭開始train好了36F 01/29 21:52
→ spen2005: DeiT 也是從ViT distill來的 要不要調查一下39F 01/29 21:53
→ set852064: 怎麼標題聽著像白宮:已掌握大規模毀滅性武器XD41F 01/29 21:53
推 abc21086999: 阿OpenAI有允許你拿他們產出的資料拿去蒸餾?
這邏輯跟某些自己想怎樣就怎樣的政黨很像啊43F 01/29 21:54
推 tenshou: 整篇想看看是不是有點什麼證據結果全都是猜測45F 01/29 21:55
→ ramirez: 抓到了!!!!!!!!!!!!!!!48F 01/29 21:56
推 patrol: 可是如果真的很強,為什麼不藏著開發要丟出來,不就想讓人以為中或贏?49F 01/29 21:57
噓 IBIZA: OpenAI又沒開源 也沒辦法部屬, 只能透過API取得
結果做蒸餾, 要用這種方法做蒸餾, 可能要call API幾千萬甚至幾億次53F 01/29 21:59
→ IBIZA: OpenAi有這樣大量取用的紀錄?58F 01/29 21:59
→ wonlylove: 百度早期的翻版,完全不意外,把google 轉向百度,就是百度搜尋引擎的原型概念59F 01/29 21:59
→ IBIZA: 而且這樣做的token成本就嚇死人吧61F 01/29 22:00
推 gbman: OPENAI有舊模型拉!真的偷用就像你講的CC62F 01/29 22:00
→ IBIZA: 舊模型有開放給外界部屬嗎?
而且 舊模型的話 能力應該差很多吧
用舊模型做蒸餾只能得到垃圾吧
蒸餾理論上只能得到較差的結果63F 01/29 22:00
→ gbman: OPENAI為啥取這名!當然有開放過啊!只是很舊版CC67F 01/29 22:01
→ IBIZA: 你要得到一個介於ChaGPT4跟o1的模型
你一定要用o1做蒸餾吧
我不知道到底是幾版 但舊版拿來做蒸餾只能得到垃圾68F 01/29 22:01
→ gbman: DS真的偷用你又拿拿他如何!禁止他使用而已CC72F 01/29 22:03
→ wonlylove: 讓 deepseek 去調用 Open AI 資源就是在用你的魔法打敗你73F 01/29 22:03
→ IBIZA: 不是拿他如何啊 如果DS真的用API做蒸餾
OpenAI應該賺翻了吧
其實我把這個問題問過chatgpt
他也同意用API做蒸餾的話需要百萬次甚至億次的調用成本會很驚人75F 01/29 22:03
→ gbman: 他可拿舊版的用拉!有些資料會重疊的CC82F 01/29 22:04
→ IBIZA: 本人自己講的喔
舊版就不會有介於ChatGPT4跟o1的功力啊83F 01/29 22:04
→ IBIZA: 我剛剛請OpenAI給我蒸餾的建議86F 01/29 22:05
→ wonlylove: 以後算力主機一定是部署在阿拉斯加及格陵蘭等極寒之地89F 01/29 22:07
→ gbman: 拿來訓練用的不是直接介接過去拉CC91F 01/29 22:07
→ mystage: 其實這就不能說的秘密啦,每家都會偷用93F 01/29 22:07
→ IBIZA: 拿來訓練用 你就是要先調用API 得到老師模型對某個問題的解法94F 01/29 22:08
→ wonlylove: 演算法一定是天下文章一起抄,變成虛擬貨幣 token 的翻版96F 01/29 22:08
→ gbman: DS用的可多拉!開源的用了CC98F 01/29 22:08
→ IBIZA: 學生模型才能參考老師模型的結果 自行練習99F 01/29 22:08
推 artjio: 要盜用,是不是要能先能拿到Open AI的LLM模型,才能進行蒸餾? 但open ai沒有開放出來,所以只能透過API取得訓練模型的資料嗎562F 01/30 12:40
推 sid3: 嚇死了 等唐鳳破解565F 01/30 14:03
--