作者 lucien0410 (lucein)
標題 Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高
時間 Mon Jan 27 12:25:51 2025


總覺得這個橫空出世的deepseek有點貓膩

像LDPC大所說 感覺好像真的用了openai 的ChatGpt的數據來創造訓練資料 但openAI很難
證明自己的東西被偷了

我去看了一下deepseek的python api怎麼用
很有趣 結果deepseek用的是 openai的library  https://api-docs.deepseek.com/

``
# Please install OpenAI SDK first: pip3 install openai

from openai import OpenAI

client = OpenAI(api_key="<DeepSeek API Key>", base_url="https://api.deepseek.c
om")

response = client.chat.completions.create(
    model="deepseek-chat",
    messages=[
        {"role": "system", "content": "You are a helpful assistant"},
        {"role": "user", "content": "Hello"},
    ],
    stream=False
)

print(response.choices[0].message.content)
``

難道OpenAI裡面出了個中國間諜?








※ 引述《LDPC (Channel Coding)》之銘言:
: 目前就在旁邊吃瓜觀望@@ 成本這種本就是用開源後的可以拿已有的模型去當輔助下降
成?
: 最常見作法就是拿gpt-4o當judge或者當數據產生器 去精煉數據集 如果再沒有gpt-4o
: 情況下 很多高質量資料去產生就花很錢 最經點例子就是LLaVa 一個博士班學生 用gpt
-4
: 去產生高質量多模態數158k 極小量數據集 用8xA100 1天時間 就幹爆之前所有
: 多模態大模型 能打贏saleforce的一間大公司堆出來的多模態BLIP-2模型
: 這傢伙精髓站就是在gpt-4模型巨人的肩膀上
: 資料的quality會影響大模型 而資料可以透過開源高質量模型去萃取
: 如果再套用COT 這些都可以繼續進化 paper有些細節像是數據集這類如何精煉
: 反而可能會是一個重要一環 但大家都會藏這類細節 @@/
: 2025現在大家都殺到LLM Agent去了 LLM刷模型任務分數熱潮有點下降
: 大部分都跑去搞LLM決策部分 和COT (思考鏈) 多步驟分析任務
: 像是waymo自駕端對端的決策都搞了一個EMMA 用Gemini 去往上蓋
: (這時候自駕公司有自己的很強的LLM就很有用了 隨手不負責預測亞麻zoox會拿自家
: LLM或anthropic來搞end-2-end多模態)
: 然後LLM Agent如果要放在機器人和自駕
: 一定得on-device 因為雲端延遲太慢 風險高 所以1B~4B這陣子的on-device模型
: 能力也在不斷突破 所以on-device LLM不太會在是AI-PC 除非是屬於私密資料等應用場

: 而edge/on-devcie AI 可能突破點會在機器人
: 自駕的趨勢之後會跟LLM走上同陣線 在某個時間點 等閉源LLM開始時 就是差不多AI模

: 的盡頭開始產業化 也許端對端LLM決策 可以強化視覺上標籤數據不足 (不確定這點
: 但直覺上認為 思考練LLM Agent可以降低場景車用數據量..QQ 基於模型泛化能力)
: 這會給其他車廠追上特斯拉的機會 特斯拉自身的LLM可來自grok 而3D基礎模型
: foundation model 像是李飛飛的空間模型 有一定機會能幫助自駕 可以直接融合LLM
: 產生端對端多模態 而李飛飛又跟狗家走很近 所以想單賭個股 可以賭賭看狗家

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 67.150.123.92 (美國)
※ 作者: lucien0410 2025-01-27 12:25:51
※ 文章代碼(AID): #1dbmhL5E (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1737951957.A.14E.html
LDPC: =_= https://reurl.cc/vp2dgj 請大大刪上推文1F 01/27 12:29

你才是大大 改好了 :)
lucien0410: wow2F 01/27 12:29
※ 編輯: lucien0410 (67.150.123.92 美國), 01/27/2025 12:30:35
musie: 哪裡來的菜雞 OpenAI的lib已經是standard protocolhttps://ai.google.dev/gemini-api/docs/openai3F 01/27 12:30

 
dosiris: 開源還想賺錢 哪個開源軟件有賺錢5F 01/27 12:30
Brioni: 你這個AI圈的人應該都知道了,以為只有你知道?6F 01/27 12:31
sali921: 開源的也沒啥阿7F 01/27 12:31
ggian123: 相信股板AI大師 一定是抄的偷的 我們知道天安門8F 01/27 12:32
qwe78971: 是不是菜雞啊 到底知不知道自己在打啥文章9F 01/27 12:33
lucien0410: 我的確是菜啊 m大分享知識 感恩10F 01/27 12:34
Samurai: 不懂沒關係,不要亂講吧11F 01/27 12:35
TaiwanUp: 不是啦 是DeepSeek裡面有大巨人在運作啦12F 01/27 12:35
Brioni: 著眼點不同,大神研究模型算法跟效能,有些人只關注訓練過程有沒有記得輸入天安門….13F 01/27 12:35
TaiwanUp: 這樣也被你發現15F 01/27 12:36
dosiris: 說不定華西街不知道 求記者報導16F 01/27 12:41
lucien0410: 我問 “可以談談為什麼毛澤東要發動文化大革命嗎”他叫我別聊這個 聊別的 太有趣XD17F 01/27 12:41
dongdong0405: 笑死這篇超菜 那已經是通用的接口格式了19F 01/27 12:45
matlab1106: 美國大廠肯定沒請到原po這種人才XD20F 01/27 12:47
ksjr: ==只是一個名稱而已21F 01/27 12:55
holebro: 笑死22F 01/27 13:03
tonsofdamage: 笑死,六四天安門不能問23F 01/27 13:13
lionel20002: 菜爆www24F 01/27 13:14
previa: 北七,就Restful接口標準化,根boto3去兼容aws一樣連openstack最後都要把api接口做的跟aws兼容
你不懂還要硬說人抄襲?25F 01/27 15:48
s1612316: 當你發現的時候 是不是覺得贏過世界上頂尖工程師了28F 01/27 16:48
bleeza: 你都發現了,怎麼不做一個台灣人版的deepseek呢?29F 01/27 17:37
s213092921: 你是電你是光,你是唯一的神話30F 01/27 18:03
tangolosss: 算到8964就自動當機  這種AI誰敢用??  笑死  XDDDDD31F 01/27 18:16

--
作者 lucien0410 的最新發文:
點此顯示更多發文記錄