顯示廣告
隱藏 ✕
※ 本文轉寄自 ptt.cc 更新時間: 2025-01-24 23:45:50
看板 Stock
作者 Lushen (pttlushen)
標題 [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預
時間 Fri Jan 24 19:13:02 2025


原文標題:

Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預算難以解釋

原文連結:https://www.jiqizhixin.com/articles/2025-01-24-2
Meta陷入恐慌?内部爆料:在疯狂分析复制DeepSeek,高预算难以解释 | 机器之心 工程师正在疯狂地分析 DeepSeek,试图从中复制任何可能的东西。 ...

 

發布時間:2025/01/24

記者署名:機器之心

原文內容:

「工程師正在瘋狂地分析 DeepSeek,試圖從中複製任何可能的東西。」

DeepSeek 開源大模型的陽謀,切切實實震撼著美國 AI 公司。

最先陷入恐慌的,似乎是同樣推崇開源的 Meta。

最近,有 Meta 員工在美國匿名職場社群 teamblind 上面發布了一個貼文。貼文提到,國內 AI 新創公司 DeepSeek 最近的一系列動作讓 Meta 的生成式 AI 團隊陷入了恐慌,因為在前者的低成本高歌猛進下,後者無法解釋自己的超高預算的合理性。

原文如下:

這一切始於 DeepSeek-V3,它在基準測試中就已經讓 Llama 4 落後。更糟的是那個「擁有 550 萬訓練預算的不知名中國公司」。

工程師們正在瘋狂地分析 DeepSeek,試圖從中複製任何可能的東西。這一點都不誇張。


管理階層擔心如何證明龐大的生成式 AI 組織的成本是合理的。當生成式 AI 組織中的每個「領導」的薪資都比訓練整個 DeepSeek-V3 的成本還要高,而我們有好幾十個這樣的「領導」時,他們要如何面對高層?

DeepSeek-R1 讓情況變得更加可怕。雖然我不能透露機密信息,但這些很快就會公開。

這本來應該是一個以工程為重點的小型組織,但是因為很多人想要參與進來分一杯羹,人為地膨脹了組織的招聘規模,結果每個人都成了輸家。

https://i.imgur.com/hKZ6h5W.png
[圖]

貼文中提到的 DeepSeek-V3 和 DeepSeek-R1 分別發佈於 2024 年 12 月 26 日和 2025 年 1 月 20 日。

其中,DeepSeek-V3 在發佈時提到,該模型在多項評測成績超越了Qwen2.5-72B 和Llama-3.1-405B 等其他開源模型,並在性能和世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet 不分伯仲。

不過,更引人注目的是,這個參數量高達 671B 的大型語言模型訓練成本僅 558 萬美元。具體來說,它的預訓練過程竟然只用了 266.4 萬 H800 GPU Hours,再加上上下文擴展與後訓練的訓練,總共也只有 278.8 H800 GPU Hours。相比之下,Meta 的 Llama 3 系列模型的計算預算則多達 3930 萬 H100 GPU Hours—— 如此計算量足可訓練 DeepSeek-V3 至少 15 次。

https://i.imgur.com/mJn5POl.png
[圖]

而最近發布的 DeepSeek-R1 效能更猛 —— 在數學、程式碼、自然語言推理等任務上,它的效能比肩 OpenAI o1 正式版。而且模型在發布的同時,權重同步開源。很多人驚呼,原來 DeepSeek 才是真正的 OpenAI。 UC Berkeley 教授 Alex Dimakis 則認為, DeepSeek 現在已經處於領先位置,美國公司可能需要迎頭趕上了。

https://i.imgur.com/NLhp4Nj.png
[圖]

看到這裡,我們不難理解為何 Meta 的團隊會陷入恐慌。如果今年推出的 Llama 4 沒有點硬本事,他們「開源之光」的地位岌岌可危。

有人指出,其實該慌的不只 Meta,OpenAI、Google、Anthropic 又何嘗沒有受到挑戰。 「這是一件好事,我們可以即時看到公開競爭對創新的影響。」

https://i.imgur.com/gQ5fHDH.png
[圖]

還有人擔心起了英偉達的股價,表示「如果 DeeSeek 的創新是真的,那麼 AI 公司是否真的需要那麼多顯示卡?」

https://i.imgur.com/HIFcTx6.png
[圖]

不過,也有人質疑,DeepSeek 究竟是靠創新還是靠蒸餾 OpenAI 的模型取勝?有人回覆說,這可以從他們的發布的技術報告中找到答案。

https://i.imgur.com/HIFcTx6.png

目前,我們還無法確定貼文的真實性。

不知道 Meta 後續會如何回應,即將到來的 Llama 4 又會達到怎樣的表現。

心得/評論:

Meta工程師在TeamBlind(一個匿名的職涯討論區,需要經過公司Email驗證)爆料中國的DeepSeek對內部影響很大

DeepSeek R1訓練成本550萬美元 可能比一個Meta大頭的年薪還便宜

DeepSeek 這件事情也不光是中國自己在吹噓

看了一下 Twitter/Reddit 美國AI工業界、學術界反響非常大

DeekSeek 的母公司幻方量化產出 DeepSeek 的故事也在 Twitter 廣受討論

https://i.imgur.com/NLhp4Nj.png

DeepSeek R1 開源+論文公開應該會推進一波AI界的發展

DeepSeek 後續發展值得關注一下

--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.229.55.152 (臺灣)
※ 作者: Lushen 2025-01-24 19:13:02
※ 文章代碼(AID): #1datN1_K (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1737717185.A.FD4.html
pmes9866    : 中又贏1F 01/24 19:14

DeepSeek 訓練成本低+跑起來的成本極低(硬體需求)

自己實際使用體感不覺得他贏 OpenAI

不過以成本場景來說真的是巨大的創新

美國知名的 AI 分析機構 Artificial Analysis

對 DeepSeek 的成本分析

https://i.imgur.com/0GRkj6Q.png
[圖]

agassi001   : 股價該跌了吧2F 01/24 19:15
wts4832     : too good to be true3F 01/24 19:15
moom50302   : 贏了贏了都贏了4F 01/24 19:15
Plumpy      : 贏麻了5F 01/24 19:16
s1612316    : 花大錢還輸別人 是設備的問題還是人的問題6F 01/24 19:16
kenbbc12321 : ai本來就可以減少運算,達到一樣的效果7F 01/24 19:18
lpmybig     : 真實性先打問號8F 01/24 19:18

DeepSeek R1 程式碼、論文都開源+公開了

https://github.com/deepseek-ai/DeepSeek-R1
GitHub - deepseek-ai/DeepSeek-R1
[圖]
Contribute to deepseek-ai/DeepSeek-R1 development by creating an account on GitHub. ...

 

https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf
DeepSeek-R1/DeepSeek_R1.pdf at main ·  deepseek-ai/DeepSeek-R1 ·  GitHub
[圖]
Contribute to deepseek-ai/DeepSeek-R1 development by creating an account on GitHub. ...

 

appledick   : 美國484真的滿廢的9F 01/24 19:18
appledick   : 難怪只能靠制裁來贏人了
lc85301     : 美國的時代早就過去了11F 01/24 19:19
zhi5566     : 輸了就在砍人啊12F 01/24 19:19
kuosos520   : deepseek有開源,也有offline,鬼故事來了13F 01/24 19:20
aegis43210  : 因為西台灣為了管制,一堆問題不能回答,自然也不算14F 01/24 19:20
aegis43210  : 錯誤
※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 19:25:15
KrisNYC     : DS就開源的  輸了就算了 裁部門 丟模型16F 01/24 19:22
furbyyeh    : 硬體需求果然是吹的17F 01/24 19:22
KrisNYC     : 拿DS去從頭開始而已18F 01/24 19:22
stlinman    :  降本增效  遙遙領先 中國人可以贏兩次19F 01/24 19:22
rrazer      : 中又贏 ,遙遙領先20F 01/24 19:22
momochacha  : 沒空 阿祖現在忙著舔川普21F 01/24 19:22
KrisNYC     : 你就當作花錢蓋了個蚊子館又拆掉 GDP增加了 就這樣22F 01/24 19:22
KrisNYC     : 寫一大篇不知道想幹嘛
Lowpapa     : 美國早就輸慘了24F 01/24 19:23
godog       : 看到某族群崩潰狂酸的樣子 就覺的好笑 哈哈哈25F 01/24 19:23
aegis43210  : 只要慶豐帝仍在位,美國就不會輸26F 01/24 19:24
iamsosmart  : 中國贏了,台積電嚇哭了,輝達沒有用了,美國七大27F 01/24 19:24
iamsosmart  : 科技股都淚奔了
huabandd    : 整理重點好嗎29F 01/24 19:25

網景公司創始人(美國公司;世界第一個廣泛使用的瀏覽器)
Facebbok、eBay、HP 董事會成員
風投

Marc Andreessen

幫你整理了重點

https://i.imgur.com/SmUbN8M.png
[圖]

Deepseek R1 is one of the most amazing and impressive breakthroughs I’ve ever seen — and as open source, a profound gift to the world.

DeepSeek 翻譯:

https://i.imgur.com/5zX1uf2.png
[圖]

ImHoluCan   : 亞洲專門搞詐騙的30F 01/24 19:26
poeoe       : 中國本來在軟體就算強的 還能加班加到爆31F 01/24 19:26
strlen      : 不就魔改技術很猛?不然當年GPT3怎麼不是中國開發32F 01/24 19:27
winsonpz    : 看智障聳動標題就知道是中吹假新聞33F 01/24 19:27
zpeople0116 : 歐美日常,幹輸人翻桌34F 01/24 19:28
winsonpz    : 然後又一堆壯世代在那瞎講胡吹35F 01/24 19:29
ImHoluCan   : 美國人很天真,很容易被詐騙,看看小米保時捷,那36F 01/24 19:29
ImHoluCan   : 真的是保時捷嗎
spa41260    : 算力過剩,丸子38F 01/24 19:29
pagenotfound: 上次在那邊吹中國突破5奈米的公司 已經屍骨無存了39F 01/24 19:29
matlab1106  : 又要像電車一樣輸了就翻桌嗎?40F 01/24 19:29
ck326       : 中吹日常,吹了半天強國還在通縮41F 01/24 19:30
ImHoluCan   : 對岸要是真的,早就大吹特吹42F 01/24 19:30
asjh612     : 沒有外媒新聞? 怎麼只有中國跟twitter來源43F 01/24 19:30
mic73528    : 遙遙領先 雙贏就是中國贏兩次44F 01/24 19:31
Blastodern  : 彎道超車吹了三十年還在超,這個彎道到底有多長啦45F 01/24 19:31
Blastodern  : ,笑爛
idernest    : https://i.imgur.com/gH3UxJB.jpeg47F 01/24 19:32
[圖]
ImHoluCan   : 小米蘇7=美國老邏輯=保時捷怕拉沒拉,但真的擺上台48F 01/24 19:32
ImHoluCan   : 面真的是保時捷嗎
Dix123      : 已經都開源了 怎麼還有人反智阿...50F 01/24 19:33
jacktypetlan: 完蛋 算力過剩 overbooking 台G NV攔腰斬都不夠51F 01/24 19:33
jacktypetlan: NV至少1/4膝蓋斬 歐印放空 台股一萬二見
kotorichan  : 美國再挖角或制裁 就好53F 01/24 19:34
bella1815   : 看到某族群自嗨的樣子就覺得好笑54F 01/24 19:34
INIKS       : 美國創意,中國實作,中美如果真正合作,早就登陸火55F 01/24 19:34
INIKS       : 星了,可惜國家這個沒用的概念依然存在,地球村遙遙
INIKS       : 無期
※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 19:39:47
ImHoluCan   : 當初嘴台積電,也大力挖台積電的大將,對啊晶圓廠58F 01/24 19:34
ImHoluCan   : 可以生產啊,但真的能ㄧ直突破?
ck326       : 開源又怎樣?笑死60F 01/24 19:35
poeoe       : 開源就是全世界的人都能直接驗證 這也不是中國自己61F 01/24 19:35
poeoe       : 在吹啦
z23061542   : OK收到 以放空美台股 大力ALL IN鹿谷63F 01/24 19:35
asjh612     : 開源又怎樣 原po也沒覺得他贏openai啊64F 01/24 19:35
ImHoluCan   : 詐騙集團,當然不能犯低接錯誤,你能看到的當然要65F 01/24 19:36
ImHoluCan   : 給你看你想看的
kotorichan  : 沒三小路用 中國直接武統是最有用的67F 01/24 19:36
asjh612     : 自爽又贏 跟 開源 哪門子關係?68F 01/24 19:37
ImHoluCan   : 笑死中國要是真的能搞出來,當初中芯肯定能搞出來69F 01/24 19:37
asjh612     : 每個llm都在吹自己很強 實際體驗就是那死樣子70F 01/24 19:37
a12838910   : 中國軟體很強啊 抖音 小紅書 台灣?71F 01/24 19:38
andy810306  : 台灣給那狗屎薪資想要找誰寫軟體?笑死72F 01/24 19:38
aloness     : 這本來就是 在等待程式架構進化,縮減算力73F 01/24 19:39
jasonfun44  : 老早都去AWSGCP租就好,做LLM跟本不會賺錢74F 01/24 19:39
aloness     : 舊的程式架構自然需要突破天際的算力75F 01/24 19:39
ImHoluCan   : 對岸是小米蘇7保時捷,然後吹說你開保時捷嗎?76F 01/24 19:39
ck326       : 台灣軟體很爛啊,應該說台灣沒有軟體,所以呢?77F 01/24 19:40
Dix123      : 簡單來說 AI的這個嶄新的領域配上開源 本來就很容易78F 01/24 19:40
Dix123      : 做出超強的突破了 不一定是中國 美國隨時也會趕上
jasonfun44  : 馬斯克也是吹80F 01/24 19:40
poeoe       : 這其實也是好事 如果能讓需要的算力降低 那能省很多81F 01/24 19:40
poeoe       : 電
Dix123      : 你遙想個人電腦和網路剛開始的時候 駭客橫行的時候83F 01/24 19:40
bj45566     : 股板無腦中黑:不管啦,中國只會抄襲而已而已啦,一84F 01/24 19:40
bj45566     : 定是偷美國的!原始碼都公開在網上了?不可能!看得
bj45566     : 到的人一定是眼睛孽障太重,我什麼都看不到!(嘶喊)
aloness     : 中國軟體工程師戰力本來就不差87F 01/24 19:40
Dix123      : 當你還在用數據機玩天堂的時候 可能想過幾年後馬上88F 01/24 19:41
※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 19:45:10
ImHoluCan   : 對岸很多都是抄美國,卡卡西董嗎? 小米蘇7吹成保89F 01/24 19:41
ImHoluCan   : 時捷
Dix123      : 變月租吃到飽?91F 01/24 19:41
ixiuxiudan  : 別急92F 01/24 19:41
asjh612     : 怎會熱血親中的人在高潮啊93F 01/24 19:42
ImHoluCan   : 對岸只會卡卡西,但真的有那個創意與技術? 接下來94F 01/24 19:42
ImHoluCan   : 真的能持續?
s90002442   : 完蛋 今天股價砍爛96F 01/24 19:42
kevinmeng2  : 拿meta這垃圾比較就好像拿intel跟台積電比97F 01/24 19:42
peter98     : META再裁個15%工程師吧98F 01/24 19:44
jinx5566    : 突破AI臨界點了?99F 01/24 19:44
raymonde    : ai 是不是關門放狗100F 01/24 19:45
aaa95308    : 樓上把軟體跟半導體製造放在一起比較的...好喔101F 01/24 19:48
bj45566     : 說 Meta 是廢物的好像完全不知道 Meta 在 AI 開源碼102F 01/24 19:48
bj45566     : 界是抗霸子 wwww 而且 DS 贏的也不只是 Meta Llama
t0314796    : 報告 所以會影響到什麼?想抄答案!104F 01/24 19:48
jiansu      : 這個成果是中國其他公司都震驚吧 開源很好 科技不105F 01/24 19:49
jiansu      : 應該分國界 競爭也不分你我 生死看淡 不服就幹
ken123321987: 美國狗下棋輸人就翻桌 等中國強起來一定算帳107F 01/24 19:49
BIGETC      : 一個專案五千萬能弄 五百萬常常也可以 科科108F 01/24 19:50
asjh612     : 不過仔細想想 這篇股點是什麼? meta利空?109F 01/24 19:50
BIGETC      : 不過五千萬弄大家都會很舒服 何必真的編五百110F 01/24 19:50
djbell      : 繼續裁員111F 01/24 19:51
boy1031     : 鋼鐵家電手機電車都能卷翻,美歐日,憑什麼AI不能112F 01/24 19:51
boy1031     : 卷,至少也要分走3成市場
amethystboy : 便宜治百病114F 01/24 19:54
asjh612     : 還是這篇是台積nv利空 大家不需要那麼多運算資源?115F 01/24 19:55
super0949   : Meta股價毫無反應116F 01/24 19:55
keyneslan   : 這樣如何對股東與投資機構交代117F 01/24 19:55
CYL009      : 用低階顯卡AI性能就能和用高階的比了 反正美國錢很118F 01/24 19:55
CYL009      : 多 嘻嘻
pieceioriX  : 為何高低成本的方案不能共存?120F 01/24 19:56
oldEn15     : 產能過剩要來了 啾咪121F 01/24 19:56
s1612316    : 五千億鎂 有多少會進口袋122F 01/24 19:56
bj45566     : DeepSeek 最大的影響就是證明中國能用不到 1/10 的123F 01/24 19:56
bj45566     : 預算和更少、更便宜低階的 AI 晶片達成甚至超越美
bj45566     : 國頂尖 AI 公司(s)狂開資源做出的大語言模型效能
ggbi4zzz    : 中國黑開始胡言亂語126F 01/24 19:56
CYL009      : 現在深度探索全部開源給你 誰還要用高價裝備操作AI127F 01/24 19:57
CYL009      : 嘻嘻
CYL009      : 最近這幾天美國科技業真的瘋了 一直再找出為什麼可
CYL009      : 以這麼便宜成本弄出來ww
eriker      : 我怎麼看起來再說deepseek造假131F 01/24 19:58
uller       : 中國黑科技 猛了132F 01/24 19:58
eriker      : meta試著用h100訓練了15個開源的deepseek結果數據都133F 01/24 19:59
eriker      : 不如paper宣稱的
shorty5566  : 既然都開源了接下來就看能不能照刻出來啊 現在吹這135F 01/24 20:01
shorty5566  : 麼早都不怕跟之前超導體一樣翻車嗎?
eriker      : 這根本就是沒辦法reproduce吧 meta工程師拿你程式碼137F 01/24 20:01
eriker      : 訓練這麼多次都拿不到你的結果
qazwsx0128  : 笑死,就算成本降低需求只會更多,直到人手一個客139F 01/24 20:01
qazwsx0128  : 製ai
dongdong0405: 哈哈哈中國進來卷141F 01/24 20:02
eriker      : 那正常人用更爛的gpu或是deepseek宣稱的h800不是也142F 01/24 20:03
eriker      : 不辦法訓練出來嗎
bj45566     : 拿 AI 比高階晶圓製造的真的笑死!中國在 AI 領域一144F 01/24 20:03
bj45566     : 直都能和美國爭霸,中國在 AI 頂尖會議的論文發表和
ck326       : 看起來是 nvda ,tsm 股價準備崩潰,什麼你說市場沒146F 01/24 20:03
ck326       : 反應?怎麼會?
bj45566     : 美國一直都是互有領先(之前中國 AI 強在 CV, PR,148F 01/24 20:03
bj45566     : 美國強在 LLM, NLP -- 但現在看起來美國的強項不太
bj45566     : 妙)
eriker      : 中國不意外 只能騙騙外行人151F 01/24 20:03
kingofsdtw  : 果然演算法是最重要的152F 01/24 20:04
shorty5566  : 而且看不懂為啥對nv是利空 如果是真的那那些csp用153F 01/24 20:04
shorty5566  : 現在已有的算力不是更猛 需求只會更多吧 發展越快
shorty5566  : 越好
eriker      : 之前就懶得認真看deepseek 結果一看根本在騙白癡156F 01/24 20:05
appledick   : 這讓我想到智慧型手機android平台 一開始的硬體不157F 01/24 20:06
appledick   : 夠強 真的是要靠各家用軟體調效來拼順暢度
squeakywheel: 就是美國抄襲中國啦 某族群最愛嘴的159F 01/24 20:06
appledick   : 後來硬體強到靠北 軟體就不用調效了 硬體隨便淦都爆160F 01/24 20:06
appledick   : 淦順
bj45566     : 無腦中黑已經進入催眠自己的最高境界了 wwww wwww162F 01/24 20:06
eriker      : 中國人應該沒想到這次翻船 meta真的拿他的h100檢查d163F 01/24 20:08
eriker      : eepseek造假
ilGroundhog : 搜尋一了一下DS在寫作編碼不如GPT但是推理媲美165F 01/24 20:08
asjh612     : 超越美國製造的llm言之過早吧 每個新的出來都說贏166F 01/24 20:09
bj45566     : 最近 AI 界最大的醜聞反而是 OpenAI o3 涉嫌在數學167F 01/24 20:09
bj45566     : 能力測驗上作弊喔,嘻嘻
ilGroundhog : 重點是訓練便宜如果大規模訓練確實可能會顛覆AI市場169F 01/24 20:09
eriker      : 通常中國人ai論文喜歡造假說超越sota 但畢竟沒人會170F 01/24 20:10
eriker      : 這樣會浪費一堆算力證明造假
ilGroundhog : 如果可以便宜泛用的話對NV就不是好消息172F 01/24 20:10
asjh612     : 然後講中國ai paper 之前就聽過中國的有些是吹的173F 01/24 20:10
joygo       : 正在用 只能說 好用174F 01/24 20:11
koll        : 那麼厲害何必害怕晶片制裁狂拉貨?用爛晶片就好175F 01/24 20:11
asjh612     : 講別人無腦黑中 自己才無腦親中 笑死176F 01/24 20:11
mcgrady12336: 未來AI就中美有量能切入啊177F 01/24 20:11
eriker      : 但這次被meta抓到deepseek造假 好慘178F 01/24 20:12
joygo       : 最近剛好在玩google 的和這隻 互相179F 01/24 20:12
andy810306  : 某樓是不是在酸所有IC設計啊,應該用7奈米就好啊,180F 01/24 20:12
andy810306  : 一直想推先進製程幹嘛XDDD
JoeyChen    : 歸結是成本的問題對吧?182F 01/24 20:13
andy810306  : 是不是廢到只能靠製程來掩蓋廢物設計能力啊183F 01/24 20:13
eriker      : 不過我猜之後這種文會繼續洗 反正普通人也不懂ai184F 01/24 20:13
b9513227    : 你們慢慢吵 哥買tsm nv等看戲185F 01/24 20:13
bj45566     : 科技界名人包括 UC Berkeley 的 AI 教授都幫 DeepSe186F 01/24 20:13
bj45566     : ek 背書說它是 AI 的 "breakthrough" 了,股板鍵盤
bj45566     : 俠覺得自己比那些專家還懂 wwww wwww
s213092921  : Deepseek用閹割版H800就能做到,189F 01/24 20:13
shiowshay   : 真的超強,只是不知道為什麼他無法回答我1989年6月4190F 01/24 20:14
shiowshay   : 日有什麼歷史事件
asjh612     : nlp更好吹sota 反正自製dataset 別人亂做 自己認真192F 01/24 20:14
asdf70114   : 終於要遙遙領先了193F 01/24 20:14
appledick   : 中黑病發作194F 01/24 20:14
SunRoy      : 英偉達的股價下跌 我就信195F 01/24 20:14
joygo       : 谷歌的很爛 問股票問題不敢回答 chatgpt比較大膽196F 01/24 20:14
appledick   : 哥布林不要只會網上酸 拿出東西比較有意義197F 01/24 20:15
eriker      : 怎麼不敢回答meta訓練15次 開源的deepseek結果數據198F 01/24 20:15
eriker      : 不如paper宣稱的?
sid3        : 有競爭是好事  今年韓媒也有新聞200F 01/24 20:15
asjh612     : 教授也會被騙啊 笑死 以為教授多懂 早就沒在做實驗201F 01/24 20:16
b9513227    : 我快笑死 問中國最新jdk版本是啥 跟我說17202F 01/24 20:16
eriker      : 這不是造假不然是什麼203F 01/24 20:16
asjh612     : 是不是沒讀過研究所阿 還吹教授204F 01/24 20:17
Gipmydanger : 中國贏麻了,只好加大禁令了205F 01/24 20:17
[圖]
ilGroundhog : 對台積應該沒很大的影響就算少了輝達的訂單還有其他207F 01/24 20:18
bj45566     : 是啦,中國發表在 AI 論文都是吹的、假的!要隨論208F 01/24 20:18
bj45566     : 文附上的原始碼也都是假的!那些全世界 AI 專家組
bj45566     : 成的審稿 TPC 都是一群白癡廢物,怎麼可能比股板鍵
bj45566     : 盤俠更懂 AI 是吧? wwww
eriker      : 還是meta工程師都廢物 有一堆h100 還訓練不好deepse212F 01/24 20:18
eriker      : ek
andy810306  : 某樓自己能力差讀水貨研究所找廢物教授,以為美國214F 01/24 20:19
andy810306  : 教授跟你教授一樣廢,●●比雞腿,真的笑死
tomatobus   : 教授審論文不會去嘗試reproduce吧,除非他叫底下的216F 01/24 20:20
tomatobus   : 博士生去試
sa87a16     : 12億人口免費的運算怎麼輸218F 01/24 20:20
ilGroundhog : DS的初始模型是META的模型只是變得更有效率219F 01/24 20:20
bj45566     : 反正股板的無腦中黑覺得自己比所有業界、學界的知名220F 01/24 20:21
bj45566     : 專家都還要懂 AI wwww wwww
eriker      : 更好笑的是pytorch就meta的 開源還要比三小222F 01/24 20:21
tomatobus   : 如果meta工程師無法reproduce,那可能真的有什麼貓223F 01/24 20:21
tomatobus   : 膩。企業一定是最緊張的
asjh612     : 笑死 開始嘴別人教授喔 實際上就是這樣啦 國外也是225F 01/24 20:21
asjh612     : AI paper一堆 真的沒人有空一篇一篇跟你對
s213092921  : https://news.cnyes.com/news/id/5816770 人家早就227F 01/24 20:23
s213092921  : 預言了
bj45566     : 頂尖會議那些學界業界最知名的專家的審稿委員當然會229F 01/24 20:24
bj45566     : 試跑隨論文附上的原始碼啊 -- 萬一原始碼有錯只有你
bj45566     : 抓不出來,你直接名聲掃地好嗎
ilGroundhog : 如果成功還是需要訓練模型 只是算力降低很多232F 01/24 20:24
s213092921  : 2千多塊閹割版的H800只要訓練兩個月就超越Meta chat233F 01/24 20:24
s213092921  : GPT,美國可憐啊
eriker      : 中國在paper也喜歡造假硬體 明明用h100還說自己用h8235F 01/24 20:25
eriker      : 00或是3080


我沒有看到任何所謂Meta工程師沒辦法reproduce的資料來源@@
可以請你提供一下嗎

bj45566     : 美國一流大學教授就算是五六十歲都還在自己做研究、237F 01/24 20:26
bj45566     : 寫程式,井底之蛙覺得自己比 UC Berkeley 教授還厲
bj45566     : 害,哈哈哈哈
lepidoptera : 便宜很好啊 大家股價修正一下 重新開始240F 01/24 20:27
ntr203      : nv有什麼好怕的,越強的晶片不就代表可能做出越強241F 01/24 20:27
ntr203      : 的ai
appledick   : 反觀台灣在AI運算這一塊484完全沒了243F 01/24 20:28

AI製造供應鏈台灣應該還是掌握得牢牢的

AI模型目前看起來是真的沒料

幾乎都是拿別人的成果fine-tune、扶不上牆

appledick   : NV沒啥好怕啊 軟體寫的好跟硬體強又不抵觸244F 01/24 20:28
shorty5566  : 真的 看不太懂對nv利空在哪 用現在最強的nv去算不245F 01/24 20:29
shorty5566  : 是更好更令人興奮嗎 而且入門門檻降低對整個ai發展
shorty5566  : 都是好事 集中在幾個大型csp才不好
s213092921  : https://reurl.cc/G5O0Nd 內文提到Deepseek使用閹割248F 01/24 20:29
s213092921  : 版的H800顯卡,中黑趕快面對現實吧
s213092921  : http://i.imgur.com/u8wpYYZ.jpg
美晶片戰難以對中國封喉 ? 彭博示警中國AI公司已突破「這1點」 - 自由財經
[圖]
高佳菁/核稿編輯 〔財經頻道/綜合報導〕日前,中國AI公司推出與ChatGPT功能不相上下的新模型,但訓練時間極短、且成本不高,恐被視為中國AI技術的躍進象徵。《彭博》專欄作家、美國喬治‧梅 ...

 
[圖]

這紅媒吧?

lon0623     : 台灣人力有限,與其發展AI運算,倒不如找應用端251F 01/24 20:30
bj45566     : 無腦中黑已經無所不用其極在催眠自己一切都是假的 w252F 01/24 20:30
bj45566     : www pathetic SORE losers !!!
appledick   : 中國一堆都是去拿Mac mini來跑meta的模型 便宜又可254F 01/24 20:31
appledick   : 以玩
※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 20:32:09
h0103661    : 這完全開源,是假的早就被抓了吧256F 01/24 20:31
s213092921  : 中國用2048張閹割版H800顯卡訓練兩個月就能超車Meta257F 01/24 20:31
s213092921  : 及GPT,誰要花大錢買一堆NV最新顯卡?
lon0623     : 不覺得台灣的做法有什麼錯誤,又不是有上億人口259F 01/24 20:31
h0103661    : 還是要先跟研究生解釋什麼叫開源260F 01/24 20:31
eriker      : 你這篇的Lisan al …他說的就是這個意思261F 01/24 20:32
shorty5566  : 反過來說你用nv最強的顯卡去跑不是能進步得更快嗎262F 01/24 20:32
shorty5566  : ?還是你覺得ai的發展已經到盡頭了?
eriker      : 他不是說meta訓練了15次deepseek v3結果還是比他們264F 01/24 20:33

https://i.imgur.com/mJn5POl.png

尷尬

他在說Meta用LLAMA 3的訓練成本可以訓練DeepSeek-V3 15次

much better model

這大概國中英文

要不是你語言能力有缺陷

就是真的很純的中黑

eriker      : 宣稱的差嗎265F 01/24 20:33
ggian123    : Don’t look up 大陸人還生活在水深火熱266F 01/24 20:33
shorty5566  : 挫勒蛋的絕對是那些開發模型的公司吧267F 01/24 20:33
lon0623     : 你覺得你想得到的NV想不到嗎?268F 01/24 20:33
lon0623     : NV有他厲害的地方,不是只有算力
chanceiam   : 連繁體中文都不能回答的模型270F 01/24 20:34
eriker      : 所以meta驗證了deepseek放出來的程式碼跟模型 發現271F 01/24 20:34
eriker      : 他們造假
eriker      : …. 建議你看英文

是你的英文能力有缺陷。

我建議你別搞笑了

這真的在扯中黑的腿

jjjj222     : 高鐵, 六代機, 核融合, LLM, 每天吹, 吹完就沒了274F 01/24 20:35
scitamehtam : deepseek我有用,真的蠻好用的275F 01/24 20:35
shorty5566  : 開發模型的公司即將進入紅海 倒是nv只怕大家都改用276F 01/24 20:35
shorty5566  : asic,但是門檻降低以後小型玩家可以進場,那些小
shorty5566  : 型玩家也沒能力調教asic 還是要跟nv買通用gpu
jjjj222     : 功能也就是騙騙白痴.. 特別是中國白痴279F 01/24 20:36
ilw4e       : 就跟當初阿法狗一樣啊,deepmind搞出來後面一堆圍280F 01/24 20:36
ilw4e       : 棋AI小模型一下全出來了。純軟體你只是靠暴力解算力
ilw4e       : 堆,人家自然有優化後的更好解法,沒看openai也在回
ilw4e       : 頭做優化跟即時的深度運算
scitamehtam : 我兩種都下載,都有用,後來都用deepseek284F 01/24 20:36
eriker      : 開始抹中黑了?285F 01/24 20:38

連國中英文都不會

還想在這邊大談

還嗆我去讀英文原文

中黑搞不好都不承認你是隊友

如果你是中黑這會顯得除了無腦黑中國沒有什麽思辨能力=.=

kotorichan  : 他能改用中芯晶片訓練更好286F 01/24 20:38
tsubasawolfy: 不然老黃幹嘛賣那台掌中型的AI機287F 01/24 20:39
CLinna      : 國人捲出來的AI要打倒喝下午茶的工程師了嗎288F 01/24 20:39
poeoe       : 那個英文很明顯在說15倍啦……289F 01/24 20:39
s0920151048 : 這不能說中國好話290F 01/24 20:39
[圖]
eriker      : 造假就造假還在那護航292F 01/24 20:40
ilw4e       : 好像很多人誤以為AI是哪家先搞出AGI就贏了,現實是293F 01/24 20:40
ilw4e       : 就算搞出以後所有人知道該怎麼做很快就會用自己的
ilw4e       : 方法一樣能跟上,效率更好成本更低
tsubasawolfy: 另外推特翻譯那個GOOGLE翻得沒錯296F 01/24 20:40
shorty5566  : 他訓練還是要基於nv的gpu 用中芯的怎麼訓練297F 01/24 20:40
tomatobus   : 笑了,原來尼的出處是那,還以為尼有什麼meta內部的298F 01/24 20:40
tomatobus   : 消息
tsubasawolfy: 我覺得這比較像吹很久的edge AI踏出第一步300F 01/24 20:41
[圖]
eriker      : 那你抹中黑是怎麼回事?302F 01/24 20:41
appledick   : 好啦 假的啦 造假啦 中黑贏了 可以吧303F 01/24 20:41

那個英文能力在這邊大談

強烈建議看看eriker的推文真的超好笑

eriker      : 這樣是ok的 我都在講deepseek304F 01/24 20:42
bj45566     : 無腦中黑在眾人面前證實了自己連簡單的英文都看不305F 01/24 20:42
bj45566     : 懂胡扯亂翻譯,嘻嘻 wwww wwww
poeoe       : Meta訓練的預算拿來訓練Deepseek 都至少能訓練15次307F 01/24 20:42
poeoe       : 了
tonyshan    : 簡體的可以SKIP了309F 01/24 20:42
good5755    : 關鍵字:開源程式碼310F 01/24 20:42
appledick   : meta 484太多冗員了啊311F 01/24 20:43
Fegnzi      : 那些反智的人看不懂開源是什麼沒辦法,逢中就反真的312F 01/24 20:43
Fegnzi      : 沒救
eriker      : 所以質疑deepseek造假就是中黑?314F 01/24 20:43

可以質疑的

不過哥你的行為真的相當反智

跟中國人民說祖國疫苗No1差不多 只是顏色不一樣而已

都是避著眼睛只相信自己相信的

distantblc  : 急了315F 01/24 20:44
eriker      : 只會做人身攻擊316F 01/24 20:44
scitamehtam : 質疑? 不是不行吧,要合邏輯…317F 01/24 20:44
eriker      : 你在繼續318F 01/24 20:44
scitamehtam : 不然不就變成抹屎?319F 01/24 20:45
littenVenus : 這次中國真的會贏2次喔320F 01/24 20:45
appledick   : deepseek如果不是中國研究我覺得你應該就不會質疑了321F 01/24 20:45
VicLien     : 中國的天賦點在紅海化 厲害了322F 01/24 20:45
bj45566     : 胡扯亂翻譯人家公開的英文說明(而且是用很簡單的英323F 01/24 20:46
bj45566     : 文)說是無腦都還太客氣了好嗎? wwww wwww
appledick   : 中國某些地方真的就是強啊 當然某些地方是不敢恭維325F 01/24 20:46
scitamehtam : 先玩過再說..,我兩套都玩過,deepseek真的不錯326F 01/24 20:46
eriker      : 如果deepseek不是中國的還會這樣罵人嗎?327F 01/24 20:46
scitamehtam : 小心釣魚,看他自己表演就好,建議啦328F 01/24 20:47
scitamehtam : 沒邏輯的講話最大聲
eriker      : 我沒差 反正我不會罵人 我只評論deepseek330F 01/24 20:48
scitamehtam : 最近這版衛兵執勤很認真,桶了幾波了,自己小心331F 01/24 20:48
epephanylo  : (看戲332F 01/24 20:48
eriker      : 反倒是某些人小心333F 01/24 20:48
※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 20:49:43
bj45566     : 評論?胡亂翻譯人家的英文也敢叫做評論?笑死人有334F 01/24 20:49
bj45566     : 夠好笑 wwwww
Kazetachinu : 一堆ai大老都中國人 哪天超車都不意外 軟體這種東西336F 01/24 20:50
Kazetachinu : 限制沒有硬體這麼多
asjh612     : 不過這篇推文這麼火熱 沒半個人貼實例對話XDD338F 01/24 20:50
brella 
brella      : 垃圾新聞339F 01/24 20:50
asjh612     : 之前gpt在紅的時候 還有gpt幫忙回應的截圖340F 01/24 20:50
asjh612     : 覺得好的 可不可以務實點 去玩幾個例子貼來看看
yueayase    : 大驚小怪,這種前沿的技術,本來就是湖鄉合作,及互342F 01/24 20:51
yueayase    : 相競爭的
asjh612     : 讓我見識見識哪些是你們覺得好 哪些是回應差的344F 01/24 20:51
[圖]
duriamon    : deepseek有手機app啊!自己下載來用用看不就知道了346F 01/24 20:52
duriamon    : ?用email就可以註冊了。
yueayase    : 湖鄉=>互相348F 01/24 20:52
scitamehtam : 剛好今天才在用..349F 01/24 20:52
scitamehtam : 反倒是批評的?….
holebro     : 中國軟體強度上下限差很大 遇過一堆中國客戶連用AI351F 01/24 20:53
holebro     : 幫忙寫sql寫shell script寫yaml都不會= =
scitamehtam : 我兩套都常用啦,我自己112csie,也有研究ai主題353F 01/24 20:53
kakiandkaka : 笑翻,被反向354F 01/24 20:53
duriamon    : 樓上可以要他用正體中文回答。355F 01/24 20:53
[圖]
 
[圖]
scitamehtam : 倒是爬蟲後,發現一堆嘴的頭頭是道,結果背景令人358F 01/24 20:53
scitamehtam : 驚訝XDDD
ezreal1315  : 這就是第一個開頭的和跟班的差距啊 第一個一定要砸360F 01/24 20:54
ezreal1315  : 大錢開發 後面的當然可以降低成本
asjh612     : 就是不想註冊阿... 試想會黑的怎會想用362F 01/24 20:54
scitamehtam : 沒用過說的好像很熟一樣XDD 實事求是XDD363F 01/24 20:55
ezreal1315  : 哪個行業不是這樣 開拓者都是要付出最多的364F 01/24 20:55
s213092921  : 問題是開拓者能否一直保持領先優勢,看看Nokia跟Mot365F 01/24 20:56
scitamehtam : 所以我說,爬蟲後的心得,就是推文自己小心,最近審366F 01/24 20:56
scitamehtam : 查異己言論很勤勞的
s213092921  : o蘿拉的下場368F 01/24 20:56
asjh612     : http://i.imgur.com/LdGLuCI.jpg 看起來也有回答到?369F 01/24 20:56
[圖]
NCUking     : DeepSeek是猛在CP值超級高370F 01/24 20:56
TIPPK       : 台灣軟體公司好少371F 01/24 20:56
bj45566     : 連註冊都沒有就拼命在黑? wwww 人家台大資工親自372F 01/24 20:57
bj45566     : 試用還截圖給你耶
NCUking     : OpenAI 目前還是領頭羊沒問題374F 01/24 20:57
zebra101    : 笑死,人家明明在說META用了15倍的預算,更好的GPU375F 01/24 20:57
guanting886 : 我覺得一般用戶蠻鼓勵開發團隊都跳進甕被練蠱376F 01/24 20:57
zebra101    : ,卻訓練出了比DS更差的模型,英文到底怎麼讀的,co377F 01/24 20:57
zebra101    : uld have看不懂嗎?
NCUking     : 台灣搞LLM只能玩微調套皮379F 01/24 20:57
ezreal1315  : 所以說 買大盤真安心啊 20年前市值前10公司跟現在380F 01/24 20:57
ezreal1315  : 比已經大洗盤
deangogi    : 所以上面eriker說的meta復現準確度 有原文嗎?382F 01/24 20:58
scitamehtam : 我平常兩個都在玩啊,我沒說chatgpt不好吧?383F 01/24 20:58
duriamon    : AI領域大陸那邊跟美國的差距本來就不大,有在關心AI384F 01/24 20:58
duriamon    : 相關研究的大概都知道在說什麼,尤其中文大語言模型
duriamon    : 就唯一只有大陸那邊的能打,反觀台灣研發的真的很爛
duriamon    : ,呵呵!
eriker      : 沒有 嘻嘻388F 01/24 20:58
symeng      : 暫時觀望389F 01/24 20:59
asjh612     : 你問他llm吹很厲害的 有多少在搞啊 誰有空每個都試390F 01/24 20:59
ezreal1315  : 我覺得不用太緊張啦 人家用H800真的能超越openai391F 01/24 20:59
deangogi    : 你說的如果是原po貼的那段翻譯 應該是你翻譯的問題392F 01/24 20:59
ezreal1315  :  我相信股價早就被灌下來灌爛了 那些大戶一定第一393F 01/24 20:59
ezreal1315  : 個跑的
zebra101    : 那個eriker連最基本的英文都讀不懂395F 01/24 20:59
aac219oo    : 我看有很多人都不知道自己用的網站是用vue3寫的396F 01/24 20:59
w300204     : costdown誰的比得過華人397F 01/24 21:00
NCUking     : 中國軟體實力本來就是天下第二了398F 01/24 21:00
abc21086999 : https://i.imgur.com/fo3jbRR.png399F 01/24 21:00
abc21086999 : 中國特色社會主義式的AI
[圖]
ezreal1315  : 或者是就算如此 巨頭也不會降低支出 怕被同行超越401F 01/24 21:01
Samurai     : 先不說是不是真的,但逢中必反那個鳥樣,酸別人砸402F 01/24 21:01
Samurai     : 錢研發有夠莫名其妙
asjh612     : copilot claude gemini gpt llmam 每個新出的都sota404F 01/24 21:01
duriamon    : 還有人以為是costdown啊?不虧是台灣代工老舊代工思405F 01/24 21:01
duriamon    : 維,那些發展AI的人才經費花費成本真算下來哪裡cost
duriamon    : down了?
abc21086999 : Gemini thinking 答的就沒問題408F 01/24 21:02
abc21086999 : https://i.imgur.com/bQT9dQz.png
[圖]
gstym       : 中國晶片都可以去買別人的晶片來磨改名字了==410F 01/24 21:02
scitamehtam : 說真的chatgpt也能回答這題XDD411F 01/24 21:02
asjh612     : 搞不懂別人的問題點 還在以為我在黑中國412F 01/24 21:03
duriamon    : 台灣的老問題上次已經講過了,目前全世界先進的未來413F 01/24 21:03
duriamon    : 科技領域除了「我們有台積電」之外每一個能打的。
scitamehtam : 但好笑的是,拿這題當評斷AI的標準XDD415F 01/24 21:03
asjh612     : 問題是 現在每個llm都吹自己最強 當我是llm測試員哦416F 01/24 21:03
scitamehtam : 很顯然不是理工人吧XD417F 01/24 21:03
Mytsb2421   : 美國變成copy cat418F 01/24 21:04
iaminnocent : deepseek不採用預標數據集(也就是先由人類標記數419F 01/24 21:04
iaminnocent : 據再給模型訓練)而是直接採用強化學習,自己訓練
iaminnocent : 自己,並且透過他們的局部Token啟動機制,可以減少
iaminnocent : 使用量,這也是為什麼Deepseek能夠大幅降低訓練成
iaminnocent : 本的原因,不確定OpenAi 或是其他AI模型,為什麼沒
iaminnocent : 有進行強化學習
scitamehtam : 所以才說,爬蟲後,再看一次推文會很有趣啊XD 另,425F 01/24 21:04
scitamehtam : 你知道ptt主機放哪?XD
Samurai     : 意識形態死腦筋沒救,拿六四事件當評斷AI標準XD427F 01/24 21:04
[圖]
s213092921  : 因為美國只相信大力出奇蹟那套,砸錢砸算力429F 01/24 21:05
Lenney33    : 成本更低 美國科技巨頭情何以堪430F 01/24 21:05
iaminnocent : 但是這確實是對AI界投下震撼彈吧,不過OpenAI改用431F 01/24 21:05
iaminnocent : 自主強化學習,不知道是否可以
abc21086999 : 理工人又在打手槍自慰啊433F 01/24 21:06
abc21086999 : 會審查訊息的AI就算在某方面超越其他人也是不可能
abc21086999 : 普吉的
abc21086999 : *普及
tw77769     : 阿姨的機會來了437F 01/24 21:06
iaminnocent : DEEPSEEK 的數據集也許確實有部份來自ChatGPT,但438F 01/24 21:07
iaminnocent : 這並不影響他確實是一個蠻厲害的模型
bj45566     : 又有人硬要扯到晶片了。公開的論文告訴你實驗環境、440F 01/24 21:07
bj45566     : 算法流程、效能評比;原始碼放在大家都可以下載的 G
bj45566     : itHub 上,這要怎麼作弊???
scitamehtam : 就事論事,如果你說會不會普及,那就另外一題了,443F 01/24 21:07
scitamehtam : 請另闢蹊徑吧
a558815     : Deepseek 是真的有些東西啊445F 01/24 21:07
tsubasawolfy: OPENAI的O3就是RL壓 聖誕節前的13天倒數也有RL出現446F 01/24 21:08
tsubasawolfy: O3就是O1 RL來的 省去訓練成本
ggbi4zzz    : 美國人都害怕被中國ai超越,還有中國黑認為是在吹448F 01/24 21:09
ggbi4zzz    : 牛逼而已
minazukimaya: 還好它開源 同樣的演算法創新讓資源更多的美國科技450F 01/24 21:09
minazukimaya: 巨頭來用 以他們握有的訓練資源能產出更驚人的結果
s213092921  : http://i.imgur.com/vaz7qmE.jpg 誰抄誰啊嘻嘻452F 01/24 21:10
[圖]
eett811025  : 碼農996用肝跟你拼了453F 01/24 21:10
bread1110   : 這鯨魚真的邪門 花少少的預算幹大事 meta最好撐住啊454F 01/24 21:11
minazukimaya: 但感覺AGI和技術奇點的時間又被提前了.......455F 01/24 21:11
s213092921  : 中國AI公司因為算力受限,只好動腦另闢蹊徑,走出一456F 01/24 21:11
s213092921  : 片天,高階晶片也是一樣的道理
qazwsx0128  : 夠便宜我就自己訓練一個458F 01/24 21:11
minazukimaya: 這才是最恐怖的吧 感覺2030年前就要奇點了459F 01/24 21:11
iaminnocent : 那就對啦O3開始用RL的話,大概又會反超吧460F 01/24 21:12
fywei       :  真的好恐慌 zzz 嚇死人 只好再睡一下461F 01/24 21:12
nfsong      : 開源的  只能導入462F 01/24 21:12
ishdtt598   : 跟文組講那麼多幹嘛 笑死463F 01/24 21:12
nfsong      : 論文都出了464F 01/24 21:12
eliteark    : 繼續吹起來 我要看到血流成河465F 01/24 21:13
LBJshit     : 傻鳥真的很傻很北七 一直那邊說DS造假 我還以為是真466F 01/24 21:13
LBJshit     : 的有什麼內幕勒。結果他媽的是英文太爛根本自己完全
nfsong      : 跟股票一樣  有錢人不會輸468F 01/24 21:13
LBJshit     : 搞錯 連下面有中文的正確翻譯也不看469F 01/24 21:13
nfsong      : 導入以後 3000e 的就更猛470F 01/24 21:13
cay86714    : AI究極鬼故事!471F 01/24 21:14
nfsong      : 550萬就這麼猛  3000e的 6倍猛472F 01/24 21:14
iaminnocent : 那個貼文確實是說Meta的訓練費用都可以訓練15次Dee473F 01/24 21:14
iaminnocent : pseek了
shorty5566  : 傻鳥真的北七 前幾天還看到黃仁勳去中國就瘋狂崩潰475F 01/24 21:14
shorty5566  : 的
duriamon    : OpenAI的問題是核心科學家走了477F 01/24 21:14
gn7722      : 就跟現在的預算一樣478F 01/24 21:15
iaminnocent : O3我記得之前altman有貼出他的比較,好像比O1強不479F 01/24 21:15
iaminnocent : 少,但是當然費用很貴,如果OpenAi把這個開源的機
iaminnocent : 制拿來用不知道行不行
cay86714    : 如果這是真的那麼那些CSP之後的資本支出根本不用那482F 01/24 21:16
cay86714    : 麼高嘻嘻
g27834618   : 訓練費降低是利多啊 趕緊出殺手級應用才是正軌484F 01/24 21:16
littenVenus : 老黃484蛋雕惹QQ485F 01/24 21:17
duriamon    : 訓練費代表所需的時間成本、算力跟電費等,自己想想486F 01/24 21:17
duriamon    : 看囉!
littenVenus : 電力需求應該也不用那麼多吧488F 01/24 21:17
cay86714    : 不過這件事沒多久前國內投資圈就有一些人知道了,489F 01/24 21:18
cay86714    : 就看市場什麼時候反應了嘻嘻
iaminnocent : OpenAI比較像是他有很多資訊,當你詢問他時,他會491F 01/24 21:18
iaminnocent : 依據他的知識庫中去找尋資料,並且給你。DEEPSEEK
iaminnocent : 則是有很多專門的朋友,會依據問的問題,分配給適
iaminnocent : 合的專門朋友去找資料回答(也就是不會全部Token調
iaminnocent : 動,可以減少Token使用量)
beesee      : 訓練方式很華人496F 01/24 21:19
littenVenus : 窩是上禮拜看節目聽一個物理學博士在分析497F 01/24 21:20
Samurai     : 老黃沒差吧,算力永遠不夠,相同算力能做的事情更498F 01/24 21:20
Samurai     : 多了,加速科技發展,是軟體公司要頭痛了,拼肝拼
Samurai     : 軟體效率拼不過華人
s213092921  : 國外有大神用兩台M3晶片的蘋果電腦搭載運行Deepseek501F 01/24 21:20
s213092921  : 邏輯模型XDD
usereminem  : 一堆人仇中仇到腦子壞掉了 可悲503F 01/24 21:20
yusanhu     : 厲害504F 01/24 21:21
littenVenus : DS是分區塊 各領域專門訓練505F 01/24 21:21
duriamon    : 沒錯,deepseek是MoA架構。506F 01/24 21:22
minazukimaya: 演算法創新會反過來創造出新的算力需求啊 因為對智507F 01/24 21:22
minazukimaya: 能的追求沒有上限 更高效的演算法=更快到奇點
tw19930419  : 一堆低能中黑 看了就好笑509F 01/24 21:23
ilw4e       : 哈哈黑黑不知道一堆模型都會說他是chatgpt,因為監510F 01/24 21:24
ilw4e       : 督學習步驟最多人用的就是拿chatgpt當那個監督模型
s213092921  : https://b23.tv/R7tEm3q512F 01/24 21:24
cosmite     : 剛問了美國地47屆總統是誰,連這個都答不出來,資513F 01/24 21:24
cosmite     : 料庫還停在2023(模型為DeepSeekV3)
cosmite     : https://i.imgur.com/XXmbi1v.jpeg
[圖]
bj45566     : OpenAI o3 是非開源碼啊,而且最近被揭露它表現最516F 01/24 21:24
bj45566     : 驚人的 FrontierMath 指標有作弊的嫌疑!相關的英
bj45566     : 文報導和討論不少,這裏給一個實例!
bj45566     : https://tinyurl.com/yw55fcwk
OpenAI Secretly Funded Benchmarking Dataset Linked To o3 Model
[圖]
OpenAI secretly funded and had access to a benchmarking dataset, raising questions about high scores achieved by its new o3 AI model. ...

 
cosmite     : ChatGPT-4則沒有問題520F 01/24 21:25
cosmite     : https://i.imgur.com/oGA0Blp.jpeg
[圖]
fattyeddie  : 連ai都能卷 了不起我的國522F 01/24 21:26
bj45566     : P.S. 那隻看不懂國中等級英文的中黑歡迎繼續跳出來523F 01/24 21:26
bj45566     : 吶喊丟人現世 wwww wwww
duriamon    : 因為deepseek不用運轉那麼多參數來產生回答,而Open525F 01/24 21:26
duriamon    : AI的必須要,所以以電力消耗、算力消耗跟微型化來說
duriamon    : 都不利,但也不是代表這樣不好。我是覺得OpenAI自從
duriamon    : 變成Altman的玩物之後,進步幅度有限,反而吹噓成分
duriamon    : 增加了,呵呵!
minazukimaya: DeepSeek有價值的地方不是它自身模型有多強..530F 01/24 21:26
minazukimaya: 而是他提出的創新可以被其他有更大訓練集和更多算力
KOKEY       : 差別在喝的茶葉或咖啡比較貴啦532F 01/24 21:27
minazukimaya: 的公司複用533F 01/24 21:27
duriamon    : 強的是訓練的方式,裡面的秘密我相信應該沒有開源,534F 01/24 21:27
duriamon    : 呵呵!
bj45566     : 現在面臨作弊醜聞的反而是美國 & 世界最強的非開源536F 01/24 21:28
bj45566     : 碼 OpenAI o3
DCapple     : 又贏了又贏了,中国贏兩次538F 01/24 21:28
tw19930419  : 那叫做他沒有使用網路 不是他不會 問這種沒鑑別度的539F 01/24 21:28
tw19930419  : 蠢問題要證明什麼
Samurai     : 不要再搞笑了,他的資料庫到2023年根本就不是什麼541F 01/24 21:29
Samurai     : 缺陷,只差在有沒有網路搜尋最新資訊而已
minazukimaya: DeepSeek很公開啊 演算法和工程改進都寫在論文裡543F 01/24 21:29
littenVenus : 那個博士認為 因為成本優勢 注定美國以外地區會傾544F 01/24 21:29
littenVenus : 向DS 所以DS將是最後贏家
minazukimaya: 真的是還好它夠公開546F 01/24 21:30
raygod      : 加大制裁547F 01/24 21:30
minazukimaya: 不過它也是站在一堆前輩肩上 現在給人站肩膀 這就是548F 01/24 21:30
Samurai     : 意外的是DS竟然這麼大方公開研究方法549F 01/24 21:30
minazukimaya: 科學研究啊550F 01/24 21:30
runacat     : 論文都出來了551F 01/24 21:31
QuuEgg      : 哇啊,削價競爭欸552F 01/24 21:32
bj45566     : DeepSeek 如果在演算流程上沒有開創性的突破,美國553F 01/24 21:33
bj45566     : 業界大老絕對不會用 "breakthrough" 來形容啦,這
bj45566     : 個字義和 "cost down" 或  "內卷" 相差十萬八千里 -
bj45566     : - 而且 " cost down" 是標準的台式英文
wchang      : 好到不可思議的好,就是假的557F 01/24 21:33
wchang      : 跟運動員吃禁藥一樣,不是apple 對apple
Mosskappa   : Buy the rumor559F 01/24 21:34
tpkgo       : 讓子彈飛一會兒~~~~560F 01/24 21:34
minazukimaya: 令人恐懼的反而是模型的效率一日千里 對齊的研究牛561F 01/24 21:35
minazukimaya: 步慢行...
minazukimaya: 根本是直通文明毀滅的最短路線XD
tonyshan    : 看起來就改進一個東西 就吹到天上去564F 01/24 21:36
minazukimaya: DeepSeek把人類文明的毀滅倒數時鐘又撥快了一格565F 01/24 21:36
tompi       : DS API的費用是 o1 的1/30566F 01/24 21:37
minazukimaya: DeepSeek可不止改進一個東西 論文都有 白話技術文也567F 01/24 21:37
tsubasawolfy: 不用擔心OPENAI 那個瘋子一心只想要真的AGI 就跟馬568F 01/24 21:37
bj45566     : 樓上是在說 OpenAI 的 FrontierMath benchmark 嗎?569F 01/24 21:38
bj45566     : 好到不可思議結果...
duriamon    : 沒辦法,讓AI對齊人類的道德沒辦法賺錢,呵呵!571F 01/24 21:38
mamorui     : 這個應該不怎樣吧  去年看太多篇宣稱更頂 驗證一下572F 01/24 21:38
tpkgo       : 中國很會利用別人的研究偷雞 先聽聽就好573F 01/24 21:38
mamorui     : 就沒戲了 @@574F 01/24 21:38
tsubasawolfy: 斯克一心想上火星一樣 賽道不同575F 01/24 21:38
minazukimaya: 有 至少在大膽創新+高效工程這兩方面是非常優秀的576F 01/24 21:38
wsung       : 已經玩了一整天的R1,真的不差577F 01/24 21:38
mamorui     : 去年一堆 現在不是很愛看中國出的論文 拿到長官面578F 01/24 21:38
mamorui     : 前介紹都容易被罵
bj45566     : 人家原始碼、論文跟效能測試結果都公佈了啊,請問580F 01/24 21:41
bj45566     : 樓上舉例一下哪個說自己更頂的有公開這些?好酸的
bj45566     : 葡萄 wwww
minazukimaya: 中國一堆騙錢公司是事實 但DeepSeek和他們不一樣也583F 01/24 21:41
minazukimaya: 是事實 這兩個事實又不衝突...
mamorui     : 不是啊  論文就是有新方法 數據更漂亮 但實驗效果585F 01/24 21:42
mamorui     : 跑了不佳 真的有啊
NTUCS       : 藍白糞高潮587F 01/24 21:43
bj45566     : 樓上中黑請解釋一下人家論文、原始碼都公開的情況下588F 01/24 21:43
bj45566     : 要怎麼「利用別人的研究偷雞」?只會無腦黑嗎?
naushtogo   : 最近炒作很大,讓我們繼續看下去590F 01/24 21:43
mamorui     : 我找一下 我有標記過591F 01/24 21:43
s800525     : 說減少算力能達到一樣效能,那一樣算力不是能達到更592F 01/24 21:43
s800525     : 高效能?為何要以減少算力為前提?
NTUCS       : 論文公布了 但能 repro 嗎594F 01/24 21:43
bj45566     : 請問有哪個可信消息來源說「實驗結果不佳」?又在595F 01/24 21:44
bj45566     : 自己腦補嗎?
tpkgo       : 原始碼公開又不代表什麼  你是沒看過原始碼公開喔!!597F 01/24 21:44
NTUCS       : 你不是藍白糞幹嘛入座598F 01/24 21:44
mamorui     : 啊 像那個LLaMA-omni就是同事報告時直接露餡599F 01/24 21:45
s800525     : 說能事半功倍,那不能事倍功四倍嗎?600F 01/24 21:45
mamorui     : 開源就可以去repro601F 01/24 21:45
vtgc161     : 論文出來了,所以有人可以說明一下,他到底是不是拿602F 01/24 21:47
vtgc161     : 現有Ai模型為底去訓練的嗎
mamorui     : 要跑過才知道604F 01/24 21:47
bj45566     : 原始碼公開多久了?美國頂級業界學界大老也高度評605F 01/24 21:48
bj45566     : 價讚賞,台大資工板友也早就註冊測試覺得表現很好了
bj45566     :  -- 請問中黑還要怎麼樣才願意承認人家做出一個好東
bj45566     : 西???
mamorui     : 等哪天這個技術在公司一堆人講才是真的 我現在沒聽609F 01/24 21:48
mamorui     : 到就是了

你公司如果在做AI模型研究/工程的

這幾天全公司上下應該都在研究這個

duriamon    : 簡單來說就是最近有一個新的AI能力測驗,找了好幾位611F 01/24 21:49
duriamon    : 費爾茲數學獎得主來出超高難度題目,幾乎所有AI模型
duriamon    : 都回答得跟屎一樣,只有o3脫穎而出,大家正震驚Open
duriamon    : AI的技術力時,被爆料出來因為這個AI能力測驗OpenAI
duriamon    : 有贊助能事先拿到題目作弊,Altaman的作為我是不意
duriamon    : 外啦!呵呵!
minazukimaya: 你現在沒聽到要啟MoE項目 只是表示你公司不在最前沿617F 01/24 21:49
cclemon1231 : 對岸弱點還是0到1,但改造能力真的很強618F 01/24 21:49
bj45566     : 看來你待的公司比 Meta AI 還強 wwww wwww619F 01/24 21:49
sleepinggod : 成本低,跟使用者收費就可以便宜620F 01/24 21:50
mamorui     : 因為老馬的之前也拿過高分。就看囉621F 01/24 21:50
yunf        : 機器之心 是誰?622F 01/24 21:51
minazukimaya: 現在最前沿的美國公司一定會啟新項目投入MoE方向了623F 01/24 21:51
good5755    : 分領域導出答案 假如問題是跨領域不就GG了624F 01/24 21:51
mamorui     : 沒有啊 大家也是會謹慎看結果 OpenAi在很多篇論文625F 01/24 21:51
mamorui     : 數據都平均佳 所以謹慎看待每一版表現囉
davis5566   : 說個事實  某些人就開始藍白粉壯世代的  這些爛貨627F 01/24 21:52
davis5566   : 還是早點被時代淘汰吧
mokipu      : 拉板凳看戲629F 01/24 21:52
dwood123    : 這說明小公司也可作出好的模型,那大家就會躍躍欲630F 01/24 21:52
dwood123    : 試,Al伺服器需求也會增加啊!
duriamon    : 其實MoA架構比較符合人類的思考方式,人類大腦功耗632F 01/24 21:52
※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 21:53:14
duriamon    : 才30W參數量才4GB,演化的威能不是蓋的。633F 01/24 21:52
sleepinggod : 台灣不應該發展中文語言模型,教授都嘛拿國家錢產出634F 01/24 21:53
sleepinggod : 沒用的東西。直接全民學英文比較有效率
bj45566     : duriamon 板友講的 OpenAI o3 在高難度數學測驗的涉636F 01/24 21:53
bj45566     : 弊醜聞我在樓上就貼了一個應為報導短網址了,現在 A
bj45566     : I 圈內最被懷疑的反而是這個
good5755    : 而且重點是資料庫吧 目前以資料庫取得難易程度639F 01/24 21:53
duriamon    : 有Altman亂搞,OpenAI遲早會完蛋,我先預言在這邊,640F 01/24 21:54
good5755    : 對岸的13億免費資料庫真的比歐美簡單多了641F 01/24 21:54
duriamon    : 呵呵!642F 01/24 21:54
mamorui     : 我記得OpenAI數學不好吧643F 01/24 21:54
bj45566     : *英文報導644F 01/24 21:54
tpkgo       : Meta AI不錯 但現在使用者標竿是OpenAI645F 01/24 21:54
akwa        : 一堆井蛙還是不信 呵呵646F 01/24 21:54
bj45566     : 難怪你待的公司沒人在討論 DeepSeek,都 2025 年了647F 01/24 21:55
bj45566     : 還在講 OpenAI 數學不好,嘻嘻 wwww wwww
mamorui     : 對 OpenAI是標竿 因為大多比較數據出在別人的論文649F 01/24 21:55
mamorui     : 裡 GPT都平均拿到最佳 但數學是真的爛
bj45566     : OpenAI 涉嫌作弊的是普通人一輩子都碰不到邊的 Fron651F 01/24 21:56
bj45566     : tierMath benchmark !!!
duriamon    : 現在由於用於訓練AI模型所使用的開源資料已經幾乎耗653F 01/24 21:56
duriamon    : 盡,現在流行的是新型AI架構的研發以及超參數的蒸餾
duriamon    : 和分析,如何從已經有的超參數產生更好的產品才是顯
duriamon    : 學。
mamorui     : 我是沒有很常使用數學相關的沒錯。記憶停在數學爛657F 01/24 21:56
mamorui     : 沒錯
sweetantt   : o3應該不久後就會出來了吧 而且免費用戶也有o3 mini659F 01/24 21:56
sweetantt   :  到時候就知道openAI有沒有吹牛了
duriamon    : 看那個整天吹噓的Sora我是不期待啦!呵呵!661F 01/24 21:57
bj45566     : 還在繼續幻想說 OpenAI o3 數學爛 wwww 人家輕鬆碾662F 01/24 21:57
bj45566     : 壓你好嗎!
cityhunter04: 叫美國時代過去之前,他科技還是屌打世界2-30年…664F 01/24 21:58
duriamon    : 新的架構我覺得會是比較有趣的發展,傳統的transfor665F 01/24 21:59
duriamon    : mer已經差不多了。
duriamon    : 說是傳統不過也才2-3年的事,AI發展就是這麼競爭,
duriamon    : 呵呵!
mamorui     : 等很多paper報告看到比較時DS贏再說吧  最近兩個月669F 01/24 22:00
mamorui     : 沒時間看paper 小組報告都延期了 趕年末案子要GM
bj45566     : OpenAI o3 的 AIME 2024 benchmark 分數是 96.7% 好671F 01/24 22:05
bj45566     : 嗎?
mamorui     : o3不是12月才推出嗎 我剛好沒用 哈  以前很爛是真673F 01/24 22:07
mamorui     : 的
Tsukasa0320 : 很好啊 有威脅度才有理由打死675F 01/24 22:07
mamorui     : 那我就期待一下2025的各大paper囉676F 01/24 22:07
bj45566     : OpenAI o3 現在被質疑的 FrontierMath benchmark 是677F 01/24 22:07
bj45566     : 絕大多數人一輩子都碰不到的高等數學
k798976869  : meta就是故意開源AI不給微軟賺的 還在演啥679F 01/24 22:08
bj45566     : 又在講笑話了,嘻嘻。OpenAI 在 AIME benchmark 早680F 01/24 22:09
bj45566     : 就超過大部分人的數學水準了 wwww
popo123456  : 丸子,台積和美股7巨頭都要暴跌682F 01/24 22:10
bj45566     : 難怪你的公司沒聽過 DerpSeek,嘻嘻 wwww683F 01/24 22:10
mamorui     : 教科書的數學是可以 邏輯陷阱還是會踩684F 01/24 22:10
mamorui     : 聖誕節才發布 不要急哇
DA3921999   : 只要中國的開發者還開源就不可能贏美國啦,美國穩的686F 01/24 22:12
lon0623     : 暴跌就想太多了,尤其台積本益比才二十幾687F 01/24 22:12
bj45566     : 開源的遠不只 Meta 一家,DeepSeek 是用少得嚇人的688F 01/24 22:12
bj45566     : 成本打平、打敗檯面上所有的開源大語言模型
shorty5566  : NV盤前大跌-0.5% 蒸的丸子690F 01/24 22:13
abc21086999 : 為什麼有人要為了中國的AI很厲害感到自豪?691F 01/24 22:13
lon0623     : 你問中國用的晶片是不是台積做的692F 01/24 22:14
mamorui     : 我也不知道 而且我習慣謹慎多看幾版693F 01/24 22:14
lon0623     : 而且AI只是台積的一部分而已694F 01/24 22:14
MumiPyonPyon: Deepseek不是open的嗎@@695F 01/24 22:15
bj45566     : 因為 DS 狠狠打臉股板數不清的無腦中黑啊,嘻嘻 www696F 01/24 22:16
bj45566     : w
bj45566     : 連 OpenAI 數學早就很強都完全不知道的人說自己「
bj45566     : 謹慎」 wwww wwww
bj45566     : 看到無腦的____ 被狠狠打臉就覺得爽快是人之常情吧
bj45566     :  wwww
loveyou9527 : 兄弟 聽我說 這個ds 有料702F 01/24 22:21
yunf        : 真的沒什麼好爭的 就看你能拿它來做什麼 有真的帶來703F 01/24 22:21
yunf        : 創造性的價值 那就是對你有利的
lon0623     : 料敵從寬也不是壞事阿,多多想台灣有什麼能介入的705F 01/24 22:22
yunf        : 黑貓白貓會抓老鼠的就是好貓706F 01/24 22:22
yunf        : 如果他再厲害不能為你所用也是沒用
verydolungbe: 支那XDXDXD 聽聽就好708F 01/24 22:23
yunf        : 謝遜拿了屠龍刀雙眼失明 頂多拿來砍樹709F 01/24 22:24
lon0623     : 中國景氣不好有時對科研反而有好處,逼人去研究710F 01/24 22:24
s800525     : 有更好的算法能產生更快投入市場,就會有更多廠商願711F 01/24 22:24
s800525     : 意堆更多硬體來搶佔市場,永遠沒人在嫌硬體效能過剩
s800525     : 的
heart9677   : 想想半導體造假,先觀望一下好了714F 01/24 22:24
yunf        : 沒有不好好嗎 每天那麼多人張口就是要吃飯715F 01/24 22:25
yunf        : 吃的用的沒少過 只是沒有以前這樣亂花
k91011022   : 資料都被分析完 那就有可能走向預測了717F 01/24 22:25
mamorui     : 很快的。論文1、2個月內會有一堆去證明。718F 01/24 22:26
lon0623     : 連他們自己一堆人都在說景氣下行了,不用否認719F 01/24 22:26
s800525     : 這個方法好,那當所有人都用這方法,那最後不是還是720F 01/24 22:26
s800525     : 拚誰堆的硬體多?
knml        : 自己去用用看不就得了,免費722F 01/24 22:26
lon0623     : 要推廣給更多人用,還是要硬體阿723F 01/24 22:27
lon0623     : 甚至能普及的話,硬體需求更多
mamorui     : 是要看驗證數據 不同篇會用不同場景要解決的問題去725F 01/24 22:28
mamorui     : 驗證 我不可能自己去弄那個資料
s800525     : 現在反而怕應用普及不了到一般消費者,硬體需求反而727F 01/24 22:28
s800525     : 曇花一現,真能更快達到普及至消費端,硬體需求才真
s800525     : 的會井噴
ab4daa      : $$$$$$$$$$$$$$$730F 01/24 22:29
Rickyyy     : 裁員滾滾,股價又可以噴噴731F 01/24 22:29
lon0623     : 這就跟省油車出來,汽車反而賣更好的道理依樣732F 01/24 22:29
js52666     : 小金庫被拆了733F 01/24 22:30
goal56      : 中國人比較卷 贏美國早晚的734F 01/24 22:30
lon0623     : H800 GPU不也是NV的嗎?735F 01/24 22:31
yunf        : 半年整個指數漲了快¼你說經濟很差?736F 01/24 22:32
s800525     : H800效果就很好,那用GB200不就飛天了?737F 01/24 22:33
minazukimaya: 模型是科研 應用是商業 其實這兩件事關連不大~~738F 01/24 22:33
minazukimaya: 商業上 還是擁有直接面對消費者布署能力和通路的巨
minazukimaya: 頭們優勢最大
yunf        : 1990年到現在漲了10倍741F 01/24 22:36
thigefe 
thigefe     : 左等台積腰斬742F 01/24 22:36
s800525     : 港股一年來漲了26.20%,但5年來跌了28.21%,所以說743F 01/24 22:37
s800525     : 經濟不好沒問題吧?而且比疫情時期還低就更慘了...
yunf        : 那只是一個相對的概念745F 01/24 22:38
lon0623     : 中國政府都在催促國家隊進場買股了,這樣叫好?746F 01/24 22:38
yunf        : 一個人如果有10億 然後他現在剩下七億每天跟你說他747F 01/24 22:38
yunf        : 很窮 你要同情他嗎?
lon0623     : 他們本來就不是正常股市了,做空還會被政府抓749F 01/24 22:39
yunf        : 你可能沒有看過1990的大陸750F 01/24 22:40
lon0623     : 1990的人忍耐力一定比現在高很多好嗎751F 01/24 22:40
Paulsic     : 百萬輸出 tokens 16 元,輸出 API 價格只有 OpenAI752F 01/24 22:40
Paulsic     : o1 的 3%。熟悉的味道
yunf        : 那時候他們就已經過得不錯了 只是沒有現在好而已754F 01/24 22:40
lon0623     : 1990過得不錯是平行時空嗎?755F 01/24 22:41
lon0623     : 現在一定比35年前好啦,但人民的需求也會上升
WD640G 
WD640G      : 好啦 中吹先給你高潮757F 01/24 22:42
lon0623     : 之前一直吹的解封行情,現在也沒了758F 01/24 22:43
yunf        : 有吃有喝 有得住 還要怎樣? 就是交通不發達 醫療技759F 01/24 22:43
jamesjklin  : 爛爆,deepseek錯誤百出760F 01/24 22:43
yunf        : 術不發達761F 01/24 22:43
mamorui     : 中國有些團隊paper提供無限量用很佛是真的 尤其gen762F 01/24 22:45
mamorui     : 多媒體 同事分享過 覺得挖paper最大好處
bj45566     : 1. 中國現在經濟差景氣不好;2. 中國中下層百姓過得764F 01/24 22:45
bj45566     : 比疫情前還苦;這些都沒錯,但是:3. 中國投入科研
bj45566     : 的經費持續增加;4. 中國 2024 年在頂尖科學和、工
bj45566     : 程期刊和頂尖 CS 會議的論文發表數持續突破新高 esp
bj45566     : . Nature, Science
xkso        : 中國東西 先打3折769F 01/24 22:46
JWJerryyy   : 剛剛meta ath 看來不影響?770F 01/24 22:46
lon0623     : 景氣不好,會讓一些人才寧願去科研阿771F 01/24 22:46
mamorui     : 真得先打3折 QQ772F 01/24 22:46
shorty5566  : 蠢鳥也很笨 這東西明明對台灣也好773F 01/24 22:48
holysong    : 中國人很卷終獲勝?1990日本也過得不錯啊774F 01/24 22:48
yunf        : 這都他們自己控制的775F 01/24 22:48
shorty5566  : 要是解法一直是堆GPU 你堆得贏那些CSP大廠嗎776F 01/24 22:48
lon0623     : 中國民企要存活,基本上就是要走出海外777F 01/24 22:49
yunf        : 過度信用擴張的人才會有問題778F 01/24 22:49
shorty5566  : 有deepseek的發表 至少讓台灣還有入場券779F 01/24 22:50
lon0623     : 不然國內越捲就越不敢請人,繼續惡性循環780F 01/24 22:50
newyorker54 : 我只說一句如果真的那麼好,中國人完全不可能開源,781F 01/24 22:50
newyorker54 : 對標open AI就只是滿足自卑感自己吹吹。完全沒有原
newyorker54 : 創性的產品
jasterlin   : 唬爛,沒底層光靠蒸餾要趕英超美784F 01/24 22:50
MrCool5566  : 怎麽一堆人看到中國就黑785F 01/24 22:51
lon0623     : 美國最大優勢其實還是強大的內需786F 01/24 22:52
lon0623     : 那些中國公司產出在好,不進歐美會被自己人卷死
narotic     : 都是中共同路人啦788F 01/24 22:54
newyorker54 : 大家還不夠瞭解中國人嗎?又狠又卷又不要臉,文革大789F 01/24 22:54
newyorker54 : 躍進死的人比二戰還多,把錯都推給毛澤東,那根本是
newyorker54 : 一個全體人民劣根性的完全展現結果,只怪一個人??
newyorker54 : ?
yunf        : 中國會沒有內需嗎? 而且四倍的人口793F 01/24 22:54
lon0623     : 問題是他們的對手也是中國公司啊 自己人卷死794F 01/24 22:55
newyorker54 : 有人還抹我是中國同路人,笑死!中國六代戰機有開源795F 01/24 22:57
newyorker54 : 嗎?但是中國人也不要偷著樂,六代機和老美十幾年前
newyorker54 : 就有的F22也不會有優勢,看有沒有五五波就偷笑了
bj45566     : 都被美國業界學界大頭稱讚是 "breakthrough" 了還在798F 01/24 22:58
bj45566     : 「完全沒有原創性」,笑死 wwww 講這句話的人根本
bj45566     : 不懂什麼什麼叫作原創性
yunf        : 原本就太肥了 nv的算力可能撐不起他們那種演算法801F 01/24 22:58
yunf        : 沒差就看誰先算出有用的東西
newyorker54 : 中國是變強了,是世界第二強國,但是民族劣根性永遠803F 01/24 22:59
newyorker54 : 去除不掉
bj45566     : 而且中國領先的 AI 公司的語言模型幾乎都是開源讓大805F 01/24 22:59
bj45566     : 家下載,遠不只 DS,一點常識都沒有 wwww wwww
Paulsic     : 看效能和背後的財務模式不覺得恐怖嗎807F 01/24 23:00
iaminnocent : Deepseek的模型有借鑒之處,美國人也不是白癡,學808F 01/24 23:00
iaminnocent : 過來調整一下,馬上模型就降本增效了
bj45566     : 美國、歐洲大部分做 AI 研究的也是開源,OpenAI 反810F 01/24 23:00
bj45566     : 而是世界的少數例外
iaminnocent : 真的OpenAI 真的反而是例外812F 01/24 23:01
newyorker54 : 老黃還稱讚華為手機不可思議,中國人不要那麼自卑好813F 01/24 23:01
newyorker54 : 不好?? 等到學界公認再來說吧
lon0623     : 說不定是美國人過太爽了,人事費用太高815F 01/24 23:02
lusifa2007  : 如果deepseek可以搞到gb200 不是更強 AI永遠需要N816F 01/24 23:02
lusifa2007  : V
bj45566     : 現在 AI 還是離起跑點不遠的階段,當然最後美中誰818F 01/24 23:02
bj45566     : 贏不知道,更有可能是互有擅場
yunf        : 你看你能不能算出一個 比馬斯克更棒的火箭系統820F 01/24 23:02
lon0623     : 看一堆影片還說美國科技業過多爽821F 01/24 23:03
Paulsic     : 付費打不過open還有人要付錢822F 01/24 23:04
capser      : 推開源823F 01/24 23:04
minazukimaya: 組織文化的問題 DeepSeek作得到但是華為騰訊百度沒824F 01/24 23:04
minazukimaya: 作到 就說明了這不是中美差異 而是組織文化差異
yunf        : https://tinyurl.com/283v9oe3826F 01/24 23:04
iaminnocent : Deepseek的強化學習模式,也是O3的訓練模式,所以827F 01/24 23:05
iaminnocent : 等O3公布以後,大家應該又會來比拼
newyorker54 : open AI算力爆棚錢又多,窮人用窮人演算法自己自嗨829F 01/24 23:05
newyorker54 : !笑死。大腕花幾十萬玩明星一次,窮人打手槍打到扁
newyorker54 : 掉,還很得意說不花錢還射比較爽,哈哈
minazukimaya: 要論軟工高手和996的強度 中國大公司比DeepSeek強多832F 01/24 23:05
yunf        : 的確是很爽 但是壓力也很大 而且整個人的思路都不一833F 01/24 23:05
yunf        : 樣了
minazukimaya: 了 這幾年騙錢的中國AI公司也沒少過 DeepSeek能成功835F 01/24 23:06
minazukimaya: 自然有其公司文化的獨特之處
epicurious  : 重點是沒有要比美國好啊,差一點點但便宜5倍,美國c837F 01/24 23:08
epicurious  : sp廠capex砍下來供應鏈就崩了
bj45566     : 看某位美國一流名校女博士天天拍 YouTube 就知道美839F 01/24 23:08
bj45566     : 國高科技業一堆爽缺閒缺...
newyorker54 : 真正開源的是meta,DS也是拿人家的來改根據開源條款841F 01/24 23:10
newyorker54 : 本來就要跟著開源,中國人有那麼好死,講一個自己完
newyorker54 : 全無到有的原創產品開源的再來說自己人格很崇高,不
newyorker54 : 然看你中國人德行就是垃圾
lon0623     : 女博士薪水說不定比台積很多主管高了845F 01/24 23:10
bj45566     : 真的不用拿文革和大躍進來嘴什麼民族性,要不然美846F 01/24 23:11
bj45566     : 國的民族性是不是崇尚內鬥和蓄奴(-- 當時全歐洲由英
bj45566     : 國帶頭都禁止蓄奴了)?? ?
shorty5566  : 砍capex幹嘛 好的模型算法+算力不是更飛天= =849F 01/24 23:11
shorty5566  : 除非你覺得AI已經發展到盡頭了 不然算力永遠都不夠
lon0623     : 美國有些人事成本真的太高了,還有搞啥DEI851F 01/24 23:12
minazukimaya: 對啊 算法改進了效率變好 第一直覺當然是再放大模型852F 01/24 23:12
shorty5566  : 好的算法+更強的算力那才是事半功倍 買越多省越多853F 01/24 23:13
minazukimaya: 或是再加訓練集吧 對BigTech來說...854F 01/24 23:13

--
※ 看板: Stock 文章推薦值: 1 目前人氣: 0 累積人氣: 1425 
作者 Lushen 的最新發文:
點此顯示更多發文記錄
分享網址: 複製 已複製
( ̄︶ ̄)b markbb01 說讚!
1樓 時間: 2025-01-25 01:51:40 (台灣)
  01-25 01:51 TW
中國低價搶市是強項!
guest
x)推文 r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇