[新聞] Meta陷入恐慌？內部爆料：在瘋狂分析複製DeepSeek，高預算難以解釋 - Stock板

首頁(home) 上頁(↑) 下頁(↓) 末頁(end)

※ 本文轉寄自 ptt.cc 更新時間: 2025-01-24 23:45:50

看板 Stock

作者 Lushen (pttlushen)
標題 [新聞] Meta陷入恐慌？內部爆料：在瘋狂分析複製DeepSeek，高預
時間 Fri Jan 24 19:13:02 2025

原文標題：

Meta陷入恐慌？內部爆料：在瘋狂分析複製DeepSeek，高預算難以解釋

原文連結：https://www.jiqizhixin.com/articles/2025-01-24-2

Meta陷入恐慌？内部爆料：在疯狂分析复制DeepSeek，高预算难以解释 | 机器之心 工程师正在疯狂地分析 DeepSeek，试图从中复制任何可能的东西。 ...

發布時間：2025/01/24

記者署名：機器之心

原文內容：

「工程師正在瘋狂地分析 DeepSeek，試圖從中複製任何可能的東西。」

DeepSeek 開源大模型的陽謀，切切實實震撼著美國 AI 公司。

最先陷入恐慌的，似乎是同樣推崇開源的 Meta。

最近，有 Meta 員工在美國匿名職場社群 teamblind 上面發布了一個貼文。貼文提到，國內 AI 新創公司 DeepSeek 最近的一系列動作讓 Meta 的生成式 AI 團隊陷入了恐慌，因為在前者的低成本高歌猛進下，後者無法解釋自己的超高預算的合理性。

原文如下：

這一切始於 DeepSeek-V3，它在基準測試中就已經讓 Llama 4 落後。更糟的是那個「擁有 550 萬訓練預算的不知名中國公司」。

工程師們正在瘋狂地分析 DeepSeek，試圖從中複製任何可能的東西。這一點都不誇張。

管理階層擔心如何證明龐大的生成式 AI 組織的成本是合理的。當生成式 AI 組織中的每個「領導」的薪資都比訓練整個 DeepSeek-V3 的成本還要高，而我們有好幾十個這樣的「領導」時，他們要如何面對高層？

DeepSeek-R1 讓情況變得更加可怕。雖然我不能透露機密信息，但這些很快就會公開。

這本來應該是一個以工程為重點的小型組織，但是因為很多人想要參與進來分一杯羹，人為地膨脹了組織的招聘規模，結果每個人都成了輸家。

https://i.imgur.com/hKZ6h5W.png

貼文中提到的 DeepSeek-V3 和 DeepSeek-R1 分別發佈於 2024 年 12 月 26 日和 2025 年 1 月 20 日。

其中，DeepSeek-V3 在發佈時提到，該模型在多項評測成績超越了Qwen2.5-72B 和Llama-3.1-405B 等其他開源模型，並在性能和世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet 不分伯仲。

不過，更引人注目的是，這個參數量高達 671B 的大型語言模型訓練成本僅 558 萬美元。具體來說，它的預訓練過程竟然只用了 266.4 萬 H800 GPU Hours，再加上上下文擴展與後訓練的訓練，總共也只有 278.8 H800 GPU Hours。相比之下，Meta 的 Llama 3 系列模型的計算預算則多達 3930 萬 H100 GPU Hours—— 如此計算量足可訓練 DeepSeek-V3 至少 15 次。

https://i.imgur.com/mJn5POl.png

而最近發布的 DeepSeek-R1 效能更猛 —— 在數學、程式碼、自然語言推理等任務上，它的效能比肩 OpenAI o1 正式版。而且模型在發布的同時，權重同步開源。很多人驚呼，原來 DeepSeek 才是真正的 OpenAI。 UC Berkeley 教授 Alex Dimakis 則認為， DeepSeek 現在已經處於領先位置，美國公司可能需要迎頭趕上了。

https://i.imgur.com/NLhp4Nj.png

看到這裡，我們不難理解為何 Meta 的團隊會陷入恐慌。如果今年推出的 Llama 4 沒有點硬本事，他們「開源之光」的地位岌岌可危。

有人指出，其實該慌的不只 Meta，OpenAI、Google、Anthropic 又何嘗沒有受到挑戰。「這是一件好事，我們可以即時看到公開競爭對創新的影響。」

https://i.imgur.com/gQ5fHDH.png

還有人擔心起了英偉達的股價，表示「如果 DeeSeek 的創新是真的，那麼 AI 公司是否真的需要那麼多顯示卡？」

https://i.imgur.com/HIFcTx6.png

不過，也有人質疑，DeepSeek 究竟是靠創新還是靠蒸餾 OpenAI 的模型取勝？有人回覆說，這可以從他們的發布的技術報告中找到答案。

https://i.imgur.com/HIFcTx6.png

目前，我們還無法確定貼文的真實性。

不知道 Meta 後續會如何回應，即將到來的 Llama 4 又會達到怎樣的表現。

心得/評論：

Meta工程師在TeamBlind(一個匿名的職涯討論區，需要經過公司Email驗證)爆料中國的DeepSeek對內部影響很大

DeepSeek R1訓練成本550萬美元可能比一個Meta大頭的年薪還便宜

DeepSeek 這件事情也不光是中國自己在吹噓

看了一下 Twitter/Reddit 美國AI工業界、學術界反響非常大

DeekSeek 的母公司幻方量化產出 DeepSeek 的故事也在 Twitter 廣受討論

https://i.imgur.com/NLhp4Nj.png

DeepSeek R1 開源+論文公開應該會推進一波AI界的發展

DeepSeek 後續發展值得關注一下

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.229.55.152 (臺灣)
※ 作者: Lushen 2025-01-24 19:13:02
※ 文章代碼(AID): #1datN1_K (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1737717185.A.FD4.html

※ 同主題文章:

● 01-24 19:13 Lushen. ■ [新聞] Meta陷入恐慌？內部爆料：在瘋狂分析複製DeepSeek，高預算難以解釋

　 01-24 21:59 wangrg. ■ Re: [新聞] Meta陷入恐慌？內部爆料：在瘋狂分析複製DeepSeek，高預算難以解釋

　 01-25 03:00 d012375913. ■ Re: [新聞] Meta陷入恐慌？內部爆料：在瘋狂分析複製DeepSeek，高預

　 01-25 09:15 ilw4e. ■ Re: [新聞] Meta陷入恐慌？內部爆料：在瘋狂分析複製DeepSeek，高預算難以解釋

　 01-25 11:46 abc21086999. ■ Re: [新聞] Meta陷入恐慌？內部爆料：在瘋狂分析複製DeepSeek，高預算難以解釋

　 01-25 22:54 Latte7. ■ Re: [新聞] Meta陷入恐慌？內部爆料：在瘋狂分析複製DeepSeek，高預算難以解釋

　 01-26 13:15 LDPC. ■ Re: [新聞] Meta陷入恐慌？內部爆料：在瘋狂分析複製DeepSeek，高

　 01-26 19:27 Lushen. ■ Re: [新聞] Meta陷入恐慌？內部爆料：在瘋狂分析複製DeepSeek，高預算難以解釋

　 02-01 22:44 ASKA. ■ Re: [新聞] Meta陷入恐慌？內部爆料：在瘋狂分析複製DeepSeek，高

推 pmes9866 : 中又贏1F 01/24 19:14

DeepSeek 訓練成本低+跑起來的成本極低(硬體需求)

自己實際使用體感不覺得他贏 OpenAI

不過以成本場景來說真的是巨大的創新

美國知名的 AI 分析機構 Artificial Analysis

對 DeepSeek 的成本分析

https://i.imgur.com/0GRkj6Q.png

→ agassi001 : 股價該跌了吧2F 01/24 19:15

推 wts4832 : too good to be true3F 01/24 19:15

→ moom50302 : 贏了贏了都贏了4F 01/24 19:15

推 Plumpy : 贏麻了5F 01/24 19:16

噓 s1612316 : 花大錢還輸別人是設備的問題還是人的問題6F 01/24 19:16

推 kenbbc12321 : ai本來就可以減少運算，達到一樣的效果7F 01/24 19:18

推 lpmybig : 真實性先打問號8F 01/24 19:18

DeepSeek R1 程式碼、論文都開源+公開了

https://github.com/deepseek-ai/DeepSeek-R1

GitHub - deepseek-ai/DeepSeek-R1

Contribute to deepseek-ai/DeepSeek-R1 development by creating an account on GitHub. ...

https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

DeepSeek-R1/DeepSeek_R1.pdf at main · deepseek-ai/DeepSeek-R1 · GitHub

Contribute to deepseek-ai/DeepSeek-R1 development by creating an account on GitHub. ...

→ appledick : 美國484真的滿廢的9F 01/24 19:18
→ appledick : 難怪只能靠制裁來贏人了

推 lc85301 : 美國的時代早就過去了11F 01/24 19:19

推 zhi5566 : 輸了就在砍人啊12F 01/24 19:19

推 kuosos520 : deepseek有開源，也有offline，鬼故事來了13F 01/24 19:20

推 aegis43210 : 因為西台灣為了管制，一堆問題不能回答，自然也不算14F 01/24 19:20
→ aegis43210 : 錯誤

※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 19:25:15

推 KrisNYC : DS就開源的輸了就算了裁部門丟模型16F 01/24 19:22

→ furbyyeh : 硬體需求果然是吹的17F 01/24 19:22

→ KrisNYC : 拿DS去從頭開始而已18F 01/24 19:22

推 stlinman : 降本增效遙遙領先中國人可以贏兩次19F 01/24 19:22

推 rrazer : 中又贏，遙遙領先20F 01/24 19:22

推 momochacha : 沒空阿祖現在忙著舔川普21F 01/24 19:22

→ KrisNYC : 你就當作花錢蓋了個蚊子館又拆掉 GDP增加了就這樣22F 01/24 19:22
→ KrisNYC : 寫一大篇不知道想幹嘛

推 Lowpapa : 美國早就輸慘了24F 01/24 19:23

推 godog : 看到某族群崩潰狂酸的樣子就覺的好笑哈哈哈25F 01/24 19:23

推 aegis43210 : 只要慶豐帝仍在位，美國就不會輸26F 01/24 19:24

推 iamsosmart : 中國贏了，台積電嚇哭了，輝達沒有用了，美國七大27F 01/24 19:24
→ iamsosmart : 科技股都淚奔了

推 huabandd : 整理重點好嗎29F 01/24 19:25

網景公司創始人(美國公司;世界第一個廣泛使用的瀏覽器)
Facebbok、eBay、HP 董事會成員
風投

Marc Andreessen

幫你整理了重點

https://i.imgur.com/SmUbN8M.png

Deepseek R1 is one of the most amazing and impressive breakthroughs I’ve ever seen — and as open source, a profound gift to the world.

DeepSeek 翻譯:

https://i.imgur.com/5zX1uf2.png

推 ImHoluCan : 亞洲專門搞詐騙的30F 01/24 19:26

推 poeoe : 中國本來在軟體就算強的還能加班加到爆31F 01/24 19:26

推 strlen : 不就魔改技術很猛？不然當年GPT3怎麼不是中國開發32F 01/24 19:27

推 winsonpz : 看智障聳動標題就知道是中吹假新聞33F 01/24 19:27

推 zpeople0116 : 歐美日常，幹輸人翻桌34F 01/24 19:28

→ winsonpz : 然後又一堆壯世代在那瞎講胡吹35F 01/24 19:29

推 ImHoluCan : 美國人很天真，很容易被詐騙，看看小米保時捷，那36F 01/24 19:29
→ ImHoluCan : 真的是保時捷嗎

推 spa41260 : 算力過剩，丸子38F 01/24 19:29

噓 pagenotfound: 上次在那邊吹中國突破5奈米的公司已經屍骨無存了39F 01/24 19:29

推 matlab1106 : 又要像電車一樣輸了就翻桌嗎？40F 01/24 19:29

噓 ck326 : 中吹日常，吹了半天強國還在通縮41F 01/24 19:30

→ ImHoluCan : 對岸要是真的，早就大吹特吹42F 01/24 19:30

→ asjh612 : 沒有外媒新聞？怎麼只有中國跟twitter來源43F 01/24 19:30

→ mic73528 : 遙遙領先雙贏就是中國贏兩次44F 01/24 19:31

推 Blastodern : 彎道超車吹了三十年還在超，這個彎道到底有多長啦45F 01/24 19:31
→ Blastodern : ，笑爛

→ idernest : https://i.imgur.com/gH3UxJB.jpeg47F 01/24 19:32

→ ImHoluCan : 小米蘇7=美國老邏輯=保時捷怕拉沒拉，但真的擺上台48F 01/24 19:32
→ ImHoluCan : 面真的是保時捷嗎

推 Dix123 : 已經都開源了怎麼還有人反智阿...50F 01/24 19:33

推 jacktypetlan: 完蛋算力過剩 overbooking 台G NV攔腰斬都不夠51F 01/24 19:33
→ jacktypetlan: NV至少1/4膝蓋斬歐印放空台股一萬二見

推 kotorichan : 美國再挖角或制裁就好53F 01/24 19:34

推 bella1815 : 看到某族群自嗨的樣子就覺得好笑54F 01/24 19:34

推 INIKS : 美國創意，中國實作，中美如果真正合作，早就登陸火55F 01/24 19:34
→ INIKS : 星了，可惜國家這個沒用的概念依然存在，地球村遙遙
→ INIKS : 無期

※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 19:39:47

→ ImHoluCan : 當初嘴台積電，也大力挖台積電的大將，對啊晶圓廠58F 01/24 19:34
→ ImHoluCan : 可以生產啊，但真的能ㄧ直突破？

推 ck326 : 開源又怎樣？笑死60F 01/24 19:35

推 poeoe : 開源就是全世界的人都能直接驗證這也不是中國自己61F 01/24 19:35
→ poeoe : 在吹啦

推 z23061542 : OK收到以放空美台股大力ALL IN鹿谷63F 01/24 19:35

→ asjh612 : 開源又怎樣原po也沒覺得他贏openai啊64F 01/24 19:35

→ ImHoluCan : 詐騙集團，當然不能犯低接錯誤，你能看到的當然要65F 01/24 19:36
→ ImHoluCan : 給你看你想看的

推 kotorichan : 沒三小路用中國直接武統是最有用的67F 01/24 19:36

→ asjh612 : 自爽又贏跟開源哪門子關係?68F 01/24 19:37

→ ImHoluCan : 笑死中國要是真的能搞出來，當初中芯肯定能搞出來69F 01/24 19:37

→ asjh612 : 每個llm都在吹自己很強實際體驗就是那死樣子70F 01/24 19:37

→ a12838910 : 中國軟體很強啊抖音小紅書台灣？71F 01/24 19:38

推 andy810306 : 台灣給那狗屎薪資想要找誰寫軟體？笑死72F 01/24 19:38

→ aloness : 這本來就是在等待程式架構進化，縮減算力73F 01/24 19:39

推 jasonfun44 : 老早都去AWSGCP租就好，做LLM跟本不會賺錢74F 01/24 19:39

→ aloness : 舊的程式架構自然需要突破天際的算力75F 01/24 19:39

推 ImHoluCan : 對岸是小米蘇7保時捷，然後吹說你開保時捷嗎？76F 01/24 19:39

推 ck326 : 台灣軟體很爛啊，應該說台灣沒有軟體，所以呢？77F 01/24 19:40

推 Dix123 : 簡單來說 AI的這個嶄新的領域配上開源本來就很容易78F 01/24 19:40
→ Dix123 : 做出超強的突破了不一定是中國美國隨時也會趕上

→ jasonfun44 : 馬斯克也是吹80F 01/24 19:40

推 poeoe : 這其實也是好事如果能讓需要的算力降低那能省很多81F 01/24 19:40
→ poeoe : 電

→ Dix123 : 你遙想個人電腦和網路剛開始的時候駭客橫行的時候83F 01/24 19:40

推 bj45566 : 股板無腦中黑：不管啦，中國只會抄襲而已而已啦，一84F 01/24 19:40
→ bj45566 : 定是偷美國的！原始碼都公開在網上了？不可能！看得
→ bj45566 : 到的人一定是眼睛孽障太重，我什麼都看不到！(嘶喊)

→ aloness : 中國軟體工程師戰力本來就不差87F 01/24 19:40

→ Dix123 : 當你還在用數據機玩天堂的時候可能想過幾年後馬上88F 01/24 19:41

※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 19:45:10

→ ImHoluCan : 對岸很多都是抄美國，卡卡西董嗎？小米蘇7吹成保89F 01/24 19:41
→ ImHoluCan : 時捷

→ Dix123 : 變月租吃到飽?91F 01/24 19:41

推 ixiuxiudan : 別急92F 01/24 19:41

→ asjh612 : 怎會熱血親中的人在高潮啊93F 01/24 19:42

→ ImHoluCan : 對岸只會卡卡西，但真的有那個創意與技術？接下來94F 01/24 19:42
→ ImHoluCan : 真的能持續？

推 s90002442 : 完蛋今天股價砍爛96F 01/24 19:42

→ kevinmeng2 : 拿meta這垃圾比較就好像拿intel跟台積電比97F 01/24 19:42

→ peter98 : META再裁個15%工程師吧98F 01/24 19:44

推 jinx5566 : 突破AI臨界點了？99F 01/24 19:44

噓 raymonde : ai 是不是關門放狗100F 01/24 19:45

→ aaa95308 : 樓上把軟體跟半導體製造放在一起比較的...好喔101F 01/24 19:48

推 bj45566 : 說 Meta 是廢物的好像完全不知道 Meta 在 AI 開源碼102F 01/24 19:48
→ bj45566 : 界是抗霸子 wwww 而且 DS 贏的也不只是 Meta Llama

推 t0314796 : 報告所以會影響到什麼？想抄答案！104F 01/24 19:48

推 jiansu : 這個成果是中國其他公司都震驚吧開源很好科技不105F 01/24 19:49
→ jiansu : 應該分國界競爭也不分你我生死看淡不服就幹

噓 ken123321987: 美國狗下棋輸人就翻桌等中國強起來一定算帳107F 01/24 19:49

推 BIGETC : 一個專案五千萬能弄五百萬常常也可以科科108F 01/24 19:50

→ asjh612 : 不過仔細想想這篇股點是什麼? meta利空?109F 01/24 19:50

→ BIGETC : 不過五千萬弄大家都會很舒服何必真的編五百110F 01/24 19:50

推 djbell : 繼續裁員111F 01/24 19:51

推 boy1031 : 鋼鐵家電手機電車都能卷翻，美歐日，憑什麼AI不能112F 01/24 19:51
→ boy1031 : 卷，至少也要分走3成市場

推 amethystboy : 便宜治百病114F 01/24 19:54

→ asjh612 : 還是這篇是台積nv利空大家不需要那麼多運算資源?115F 01/24 19:55

推 super0949 : Meta股價毫無反應116F 01/24 19:55

→ keyneslan : 這樣如何對股東與投資機構交代117F 01/24 19:55

→ CYL009 : 用低階顯卡AI性能就能和用高階的比了反正美國錢很118F 01/24 19:55
→ CYL009 : 多嘻嘻

→ pieceioriX : 為何高低成本的方案不能共存?120F 01/24 19:56

推 oldEn15 : 產能過剩要來了啾咪121F 01/24 19:56

推 s1612316 : 五千億鎂有多少會進口袋122F 01/24 19:56

推 bj45566 : DeepSeek 最大的影響就是證明中國能用不到 1/10 的123F 01/24 19:56
→ bj45566 : 預算和更少、更便宜低階的 AI 晶片達成甚至超越美
→ bj45566 : 國頂尖 AI 公司(s)狂開資源做出的大語言模型效能

推 ggbi4zzz : 中國黑開始胡言亂語126F 01/24 19:56

→ CYL009 : 現在深度探索全部開源給你誰還要用高價裝備操作AI127F 01/24 19:57
→ CYL009 : 嘻嘻
→ CYL009 : 最近這幾天美國科技業真的瘋了一直再找出為什麼可
→ CYL009 : 以這麼便宜成本弄出來ww

推 eriker : 我怎麼看起來再說deepseek造假131F 01/24 19:58

推 uller : 中國黑科技猛了132F 01/24 19:58

→ eriker : meta試著用h100訓練了15個開源的deepseek結果數據都133F 01/24 19:59
→ eriker : 不如paper宣稱的

→ shorty5566 : 既然都開源了接下來就看能不能照刻出來啊現在吹這135F 01/24 20:01
→ shorty5566 : 麼早都不怕跟之前超導體一樣翻車嗎？

→ eriker : 這根本就是沒辦法reproduce吧 meta工程師拿你程式碼137F 01/24 20:01
→ eriker : 訓練這麼多次都拿不到你的結果

噓 qazwsx0128 : 笑死，就算成本降低需求只會更多，直到人手一個客139F 01/24 20:01
→ qazwsx0128 : 製ai

推 dongdong0405: 哈哈哈中國進來卷141F 01/24 20:02

→ eriker : 那正常人用更爛的gpu或是deepseek宣稱的h800不是也142F 01/24 20:03
→ eriker : 不辦法訓練出來嗎

推 bj45566 : 拿 AI 比高階晶圓製造的真的笑死！中國在 AI 領域一144F 01/24 20:03
→ bj45566 : 直都能和美國爭霸，中國在 AI 頂尖會議的論文發表和

推 ck326 : 看起來是 nvda ,tsm 股價準備崩潰，什麼你說市場沒146F 01/24 20:03
→ ck326 : 反應？怎麼會？

→ bj45566 : 美國一直都是互有領先(之前中國 AI 強在 CV, PR，148F 01/24 20:03
→ bj45566 : 美國強在 LLM, NLP -- 但現在看起來美國的強項不太
→ bj45566 : 妙)

→ eriker : 中國不意外只能騙騙外行人151F 01/24 20:03

推 kingofsdtw : 果然演算法是最重要的152F 01/24 20:04

推 shorty5566 : 而且看不懂為啥對nv是利空如果是真的那那些csp用153F 01/24 20:04
→ shorty5566 : 現在已有的算力不是更猛需求只會更多吧發展越快
→ shorty5566 : 越好

→ eriker : 之前就懶得認真看deepseek 結果一看根本在騙白癡156F 01/24 20:05

→ appledick : 這讓我想到智慧型手機android平台一開始的硬體不157F 01/24 20:06
→ appledick : 夠強真的是要靠各家用軟體調效來拼順暢度

噓 squeakywheel: 就是美國抄襲中國啦某族群最愛嘴的159F 01/24 20:06

→ appledick : 後來硬體強到靠北軟體就不用調效了硬體隨便淦都爆160F 01/24 20:06
→ appledick : 淦順

推 bj45566 : 無腦中黑已經進入催眠自己的最高境界了 wwww wwww162F 01/24 20:06

推 eriker : 中國人應該沒想到這次翻船 meta真的拿他的h100檢查d163F 01/24 20:08
→ eriker : eepseek造假

推 ilGroundhog : 搜尋一了一下DS在寫作編碼不如GPT但是推理媲美165F 01/24 20:08

→ asjh612 : 超越美國製造的llm言之過早吧每個新的出來都說贏166F 01/24 20:09

推 bj45566 : 最近 AI 界最大的醜聞反而是 OpenAI o3 涉嫌在數學167F 01/24 20:09
→ bj45566 : 能力測驗上作弊喔，嘻嘻

→ ilGroundhog : 重點是訓練便宜如果大規模訓練確實可能會顛覆AI市場169F 01/24 20:09

→ eriker : 通常中國人ai論文喜歡造假說超越sota 但畢竟沒人會170F 01/24 20:10
→ eriker : 這樣會浪費一堆算力證明造假

→ ilGroundhog : 如果可以便宜泛用的話對NV就不是好消息172F 01/24 20:10

→ asjh612 : 然後講中國ai paper 之前就聽過中國的有些是吹的173F 01/24 20:10

推 joygo : 正在用只能說好用174F 01/24 20:11

推 koll : 那麼厲害何必害怕晶片制裁狂拉貨?用爛晶片就好175F 01/24 20:11

→ asjh612 : 講別人無腦黑中自己才無腦親中笑死176F 01/24 20:11

推 mcgrady12336: 未來AI就中美有量能切入啊177F 01/24 20:11

→ eriker : 但這次被meta抓到deepseek造假好慘178F 01/24 20:12

→ joygo : 最近剛好在玩google 的和這隻互相179F 01/24 20:12

推 andy810306 : 某樓是不是在酸所有IC設計啊，應該用7奈米就好啊，180F 01/24 20:12
→ andy810306 : 一直想推先進製程幹嘛XDDD

→ JoeyChen : 歸結是成本的問題對吧?182F 01/24 20:13

→ andy810306 : 是不是廢到只能靠製程來掩蓋廢物設計能力啊183F 01/24 20:13

→ eriker : 不過我猜之後這種文會繼續洗反正普通人也不懂ai184F 01/24 20:13

→ b9513227 : 你們慢慢吵哥買tsm nv等看戲185F 01/24 20:13

推 bj45566 : 科技界名人包括 UC Berkeley 的 AI 教授都幫 DeepSe186F 01/24 20:13
→ bj45566 : ek 背書說它是 AI 的 "breakthrough" 了，股板鍵盤
→ bj45566 : 俠覺得自己比那些專家還懂 wwww wwww

推 s213092921 : Deepseek用閹割版H800就能做到，189F 01/24 20:13

推 shiowshay : 真的超強，只是不知道為什麼他無法回答我1989年6月4190F 01/24 20:14
→ shiowshay : 日有什麼歷史事件

→ asjh612 : nlp更好吹sota 反正自製dataset 別人亂做自己認真192F 01/24 20:14

推 asdf70114 : 終於要遙遙領先了193F 01/24 20:14

→ appledick : 中黑病發作194F 01/24 20:14

推 SunRoy : 英偉達的股價下跌我就信195F 01/24 20:14

推 joygo : 谷歌的很爛問股票問題不敢回答 chatgpt比較大膽196F 01/24 20:14

→ appledick : 哥布林不要只會網上酸拿出東西比較有意義197F 01/24 20:15

→ eriker : 怎麼不敢回答meta訓練15次開源的deepseek結果數據198F 01/24 20:15
→ eriker : 不如paper宣稱的？

推 sid3 : 有競爭是好事今年韓媒也有新聞200F 01/24 20:15

→ asjh612 : 教授也會被騙啊笑死以為教授多懂早就沒在做實驗201F 01/24 20:16

→ b9513227 : 我快笑死問中國最新jdk版本是啥跟我說17202F 01/24 20:16

→ eriker : 這不是造假不然是什麼203F 01/24 20:16

→ asjh612 : 是不是沒讀過研究所阿還吹教授204F 01/24 20:17

推 Gipmydanger : 中國贏麻了，只好加大禁令了205F 01/24 20:17

推 s213092921 : http://i.imgur.com/CYexcbJ.jpg206F 01/24 20:17

推 ilGroundhog : 對台積應該沒很大的影響就算少了輝達的訂單還有其他207F 01/24 20:18

推 bj45566 : 是啦，中國發表在 AI 論文都是吹的、假的！要隨論208F 01/24 20:18
→ bj45566 : 文附上的原始碼也都是假的！那些全世界 AI 專家組
→ bj45566 : 成的審稿 TPC 都是一群白癡廢物，怎麼可能比股板鍵
→ bj45566 : 盤俠更懂 AI 是吧？ wwww

→ eriker : 還是meta工程師都廢物有一堆h100 還訓練不好deepse212F 01/24 20:18
→ eriker : ek

推 andy810306 : 某樓自己能力差讀水貨研究所找廢物教授，以為美國214F 01/24 20:19
→ andy810306 : 教授跟你教授一樣廢，●●比雞腿，真的笑死

推 tomatobus : 教授審論文不會去嘗試reproduce吧，除非他叫底下的216F 01/24 20:20
→ tomatobus : 博士生去試

推 sa87a16 : 12億人口免費的運算怎麼輸218F 01/24 20:20

推 ilGroundhog : DS的初始模型是META的模型只是變得更有效率219F 01/24 20:20

推 bj45566 : 反正股板的無腦中黑覺得自己比所有業界、學界的知名220F 01/24 20:21
→ bj45566 : 專家都還要懂 AI wwww wwww

推 eriker : 更好笑的是pytorch就meta的開源還要比三小222F 01/24 20:21

→ tomatobus : 如果meta工程師無法reproduce，那可能真的有什麼貓223F 01/24 20:21
→ tomatobus : 膩。企業一定是最緊張的

→ asjh612 : 笑死開始嘴別人教授喔實際上就是這樣啦國外也是225F 01/24 20:21
→ asjh612 : AI paper一堆真的沒人有空一篇一篇跟你對

推 s213092921 : https://news.cnyes.com/news/id/5816770 人家早就227F 01/24 20:23
→ s213092921 : 預言了

谷歌前執行長施密特：AI這場史詩級競賽中國最終會贏過美國 | Anue鉅亨 - 科技

推 bj45566 : 頂尖會議那些學界業界最知名的專家的審稿委員當然會229F 01/24 20:24
→ bj45566 : 試跑隨論文附上的原始碼啊 -- 萬一原始碼有錯只有你
→ bj45566 : 抓不出來，你直接名聲掃地好嗎

推 ilGroundhog : 如果成功還是需要訓練模型只是算力降低很多232F 01/24 20:24

→ s213092921 : 2千多塊閹割版的H800只要訓練兩個月就超越Meta chat233F 01/24 20:24
→ s213092921 : GPT，美國可憐啊

推 eriker : 中國在paper也喜歡造假硬體明明用h100還說自己用h8235F 01/24 20:25
→ eriker : 00或是3080

哥
我沒有看到任何所謂Meta工程師沒辦法reproduce的資料來源@@
可以請你提供一下嗎

推 bj45566 : 美國一流大學教授就算是五六十歲都還在自己做研究、237F 01/24 20:26
→ bj45566 : 寫程式，井底之蛙覺得自己比 UC Berkeley 教授還厲
→ bj45566 : 害，哈哈哈哈

推 lepidoptera : 便宜很好啊大家股價修正一下重新開始240F 01/24 20:27

推 ntr203 : nv有什麼好怕的，越強的晶片不就代表可能做出越強241F 01/24 20:27
→ ntr203 : 的ai

→ appledick : 反觀台灣在AI運算這一塊484完全沒了243F 01/24 20:28

AI製造供應鏈台灣應該還是掌握得牢牢的

AI模型目前看起來是真的沒料

幾乎都是拿別人的成果fine-tune、扶不上牆

→ appledick : NV沒啥好怕啊軟體寫的好跟硬體強又不抵觸244F 01/24 20:28

→ shorty5566 : 真的看不太懂對nv利空在哪用現在最強的nv去算不245F 01/24 20:29
→ shorty5566 : 是更好更令人興奮嗎而且入門門檻降低對整個ai發展
→ shorty5566 : 都是好事集中在幾個大型csp才不好

推 s213092921 : https://reurl.cc/G5O0Nd 內文提到Deepseek使用閹割248F 01/24 20:29
→ s213092921 : 版的H800顯卡，中黑趕快面對現實吧
→ s213092921 : http://i.imgur.com/u8wpYYZ.jpg

美晶片戰難以對中國封喉 ? 彭博示警中國AI公司已突破「這1點」 - 自由財經

高佳菁／核稿編輯〔財經頻道／綜合報導〕日前，中國AI公司推出與ChatGPT功能不相上下的新模型，但訓練時間極短、且成本不高，恐被視為中國AI技術的躍進象徵。《彭博》專欄作家、美國喬治‧梅 ...

這紅媒吧?

推 lon0623 : 台灣人力有限，與其發展AI運算，倒不如找應用端251F 01/24 20:30

推 bj45566 : 無腦中黑已經無所不用其極在催眠自己一切都是假的 w252F 01/24 20:30
→ bj45566 : www pathetic SORE losers !!!

→ appledick : 中國一堆都是去拿Mac mini來跑meta的模型便宜又可254F 01/24 20:31
→ appledick : 以玩

※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 20:32:09

推 h0103661 : 這完全開源，是假的早就被抓了吧256F 01/24 20:31

→ s213092921 : 中國用2048張閹割版H800顯卡訓練兩個月就能超車Meta257F 01/24 20:31
→ s213092921 : 及GPT，誰要花大錢買一堆NV最新顯卡？

→ lon0623 : 不覺得台灣的做法有什麼錯誤，又不是有上億人口259F 01/24 20:31

→ h0103661 : 還是要先跟研究生解釋什麼叫開源260F 01/24 20:31

推 eriker : 你這篇的Lisan al …他說的就是這個意思261F 01/24 20:32

→ shorty5566 : 反過來說你用nv最強的顯卡去跑不是能進步得更快嗎262F 01/24 20:32
→ shorty5566 : ？還是你覺得ai的發展已經到盡頭了？

→ eriker : 他不是說meta訓練了15次deepseek v3結果還是比他們264F 01/24 20:33

https://i.imgur.com/mJn5POl.png

尷尬

他在說Meta用LLAMA 3的訓練成本可以訓練DeepSeek-V3 15次

much better model

這大概國中英文

要不是你語言能力有缺陷

就是真的很純的中黑

→ eriker : 宣稱的差嗎265F 01/24 20:33

噓 ggian123 : Don’t look up 大陸人還生活在水深火熱266F 01/24 20:33

→ shorty5566 : 挫勒蛋的絕對是那些開發模型的公司吧267F 01/24 20:33

推 lon0623 : 你覺得你想得到的NV想不到嗎?268F 01/24 20:33
→ lon0623 : NV有他厲害的地方，不是只有算力

推 chanceiam : 連繁體中文都不能回答的模型270F 01/24 20:34

→ eriker : 所以meta驗證了deepseek放出來的程式碼跟模型發現271F 01/24 20:34
→ eriker : 他們造假
→ eriker : …. 建議你看英文

是你的英文能力有缺陷。

我建議你別搞笑了

這真的在扯中黑的腿

→ jjjj222 : 高鐵, 六代機, 核融合, LLM, 每天吹, 吹完就沒了274F 01/24 20:35

推 scitamehtam : deepseek我有用，真的蠻好用的275F 01/24 20:35

→ shorty5566 : 開發模型的公司即將進入紅海倒是nv只怕大家都改用276F 01/24 20:35
→ shorty5566 : asic，但是門檻降低以後小型玩家可以進場，那些小
→ shorty5566 : 型玩家也沒能力調教asic 還是要跟nv買通用gpu

→ jjjj222 : 功能也就是騙騙白痴.. 特別是中國白痴279F 01/24 20:36

推 ilw4e : 就跟當初阿法狗一樣啊，deepmind搞出來後面一堆圍280F 01/24 20:36
→ ilw4e : 棋AI小模型一下全出來了。純軟體你只是靠暴力解算力
→ ilw4e : 堆，人家自然有優化後的更好解法，沒看openai也在回
→ ilw4e : 頭做優化跟即時的深度運算

→ scitamehtam : 我兩種都下載，都有用，後來都用deepseek284F 01/24 20:36

推 eriker : 開始抹中黑了？285F 01/24 20:38

連國中英文都不會

還想在這邊大談

還嗆我去讀英文原文

中黑搞不好都不承認你是隊友

如果你是中黑這會顯得除了無腦黑中國沒有什麽思辨能力=.=

推 kotorichan : 他能改用中芯晶片訓練更好286F 01/24 20:38

推 tsubasawolfy: 不然老黃幹嘛賣那台掌中型的AI機287F 01/24 20:39

→ CLinna : 國人捲出來的AI要打倒喝下午茶的工程師了嗎288F 01/24 20:39

推 poeoe : 那個英文很明顯在說15倍啦……289F 01/24 20:39

推 s0920151048 : 這不能說中國好話290F 01/24 20:39

推 s213092921 : http://i.imgur.com/4XDm3xB.jpg291F 01/24 20:39

推 eriker : 造假就造假還在那護航292F 01/24 20:40

推 ilw4e : 好像很多人誤以為AI是哪家先搞出AGI就贏了，現實是293F 01/24 20:40
→ ilw4e : 就算搞出以後所有人知道該怎麼做很快就會用自己的
→ ilw4e : 方法一樣能跟上，效率更好成本更低

→ tsubasawolfy: 另外推特翻譯那個GOOGLE翻得沒錯296F 01/24 20:40

→ shorty5566 : 他訓練還是要基於nv的gpu 用中芯的怎麼訓練297F 01/24 20:40

推 tomatobus : 笑了，原來尼的出處是那，還以為尼有什麼meta內部的298F 01/24 20:40
→ tomatobus : 消息

→ tsubasawolfy: 我覺得這比較像吹很久的edge AI踏出第一步300F 01/24 20:41

→ s213092921 : http://i.imgur.com/1rLNqD2.jpg301F 01/24 20:41

→ eriker : 那你抹中黑是怎麼回事？302F 01/24 20:41

→ appledick : 好啦假的啦造假啦中黑贏了可以吧303F 01/24 20:41

那個英文能力在這邊大談

強烈建議看看eriker的推文真的超好笑

→ eriker : 這樣是ok的我都在講deepseek304F 01/24 20:42

推 bj45566 : 無腦中黑在眾人面前證實了自己連簡單的英文都看不305F 01/24 20:42
→ bj45566 : 懂胡扯亂翻譯，嘻嘻 wwww wwww

推 poeoe : Meta訓練的預算拿來訓練Deepseek 都至少能訓練15次307F 01/24 20:42
→ poeoe : 了

→ tonyshan : 簡體的可以SKIP了309F 01/24 20:42

推 good5755 : 關鍵字:開源程式碼310F 01/24 20:42

→ appledick : meta 484太多冗員了啊311F 01/24 20:43

推 Fegnzi : 那些反智的人看不懂開源是什麼沒辦法，逢中就反真的312F 01/24 20:43
→ Fegnzi : 沒救

→ eriker : 所以質疑deepseek造假就是中黑？314F 01/24 20:43

可以質疑的

不過哥你的行為真的相當反智

跟中國人民說祖國疫苗No1差不多只是顏色不一樣而已

都是避著眼睛只相信自己相信的

噓 distantblc : 急了315F 01/24 20:44

→ eriker : 只會做人身攻擊316F 01/24 20:44

推 scitamehtam : 質疑？不是不行吧，要合邏輯…317F 01/24 20:44

→ eriker : 你在繼續318F 01/24 20:44

→ scitamehtam : 不然不就變成抹屎？319F 01/24 20:45

推 littenVenus : 這次中國真的會贏2次喔320F 01/24 20:45

→ appledick : deepseek如果不是中國研究我覺得你應該就不會質疑了321F 01/24 20:45

→ VicLien : 中國的天賦點在紅海化厲害了322F 01/24 20:45

推 bj45566 : 胡扯亂翻譯人家公開的英文說明(而且是用很簡單的英323F 01/24 20:46
→ bj45566 : 文)說是無腦都還太客氣了好嗎？ wwww wwww

→ appledick : 中國某些地方真的就是強啊當然某些地方是不敢恭維325F 01/24 20:46

→ scitamehtam : 先玩過再說..，我兩套都玩過，deepseek真的不錯326F 01/24 20:46

→ eriker : 如果deepseek不是中國的還會這樣罵人嗎？327F 01/24 20:46

→ scitamehtam : 小心釣魚，看他自己表演就好，建議啦328F 01/24 20:47
→ scitamehtam : 沒邏輯的講話最大聲

→ eriker : 我沒差反正我不會罵人我只評論deepseek330F 01/24 20:48

→ scitamehtam : 最近這版衛兵執勤很認真，桶了幾波了，自己小心331F 01/24 20:48

推 epephanylo : (看戲332F 01/24 20:48

→ eriker : 反倒是某些人小心333F 01/24 20:48

※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 20:49:43

推 bj45566 : 評論？胡亂翻譯人家的英文也敢叫做評論？笑死人有334F 01/24 20:49
→ bj45566 : 夠好笑 wwwww

噓 Kazetachinu : 一堆ai大老都中國人哪天超車都不意外軟體這種東西336F 01/24 20:50
→ Kazetachinu : 限制沒有硬體這麼多

→ asjh612 : 不過這篇推文這麼火熱沒半個人貼實例對話XDD338F 01/24 20:50

→ brella …

→ asjh612 : 之前gpt在紅的時候還有gpt幫忙回應的截圖340F 01/24 20:50
→ asjh612 : 覺得好的可不可以務實點去玩幾個例子貼來看看

推 yueayase : 大驚小怪，這種前沿的技術，本來就是湖鄉合作，及互342F 01/24 20:51
→ yueayase : 相競爭的

→ asjh612 : 讓我見識見識哪些是你們覺得好哪些是回應差的344F 01/24 20:51

推 scitamehtam : https://i.imgur.com/22NxkZC.png345F 01/24 20:51

推 duriamon : deepseek有手機app啊！自己下載來用用看不就知道了346F 01/24 20:52
→ duriamon : ？用email就可以註冊了。

→ yueayase : 湖鄉=>互相348F 01/24 20:52

→ scitamehtam : 剛好今天才在用..349F 01/24 20:52
→ scitamehtam : 反倒是批評的？….

→ holebro : 中國軟體強度上下限差很大遇過一堆中國客戶連用AI351F 01/24 20:53
→ holebro : 幫忙寫sql寫shell script寫yaml都不會= =

→ scitamehtam : 我兩套都常用啦，我自己112csie，也有研究ai主題353F 01/24 20:53

推 kakiandkaka : 笑翻，被反向354F 01/24 20:53

→ duriamon : 樓上可以要他用正體中文回答。355F 01/24 20:53

推 s213092921 : http://i.imgur.com/wsl43l7.jpg356F 01/24 20:53
→ s213092921 : http://i.imgur.com/DUAvbcI.jpg

→ scitamehtam : 倒是爬蟲後，發現一堆嘴的頭頭是道，結果背景令人358F 01/24 20:53
→ scitamehtam : 驚訝XDDD

推 ezreal1315 : 這就是第一個開頭的和跟班的差距啊第一個一定要砸360F 01/24 20:54
→ ezreal1315 : 大錢開發後面的當然可以降低成本

→ asjh612 : 就是不想註冊阿... 試想會黑的怎會想用362F 01/24 20:54

→ scitamehtam : 沒用過說的好像很熟一樣XDD 實事求是XDD363F 01/24 20:55

→ ezreal1315 : 哪個行業不是這樣開拓者都是要付出最多的364F 01/24 20:55

推 s213092921 : 問題是開拓者能否一直保持領先優勢，看看Nokia跟Mot365F 01/24 20:56

→ scitamehtam : 所以我說，爬蟲後的心得，就是推文自己小心，最近審366F 01/24 20:56
→ scitamehtam : 查異己言論很勤勞的

→ s213092921 : o蘿拉的下場368F 01/24 20:56

→ asjh612 : http://i.imgur.com/LdGLuCI.jpg 看起來也有回答到?369F 01/24 20:56

推 NCUking : DeepSeek是猛在CP值超級高370F 01/24 20:56

推 TIPPK : 台灣軟體公司好少371F 01/24 20:56

推 bj45566 : 連註冊都沒有就拼命在黑？ wwww 人家台大資工親自372F 01/24 20:57
→ bj45566 : 試用還截圖給你耶

→ NCUking : OpenAI 目前還是領頭羊沒問題374F 01/24 20:57

噓 zebra101 : 笑死，人家明明在說META用了15倍的預算，更好的GPU375F 01/24 20:57

推 guanting886 : 我覺得一般用戶蠻鼓勵開發團隊都跳進甕被練蠱376F 01/24 20:57

→ zebra101 : ，卻訓練出了比DS更差的模型，英文到底怎麼讀的，co377F 01/24 20:57
→ zebra101 : uld have看不懂嗎？

→ NCUking : 台灣搞LLM只能玩微調套皮379F 01/24 20:57

推 ezreal1315 : 所以說買大盤真安心啊 20年前市值前10公司跟現在380F 01/24 20:57
→ ezreal1315 : 比已經大洗盤

→ deangogi : 所以上面eriker說的meta復現準確度有原文嗎?382F 01/24 20:58

推 scitamehtam : 我平常兩個都在玩啊，我沒說chatgpt不好吧？383F 01/24 20:58

推 duriamon : AI領域大陸那邊跟美國的差距本來就不大，有在關心AI384F 01/24 20:58
→ duriamon : 相關研究的大概都知道在說什麼，尤其中文大語言模型
→ duriamon : 就唯一只有大陸那邊的能打，反觀台灣研發的真的很爛
→ duriamon : ，呵呵！

推 eriker : 沒有嘻嘻388F 01/24 20:58

推 symeng : 暫時觀望389F 01/24 20:59

→ asjh612 : 你問他llm吹很厲害的有多少在搞啊誰有空每個都試390F 01/24 20:59

推 ezreal1315 : 我覺得不用太緊張啦人家用H800真的能超越openai391F 01/24 20:59

→ deangogi : 你說的如果是原po貼的那段翻譯應該是你翻譯的問題392F 01/24 20:59

→ ezreal1315 : 我相信股價早就被灌下來灌爛了那些大戶一定第一393F 01/24 20:59
→ ezreal1315 : 個跑的

噓 zebra101 : 那個eriker連最基本的英文都讀不懂395F 01/24 20:59

推 aac219oo : 我看有很多人都不知道自己用的網站是用vue3寫的396F 01/24 20:59

推 w300204 : costdown誰的比得過華人397F 01/24 21:00

推 NCUking : 中國軟體實力本來就是天下第二了398F 01/24 21:00

推 abc21086999 : https://i.imgur.com/fo3jbRR.png399F 01/24 21:00
→ abc21086999 : 中國特色社會主義式的AI

→ ezreal1315 : 或者是就算如此巨頭也不會降低支出怕被同行超越401F 01/24 21:01

推 Samurai : 先不說是不是真的，但逢中必反那個鳥樣，酸別人砸402F 01/24 21:01
→ Samurai : 錢研發有夠莫名其妙

→ asjh612 : copilot claude gemini gpt llmam 每個新出的都sota404F 01/24 21:01

推 duriamon : 還有人以為是costdown啊？不虧是台灣代工老舊代工思405F 01/24 21:01
→ duriamon : 維，那些發展AI的人才經費花費成本真算下來哪裡cost
→ duriamon : down了？

→ abc21086999 : Gemini thinking 答的就沒問題408F 01/24 21:02
→ abc21086999 : https://i.imgur.com/bQT9dQz.png

噓 gstym : 中國晶片都可以去買別人的晶片來磨改名字了==410F 01/24 21:02

推 scitamehtam : 說真的chatgpt也能回答這題XDD411F 01/24 21:02

→ asjh612 : 搞不懂別人的問題點還在以為我在黑中國412F 01/24 21:03

→ duriamon : 台灣的老問題上次已經講過了，目前全世界先進的未來413F 01/24 21:03
→ duriamon : 科技領域除了「我們有台積電」之外每一個能打的。

→ scitamehtam : 但好笑的是，拿這題當評斷AI的標準XDD415F 01/24 21:03

→ asjh612 : 問題是現在每個llm都吹自己最強當我是llm測試員哦416F 01/24 21:03

→ scitamehtam : 很顯然不是理工人吧XD417F 01/24 21:03

→ Mytsb2421 : 美國變成copy cat418F 01/24 21:04

推 iaminnocent : deepseek不採用預標數據集（也就是先由人類標記數419F 01/24 21:04
→ iaminnocent : 據再給模型訓練）而是直接採用強化學習，自己訓練
→ iaminnocent : 自己，並且透過他們的局部Token啟動機制，可以減少
→ iaminnocent : 使用量，這也是為什麼Deepseek能夠大幅降低訓練成
→ iaminnocent : 本的原因，不確定OpenAi 或是其他AI模型，為什麼沒
→ iaminnocent : 有進行強化學習

→ scitamehtam : 所以才說，爬蟲後，再看一次推文會很有趣啊XD 另，425F 01/24 21:04
→ scitamehtam : 你知道ptt主機放哪？XD

推 Samurai : 意識形態死腦筋沒救，拿六四事件當評斷AI標準XD427F 01/24 21:04

推 bella1815 : https://i.imgur.com/0e69P5N.jpeg428F 01/24 21:05

推 s213092921 : 因為美國只相信大力出奇蹟那套，砸錢砸算力429F 01/24 21:05

推 Lenney33 : 成本更低美國科技巨頭情何以堪430F 01/24 21:05

→ iaminnocent : 但是這確實是對AI界投下震撼彈吧，不過OpenAI改用431F 01/24 21:05
→ iaminnocent : 自主強化學習，不知道是否可以

噓 abc21086999 : 理工人又在打手槍自慰啊433F 01/24 21:06
→ abc21086999 : 會審查訊息的AI就算在某方面超越其他人也是不可能
→ abc21086999 : 普吉的
→ abc21086999 : *普及

推 tw77769 : 阿姨的機會來了437F 01/24 21:06

→ iaminnocent : DEEPSEEK 的數據集也許確實有部份來自ChatGPT，但438F 01/24 21:07
→ iaminnocent : 這並不影響他確實是一個蠻厲害的模型

推 bj45566 : 又有人硬要扯到晶片了。公開的論文告訴你實驗環境、440F 01/24 21:07
→ bj45566 : 算法流程、效能評比；原始碼放在大家都可以下載的 G
→ bj45566 : itHub 上，這要怎麼作弊？？？

推 scitamehtam : 就事論事，如果你說會不會普及，那就另外一題了，443F 01/24 21:07
→ scitamehtam : 請另闢蹊徑吧

推 a558815 : Deepseek 是真的有些東西啊445F 01/24 21:07

推 tsubasawolfy: OPENAI的O3就是RL壓聖誕節前的13天倒數也有RL出現446F 01/24 21:08
→ tsubasawolfy: O3就是O1 RL來的省去訓練成本

推 ggbi4zzz : 美國人都害怕被中國ai超越，還有中國黑認為是在吹448F 01/24 21:09
→ ggbi4zzz : 牛逼而已

推 minazukimaya: 還好它開源同樣的演算法創新讓資源更多的美國科技450F 01/24 21:09
→ minazukimaya: 巨頭來用以他們握有的訓練資源能產出更驚人的結果

推 s213092921 : http://i.imgur.com/vaz7qmE.jpg 誰抄誰啊嘻嘻452F 01/24 21:10

→ eett811025 : 碼農996用肝跟你拼了453F 01/24 21:10

推 bread1110 : 這鯨魚真的邪門花少少的預算幹大事 meta最好撐住啊454F 01/24 21:11

推 minazukimaya: 但感覺AGI和技術奇點的時間又被提前了.......455F 01/24 21:11

→ s213092921 : 中國AI公司因為算力受限，只好動腦另闢蹊徑，走出一456F 01/24 21:11
→ s213092921 : 片天，高階晶片也是一樣的道理

噓 qazwsx0128 : 夠便宜我就自己訓練一個458F 01/24 21:11

→ minazukimaya: 這才是最恐怖的吧感覺2030年前就要奇點了459F 01/24 21:11

推 iaminnocent : 那就對啦O3開始用RL的話，大概又會反超吧460F 01/24 21:12

→ fywei : 真的好恐慌 zzz 嚇死人只好再睡一下461F 01/24 21:12

推 nfsong : 開源的只能導入462F 01/24 21:12

噓 ishdtt598 : 跟文組講那麼多幹嘛笑死463F 01/24 21:12

→ nfsong : 論文都出了464F 01/24 21:12

推 eliteark : 繼續吹起來我要看到血流成河465F 01/24 21:13

推 LBJshit : 傻鳥真的很傻很北七一直那邊說DS造假我還以為是真466F 01/24 21:13
→ LBJshit : 的有什麼內幕勒。結果他媽的是英文太爛根本自己完全

→ nfsong : 跟股票一樣有錢人不會輸468F 01/24 21:13

→ LBJshit : 搞錯連下面有中文的正確翻譯也不看469F 01/24 21:13

→ nfsong : 導入以後 3000e 的就更猛470F 01/24 21:13

推 cay86714 : AI究極鬼故事！471F 01/24 21:14

→ nfsong : 550萬就這麼猛 3000e的 6倍猛472F 01/24 21:14

推 iaminnocent : 那個貼文確實是說Meta的訓練費用都可以訓練15次Dee473F 01/24 21:14
→ iaminnocent : pseek了

→ shorty5566 : 傻鳥真的北七前幾天還看到黃仁勳去中國就瘋狂崩潰475F 01/24 21:14
→ shorty5566 : 的

推 duriamon : OpenAI的問題是核心科學家走了477F 01/24 21:14

→ gn7722 : 就跟現在的預算一樣478F 01/24 21:15

→ iaminnocent : O3我記得之前altman有貼出他的比較，好像比O1強不479F 01/24 21:15
→ iaminnocent : 少，但是當然費用很貴，如果OpenAi把這個開源的機
→ iaminnocent : 制拿來用不知道行不行

→ cay86714 : 如果這是真的那麼那些CSP之後的資本支出根本不用那482F 01/24 21:16
→ cay86714 : 麼高嘻嘻

推 g27834618 : 訓練費降低是利多啊趕緊出殺手級應用才是正軌484F 01/24 21:16

推 littenVenus : 老黃484蛋雕惹QQ485F 01/24 21:17

推 duriamon : 訓練費代表所需的時間成本、算力跟電費等，自己想想486F 01/24 21:17
→ duriamon : 看囉！

→ littenVenus : 電力需求應該也不用那麼多吧488F 01/24 21:17

→ cay86714 : 不過這件事沒多久前國內投資圈就有一些人知道了，489F 01/24 21:18
→ cay86714 : 就看市場什麼時候反應了嘻嘻

→ iaminnocent : OpenAI比較像是他有很多資訊，當你詢問他時，他會491F 01/24 21:18
→ iaminnocent : 依據他的知識庫中去找尋資料，並且給你。DEEPSEEK
→ iaminnocent : 則是有很多專門的朋友，會依據問的問題，分配給適
→ iaminnocent : 合的專門朋友去找資料回答（也就是不會全部Token調
→ iaminnocent : 動，可以減少Token使用量）

推 beesee : 訓練方式很華人496F 01/24 21:19

→ littenVenus : 窩是上禮拜看節目聽一個物理學博士在分析497F 01/24 21:20

推 Samurai : 老黃沒差吧，算力永遠不夠，相同算力能做的事情更498F 01/24 21:20
→ Samurai : 多了，加速科技發展，是軟體公司要頭痛了，拼肝拼
→ Samurai : 軟體效率拼不過華人

推 s213092921 : 國外有大神用兩台M3晶片的蘋果電腦搭載運行Deepseek501F 01/24 21:20
→ s213092921 : 邏輯模型XDD

推 usereminem : 一堆人仇中仇到腦子壞掉了可悲503F 01/24 21:20

推 yusanhu : 厲害504F 01/24 21:21

→ littenVenus : DS是分區塊各領域專門訓練505F 01/24 21:21

推 duriamon : 沒錯，deepseek是MoA架構。506F 01/24 21:22

推 minazukimaya: 演算法創新會反過來創造出新的算力需求啊因為對智507F 01/24 21:22
→ minazukimaya: 能的追求沒有上限更高效的演算法=更快到奇點

噓 tw19930419 : 一堆低能中黑看了就好笑509F 01/24 21:23

推 ilw4e : 哈哈黑黑不知道一堆模型都會說他是chatgpt，因為監510F 01/24 21:24
→ ilw4e : 督學習步驟最多人用的就是拿chatgpt當那個監督模型

推 s213092921 : https://b23.tv/R7tEm3q512F 01/24 21:24

噓 cosmite : 剛問了美國地47屆總統是誰，連這個都答不出來，資513F 01/24 21:24
→ cosmite : 料庫還停在2023（模型為DeepSeekV3）
→ cosmite : https://i.imgur.com/XXmbi1v.jpeg

推 bj45566 : OpenAI o3 是非開源碼啊，而且最近被揭露它表現最516F 01/24 21:24
→ bj45566 : 驚人的 FrontierMath 指標有作弊的嫌疑！相關的英
→ bj45566 : 文報導和討論不少，這裏給一個實例！
→ bj45566 : https://tinyurl.com/yw55fcwk

OpenAI Secretly Funded Benchmarking Dataset Linked To o3 Model

OpenAI secretly funded and had access to a benchmarking dataset, raising questions about high scores achieved by its new o3 AI model. ...

→ cosmite : ChatGPT-4則沒有問題520F 01/24 21:25
→ cosmite : https://i.imgur.com/oGA0Blp.jpeg

推 fattyeddie : 連ai都能卷了不起我的國522F 01/24 21:26

→ bj45566 : P.S. 那隻看不懂國中等級英文的中黑歡迎繼續跳出來523F 01/24 21:26
→ bj45566 : 吶喊丟人現世 wwww wwww

→ duriamon : 因為deepseek不用運轉那麼多參數來產生回答，而Open525F 01/24 21:26
→ duriamon : AI的必須要，所以以電力消耗、算力消耗跟微型化來說
→ duriamon : 都不利，但也不是代表這樣不好。我是覺得OpenAI自從
→ duriamon : 變成Altman的玩物之後，進步幅度有限，反而吹噓成分
→ duriamon : 增加了，呵呵！

推 minazukimaya: DeepSeek有價值的地方不是它自身模型有多強..530F 01/24 21:26
→ minazukimaya: 而是他提出的創新可以被其他有更大訓練集和更多算力

推 KOKEY : 差別在喝的茶葉或咖啡比較貴啦532F 01/24 21:27

→ minazukimaya: 的公司複用533F 01/24 21:27

→ duriamon : 強的是訓練的方式，裡面的秘密我相信應該沒有開源，534F 01/24 21:27
→ duriamon : 呵呵！

推 bj45566 : 現在面臨作弊醜聞的反而是美國 & 世界最強的非開源536F 01/24 21:28
→ bj45566 : 碼 OpenAI o3

推 DCapple : 又贏了又贏了，中国贏兩次538F 01/24 21:28

推 tw19930419 : 那叫做他沒有使用網路不是他不會問這種沒鑑別度的539F 01/24 21:28
→ tw19930419 : 蠢問題要證明什麼

推 Samurai : 不要再搞笑了，他的資料庫到2023年根本就不是什麼541F 01/24 21:29
→ Samurai : 缺陷，只差在有沒有網路搜尋最新資訊而已

推 minazukimaya: DeepSeek很公開啊演算法和工程改進都寫在論文裡543F 01/24 21:29

推 littenVenus : 那個博士認為因為成本優勢注定美國以外地區會傾544F 01/24 21:29
→ littenVenus : 向DS 所以DS將是最後贏家

→ minazukimaya: 真的是還好它夠公開546F 01/24 21:30

推 raygod : 加大制裁547F 01/24 21:30

→ minazukimaya: 不過它也是站在一堆前輩肩上現在給人站肩膀這就是548F 01/24 21:30

推 Samurai : 意外的是DS竟然這麼大方公開研究方法549F 01/24 21:30

→ minazukimaya: 科學研究啊550F 01/24 21:30

推 runacat : 論文都出來了551F 01/24 21:31

推 QuuEgg : 哇啊，削價競爭欸552F 01/24 21:32

推 bj45566 : DeepSeek 如果在演算流程上沒有開創性的突破，美國553F 01/24 21:33
→ bj45566 : 業界大老絕對不會用 "breakthrough" 來形容啦，這
→ bj45566 : 個字義和 "cost down" 或 "內卷" 相差十萬八千里 -
→ bj45566 : - 而且 " cost down" 是標準的台式英文

推 wchang : 好到不可思議的好，就是假的557F 01/24 21:33
→ wchang : 跟運動員吃禁藥一樣，不是apple 對apple

推 Mosskappa : Buy the rumor559F 01/24 21:34

推 tpkgo : 讓子彈飛一會兒~~~~560F 01/24 21:34

推 minazukimaya: 令人恐懼的反而是模型的效率一日千里對齊的研究牛561F 01/24 21:35
→ minazukimaya: 步慢行...
→ minazukimaya: 根本是直通文明毀滅的最短路線XD

→ tonyshan : 看起來就改進一個東西就吹到天上去564F 01/24 21:36

→ minazukimaya: DeepSeek把人類文明的毀滅倒數時鐘又撥快了一格565F 01/24 21:36

推 tompi : DS API的費用是 o1 的1/30566F 01/24 21:37

→ minazukimaya: DeepSeek可不止改進一個東西論文都有白話技術文也567F 01/24 21:37

推 tsubasawolfy: 不用擔心OPENAI 那個瘋子一心只想要真的AGI 就跟馬568F 01/24 21:37

推 bj45566 : 樓上是在說 OpenAI 的 FrontierMath benchmark 嗎？569F 01/24 21:38
→ bj45566 : 好到不可思議結果...

推 duriamon : 沒辦法，讓AI對齊人類的道德沒辦法賺錢，呵呵！571F 01/24 21:38

推 mamorui : 這個應該不怎樣吧去年看太多篇宣稱更頂驗證一下572F 01/24 21:38

推 tpkgo : 中國很會利用別人的研究偷雞先聽聽就好573F 01/24 21:38

→ mamorui : 就沒戲了 @@574F 01/24 21:38

→ tsubasawolfy: 斯克一心想上火星一樣賽道不同575F 01/24 21:38

→ minazukimaya: 有至少在大膽創新+高效工程這兩方面是非常優秀的576F 01/24 21:38

推 wsung : 已經玩了一整天的R1，真的不差577F 01/24 21:38

→ mamorui : 去年一堆現在不是很愛看中國出的論文拿到長官面578F 01/24 21:38
→ mamorui : 前介紹都容易被罵

推 bj45566 : 人家原始碼、論文跟效能測試結果都公佈了啊，請問580F 01/24 21:41
→ bj45566 : 樓上舉例一下哪個說自己更頂的有公開這些？好酸的
→ bj45566 : 葡萄 wwww

推 minazukimaya: 中國一堆騙錢公司是事實但DeepSeek和他們不一樣也583F 01/24 21:41
→ minazukimaya: 是事實這兩個事實又不衝突...

推 mamorui : 不是啊論文就是有新方法數據更漂亮但實驗效果585F 01/24 21:42
→ mamorui : 跑了不佳真的有啊

推 NTUCS : 藍白糞高潮587F 01/24 21:43

推 bj45566 : 樓上中黑請解釋一下人家論文、原始碼都公開的情況下588F 01/24 21:43
→ bj45566 : 要怎麼「利用別人的研究偷雞」？只會無腦黑嗎？

噓 naushtogo : 最近炒作很大，讓我們繼續看下去590F 01/24 21:43

→ mamorui : 我找一下我有標記過591F 01/24 21:43

推 s800525 : 說減少算力能達到一樣效能，那一樣算力不是能達到更592F 01/24 21:43
→ s800525 : 高效能？為何要以減少算力為前提？

→ NTUCS : 論文公布了但能 repro 嗎594F 01/24 21:43

→ bj45566 : 請問有哪個可信消息來源說「實驗結果不佳」？又在595F 01/24 21:44
→ bj45566 : 自己腦補嗎？

推 tpkgo : 原始碼公開又不代表什麼你是沒看過原始碼公開喔!!597F 01/24 21:44

→ NTUCS : 你不是藍白糞幹嘛入座598F 01/24 21:44

推 mamorui : 啊像那個LLaMA-omni就是同事報告時直接露餡599F 01/24 21:45

→ s800525 : 說能事半功倍，那不能事倍功四倍嗎？600F 01/24 21:45

→ mamorui : 開源就可以去repro601F 01/24 21:45

推 vtgc161 : 論文出來了，所以有人可以說明一下，他到底是不是拿602F 01/24 21:47
→ vtgc161 : 現有Ai模型為底去訓練的嗎

推 mamorui : 要跑過才知道604F 01/24 21:47

推 bj45566 : 原始碼公開多久了？美國頂級業界學界大老也高度評605F 01/24 21:48
→ bj45566 : 價讚賞，台大資工板友也早就註冊測試覺得表現很好了
→ bj45566 : -- 請問中黑還要怎麼樣才願意承認人家做出一個好東
→ bj45566 : 西？？？

→ mamorui : 等哪天這個技術在公司一堆人講才是真的我現在沒聽609F 01/24 21:48
→ mamorui : 到就是了

你公司如果在做AI模型研究/工程的

這幾天全公司上下應該都在研究這個

推 duriamon : 簡單來說就是最近有一個新的AI能力測驗，找了好幾位611F 01/24 21:49
→ duriamon : 費爾茲數學獎得主來出超高難度題目，幾乎所有AI模型
→ duriamon : 都回答得跟屎一樣，只有o3脫穎而出，大家正震驚Open
→ duriamon : AI的技術力時，被爆料出來因為這個AI能力測驗OpenAI
→ duriamon : 有贊助能事先拿到題目作弊，Altaman的作為我是不意
→ duriamon : 外啦！呵呵！

推 minazukimaya: 你現在沒聽到要啟MoE項目只是表示你公司不在最前沿617F 01/24 21:49

→ cclemon1231 : 對岸弱點還是0到1，但改造能力真的很強618F 01/24 21:49

推 bj45566 : 看來你待的公司比 Meta AI 還強 wwww wwww619F 01/24 21:49

推 sleepinggod : 成本低，跟使用者收費就可以便宜620F 01/24 21:50

推 mamorui : 因為老馬的之前也拿過高分。就看囉621F 01/24 21:50

噓 yunf : 機器之心是誰？622F 01/24 21:51

→ minazukimaya: 現在最前沿的美國公司一定會啟新項目投入MoE方向了623F 01/24 21:51

推 good5755 : 分領域導出答案假如問題是跨領域不就GG了624F 01/24 21:51

→ mamorui : 沒有啊大家也是會謹慎看結果 OpenAi在很多篇論文625F 01/24 21:51
→ mamorui : 數據都平均佳所以謹慎看待每一版表現囉

推 davis5566 : 說個事實某些人就開始藍白粉壯世代的這些爛貨627F 01/24 21:52
→ davis5566 : 還是早點被時代淘汰吧

→ mokipu : 拉板凳看戲629F 01/24 21:52

推 dwood123 : 這說明小公司也可作出好的模型，那大家就會躍躍欲630F 01/24 21:52
→ dwood123 : 試，Al伺服器需求也會增加啊！

推 duriamon : 其實MoA架構比較符合人類的思考方式，人類大腦功耗632F 01/24 21:52

※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 21:53:14

→ duriamon : 才30W參數量才4GB，演化的威能不是蓋的。633F 01/24 21:52

推 sleepinggod : 台灣不應該發展中文語言模型，教授都嘛拿國家錢產出634F 01/24 21:53
→ sleepinggod : 沒用的東西。直接全民學英文比較有效率

推 bj45566 : duriamon 板友講的 OpenAI o3 在高難度數學測驗的涉636F 01/24 21:53
→ bj45566 : 弊醜聞我在樓上就貼了一個應為報導短網址了，現在 A
→ bj45566 : I 圈內最被懷疑的反而是這個

→ good5755 : 而且重點是資料庫吧目前以資料庫取得難易程度639F 01/24 21:53

→ duriamon : 有Altman亂搞，OpenAI遲早會完蛋，我先預言在這邊，640F 01/24 21:54

→ good5755 : 對岸的13億免費資料庫真的比歐美簡單多了641F 01/24 21:54

→ duriamon : 呵呵！642F 01/24 21:54

推 mamorui : 我記得OpenAI數學不好吧643F 01/24 21:54

→ bj45566 : *英文報導644F 01/24 21:54

推 tpkgo : Meta AI不錯但現在使用者標竿是OpenAI645F 01/24 21:54

推 akwa : 一堆井蛙還是不信呵呵646F 01/24 21:54

→ bj45566 : 難怪你待的公司沒人在討論 DeepSeek，都 2025 年了647F 01/24 21:55
→ bj45566 : 還在講 OpenAI 數學不好，嘻嘻 wwww wwww

推 mamorui : 對 OpenAI是標竿因為大多比較數據出在別人的論文649F 01/24 21:55
→ mamorui : 裡 GPT都平均拿到最佳但數學是真的爛

→ bj45566 : OpenAI 涉嫌作弊的是普通人一輩子都碰不到邊的 Fron651F 01/24 21:56
→ bj45566 : tierMath benchmark !!!

→ duriamon : 現在由於用於訓練AI模型所使用的開源資料已經幾乎耗653F 01/24 21:56
→ duriamon : 盡，現在流行的是新型AI架構的研發以及超參數的蒸餾
→ duriamon : 和分析，如何從已經有的超參數產生更好的產品才是顯
→ duriamon : 學。

→ mamorui : 我是沒有很常使用數學相關的沒錯。記憶停在數學爛657F 01/24 21:56
→ mamorui : 沒錯

推 sweetantt : o3應該不久後就會出來了吧而且免費用戶也有o3 mini659F 01/24 21:56
→ sweetantt : 到時候就知道openAI有沒有吹牛了

→ duriamon : 看那個整天吹噓的Sora我是不期待啦！呵呵！661F 01/24 21:57

→ bj45566 : 還在繼續幻想說 OpenAI o3 數學爛 wwww 人家輕鬆碾662F 01/24 21:57
→ bj45566 : 壓你好嗎！

噓 cityhunter04: 叫美國時代過去之前，他科技還是屌打世界2-30年…664F 01/24 21:58

→ duriamon : 新的架構我覺得會是比較有趣的發展，傳統的transfor665F 01/24 21:59
→ duriamon : mer已經差不多了。
→ duriamon : 說是傳統不過也才2-3年的事，AI發展就是這麼競爭，
→ duriamon : 呵呵！

推 mamorui : 等很多paper報告看到比較時DS贏再說吧最近兩個月669F 01/24 22:00
→ mamorui : 沒時間看paper 小組報告都延期了趕年末案子要GM

推 bj45566 : OpenAI o3 的 AIME 2024 benchmark 分數是 96.7% 好671F 01/24 22:05
→ bj45566 : 嗎？

推 mamorui : o3不是12月才推出嗎我剛好沒用哈以前很爛是真673F 01/24 22:07
→ mamorui : 的

推 Tsukasa0320 : 很好啊有威脅度才有理由打死675F 01/24 22:07

→ mamorui : 那我就期待一下2025的各大paper囉676F 01/24 22:07

推 bj45566 : OpenAI o3 現在被質疑的 FrontierMath benchmark 是677F 01/24 22:07
→ bj45566 : 絕大多數人一輩子都碰不到的高等數學

噓 k798976869 : meta就是故意開源AI不給微軟賺的還在演啥679F 01/24 22:08

推 bj45566 : 又在講笑話了，嘻嘻。OpenAI 在 AIME benchmark 早680F 01/24 22:09
→ bj45566 : 就超過大部分人的數學水準了 wwww

推 popo123456 : 丸子,台積和美股7巨頭都要暴跌682F 01/24 22:10

→ bj45566 : 難怪你的公司沒聽過 DerpSeek，嘻嘻 wwww683F 01/24 22:10

推 mamorui : 教科書的數學是可以邏輯陷阱還是會踩684F 01/24 22:10
→ mamorui : 聖誕節才發布不要急哇

推 DA3921999 : 只要中國的開發者還開源就不可能贏美國啦，美國穩的686F 01/24 22:12

→ lon0623 : 暴跌就想太多了，尤其台積本益比才二十幾687F 01/24 22:12

推 bj45566 : 開源的遠不只 Meta 一家，DeepSeek 是用少得嚇人的688F 01/24 22:12
→ bj45566 : 成本打平、打敗檯面上所有的開源大語言模型

推 shorty5566 : NV盤前大跌-0.5% 蒸的丸子690F 01/24 22:13

→ abc21086999 : 為什麼有人要為了中國的AI很厲害感到自豪？691F 01/24 22:13

→ lon0623 : 你問中國用的晶片是不是台積做的692F 01/24 22:14

推 mamorui : 我也不知道而且我習慣謹慎多看幾版693F 01/24 22:14

→ lon0623 : 而且AI只是台積的一部分而已694F 01/24 22:14

推 MumiPyonPyon: Deepseek不是open的嗎@@695F 01/24 22:15

推 bj45566 : 因為 DS 狠狠打臉股板數不清的無腦中黑啊，嘻嘻 www696F 01/24 22:16
→ bj45566 : w
→ bj45566 : 連 OpenAI 數學早就很強都完全不知道的人說自己「
→ bj45566 : 謹慎」 wwww wwww
推 bj45566 : 看到無腦的____ 被狠狠打臉就覺得爽快是人之常情吧
→ bj45566 : wwww

推 loveyou9527 : 兄弟聽我說這個ds 有料702F 01/24 22:21

→ yunf : 真的沒什麼好爭的就看你能拿它來做什麼有真的帶來703F 01/24 22:21
→ yunf : 創造性的價值那就是對你有利的

推 lon0623 : 料敵從寬也不是壞事阿，多多想台灣有什麼能介入的705F 01/24 22:22

→ yunf : 黑貓白貓會抓老鼠的就是好貓706F 01/24 22:22
→ yunf : 如果他再厲害不能為你所用也是沒用

噓 verydolungbe: 支那XDXDXD 聽聽就好708F 01/24 22:23

→ yunf : 謝遜拿了屠龍刀雙眼失明頂多拿來砍樹709F 01/24 22:24

推 lon0623 : 中國景氣不好有時對科研反而有好處，逼人去研究710F 01/24 22:24

推 s800525 : 有更好的算法能產生更快投入市場，就會有更多廠商願711F 01/24 22:24
→ s800525 : 意堆更多硬體來搶佔市場，永遠沒人在嫌硬體效能過剩
→ s800525 : 的

噓 heart9677 : 想想半導體造假，先觀望一下好了714F 01/24 22:24

→ yunf : 沒有不好好嗎每天那麼多人張口就是要吃飯715F 01/24 22:25
→ yunf : 吃的用的沒少過只是沒有以前這樣亂花

推 k91011022 : 資料都被分析完那就有可能走向預測了717F 01/24 22:25

推 mamorui : 很快的。論文1、2個月內會有一堆去證明。718F 01/24 22:26

→ lon0623 : 連他們自己一堆人都在說景氣下行了，不用否認719F 01/24 22:26

推 s800525 : 這個方法好，那當所有人都用這方法，那最後不是還是720F 01/24 22:26
→ s800525 : 拚誰堆的硬體多？

推 knml : 自己去用用看不就得了，免費722F 01/24 22:26

→ lon0623 : 要推廣給更多人用，還是要硬體阿723F 01/24 22:27
→ lon0623 : 甚至能普及的話，硬體需求更多

推 mamorui : 是要看驗證數據不同篇會用不同場景要解決的問題去725F 01/24 22:28
→ mamorui : 驗證我不可能自己去弄那個資料

推 s800525 : 現在反而怕應用普及不了到一般消費者，硬體需求反而727F 01/24 22:28
→ s800525 : 曇花一現，真能更快達到普及至消費端，硬體需求才真
→ s800525 : 的會井噴

推 ab4daa : $$$$$$$$$$$$$$$730F 01/24 22:29

→ Rickyyy : 裁員滾滾，股價又可以噴噴731F 01/24 22:29

→ lon0623 : 這就跟省油車出來，汽車反而賣更好的道理依樣732F 01/24 22:29

推 js52666 : 小金庫被拆了733F 01/24 22:30

推 goal56 : 中國人比較卷贏美國早晚的734F 01/24 22:30

推 lon0623 : H800 GPU不也是NV的嗎?735F 01/24 22:31

→ yunf : 半年整個指數漲了快¼你說經濟很差？736F 01/24 22:32

推 s800525 : H800效果就很好，那用GB200不就飛天了？737F 01/24 22:33

推 minazukimaya: 模型是科研應用是商業其實這兩件事關連不大~~738F 01/24 22:33
→ minazukimaya: 商業上還是擁有直接面對消費者布署能力和通路的巨
→ minazukimaya: 頭們優勢最大

→ yunf : 1990年到現在漲了10倍741F 01/24 22:36

→ thigefe …

推 s800525 : 港股一年來漲了26.20%，但5年來跌了28.21%，所以說743F 01/24 22:37
→ s800525 : 經濟不好沒問題吧？而且比疫情時期還低就更慘了...

→ yunf : 那只是一個相對的概念745F 01/24 22:38

推 lon0623 : 中國政府都在催促國家隊進場買股了，這樣叫好?746F 01/24 22:38

→ yunf : 一個人如果有10億然後他現在剩下七億每天跟你說他747F 01/24 22:38
→ yunf : 很窮你要同情他嗎？

→ lon0623 : 他們本來就不是正常股市了，做空還會被政府抓749F 01/24 22:39

→ yunf : 你可能沒有看過1990的大陸750F 01/24 22:40

→ lon0623 : 1990的人忍耐力一定比現在高很多好嗎751F 01/24 22:40

推 Paulsic : 百萬輸出 tokens 16 元，輸出 API 價格只有 OpenAI752F 01/24 22:40
→ Paulsic : o1 的 3%。熟悉的味道

→ yunf : 那時候他們就已經過得不錯了只是沒有現在好而已754F 01/24 22:40

→ lon0623 : 1990過得不錯是平行時空嗎?755F 01/24 22:41
→ lon0623 : 現在一定比35年前好啦，但人民的需求也會上升

→ WD640G …

→ lon0623 : 之前一直吹的解封行情，現在也沒了758F 01/24 22:43

→ yunf : 有吃有喝有得住還要怎樣？就是交通不發達醫療技759F 01/24 22:43

推 jamesjklin : 爛爆，deepseek錯誤百出760F 01/24 22:43

→ yunf : 術不發達761F 01/24 22:43

推 mamorui : 中國有些團隊paper提供無限量用很佛是真的尤其gen762F 01/24 22:45
→ mamorui : 多媒體同事分享過覺得挖paper最大好處

推 bj45566 : 1. 中國現在經濟差景氣不好；2. 中國中下層百姓過得764F 01/24 22:45
→ bj45566 : 比疫情前還苦；這些都沒錯，但是：3. 中國投入科研
→ bj45566 : 的經費持續增加；4. 中國 2024 年在頂尖科學和、工
→ bj45566 : 程期刊和頂尖 CS 會議的論文發表數持續突破新高 esp
→ bj45566 : . Nature, Science

推 xkso : 中國東西先打3折769F 01/24 22:46

推 JWJerryyy : 剛剛meta ath 看來不影響？770F 01/24 22:46

推 lon0623 : 景氣不好，會讓一些人才寧願去科研阿771F 01/24 22:46

推 mamorui : 真得先打3折 QQ772F 01/24 22:46

→ shorty5566 : 蠢鳥也很笨這東西明明對台灣也好773F 01/24 22:48

推 holysong : 中國人很卷終獲勝？1990日本也過得不錯啊774F 01/24 22:48

→ yunf : 這都他們自己控制的775F 01/24 22:48

→ shorty5566 : 要是解法一直是堆GPU 你堆得贏那些CSP大廠嗎776F 01/24 22:48

推 lon0623 : 中國民企要存活，基本上就是要走出海外777F 01/24 22:49

→ yunf : 過度信用擴張的人才會有問題778F 01/24 22:49

→ shorty5566 : 有deepseek的發表至少讓台灣還有入場券779F 01/24 22:50

→ lon0623 : 不然國內越捲就越不敢請人，繼續惡性循環780F 01/24 22:50

推 newyorker54 : 我只說一句如果真的那麼好，中國人完全不可能開源，781F 01/24 22:50
→ newyorker54 : 對標open AI就只是滿足自卑感自己吹吹。完全沒有原
→ newyorker54 : 創性的產品

噓 jasterlin : 唬爛，沒底層光靠蒸餾要趕英超美784F 01/24 22:50

推 MrCool5566 : 怎麽一堆人看到中國就黑785F 01/24 22:51

推 lon0623 : 美國最大優勢其實還是強大的內需786F 01/24 22:52
→ lon0623 : 那些中國公司產出在好，不進歐美會被自己人卷死

推 narotic : 都是中共同路人啦788F 01/24 22:54

→ newyorker54 : 大家還不夠瞭解中國人嗎？又狠又卷又不要臉，文革大789F 01/24 22:54
→ newyorker54 : 躍進死的人比二戰還多，把錯都推給毛澤東，那根本是
→ newyorker54 : 一個全體人民劣根性的完全展現結果，只怪一個人？？
→ newyorker54 : ？

→ yunf : 中國會沒有內需嗎？而且四倍的人口793F 01/24 22:54

推 lon0623 : 問題是他們的對手也是中國公司啊自己人卷死794F 01/24 22:55

→ newyorker54 : 有人還抹我是中國同路人，笑死！中國六代戰機有開源795F 01/24 22:57
→ newyorker54 : 嗎？但是中國人也不要偷著樂，六代機和老美十幾年前
→ newyorker54 : 就有的F22也不會有優勢，看有沒有五五波就偷笑了

推 bj45566 : 都被美國業界學界大頭稱讚是 "breakthrough" 了還在798F 01/24 22:58
→ bj45566 : 「完全沒有原創性」，笑死 wwww 講這句話的人根本
→ bj45566 : 不懂什麼什麼叫作原創性

→ yunf : 原本就太肥了 nv的算力可能撐不起他們那種演算法801F 01/24 22:58
→ yunf : 沒差就看誰先算出有用的東西

→ newyorker54 : 中國是變強了，是世界第二強國，但是民族劣根性永遠803F 01/24 22:59
→ newyorker54 : 去除不掉

→ bj45566 : 而且中國領先的 AI 公司的語言模型幾乎都是開源讓大805F 01/24 22:59
→ bj45566 : 家下載，遠不只 DS，一點常識都沒有 wwww wwww

推 Paulsic : 看效能和背後的財務模式不覺得恐怖嗎807F 01/24 23:00

推 iaminnocent : Deepseek的模型有借鑒之處，美國人也不是白癡，學808F 01/24 23:00
→ iaminnocent : 過來調整一下，馬上模型就降本增效了

→ bj45566 : 美國、歐洲大部分做 AI 研究的也是開源，OpenAI 反810F 01/24 23:00
→ bj45566 : 而是世界的少數例外

→ iaminnocent : 真的OpenAI 真的反而是例外812F 01/24 23:01

→ newyorker54 : 老黃還稱讚華為手機不可思議，中國人不要那麼自卑好813F 01/24 23:01
→ newyorker54 : 不好？？等到學界公認再來說吧

推 lon0623 : 說不定是美國人過太爽了，人事費用太高815F 01/24 23:02

推 lusifa2007 : 如果deepseek可以搞到gb200 不是更強 AI永遠需要N816F 01/24 23:02
→ lusifa2007 : V

推 bj45566 : 現在 AI 還是離起跑點不遠的階段，當然最後美中誰818F 01/24 23:02
→ bj45566 : 贏不知道，更有可能是互有擅場

→ yunf : 你看你能不能算出一個比馬斯克更棒的火箭系統820F 01/24 23:02

→ lon0623 : 看一堆影片還說美國科技業過多爽821F 01/24 23:03

推 Paulsic : 付費打不過open還有人要付錢822F 01/24 23:04

推 capser : 推開源823F 01/24 23:04

推 minazukimaya: 組織文化的問題 DeepSeek作得到但是華為騰訊百度沒824F 01/24 23:04
→ minazukimaya: 作到就說明了這不是中美差異而是組織文化差異

→ yunf : https://tinyurl.com/283v9oe3826F 01/24 23:04

Economic Archive | Mark Zuckerberg has been working on Facebook (now Meta) for 20 years now. He sits at the fourth richest person in the world with a... | Instagram

推 iaminnocent : Deepseek的強化學習模式，也是O3的訓練模式，所以827F 01/24 23:05
→ iaminnocent : 等O3公布以後，大家應該又會來比拼

→ newyorker54 : open AI算力爆棚錢又多，窮人用窮人演算法自己自嗨829F 01/24 23:05
→ newyorker54 : ！笑死。大腕花幾十萬玩明星一次，窮人打手槍打到扁
→ newyorker54 : 掉，還很得意說不花錢還射比較爽，哈哈

→ minazukimaya: 要論軟工高手和996的強度中國大公司比DeepSeek強多832F 01/24 23:05

→ yunf : 的確是很爽但是壓力也很大而且整個人的思路都不一833F 01/24 23:05
→ yunf : 樣了

→ minazukimaya: 了這幾年騙錢的中國AI公司也沒少過 DeepSeek能成功835F 01/24 23:06
→ minazukimaya: 自然有其公司文化的獨特之處

推 epicurious : 重點是沒有要比美國好啊，差一點點但便宜5倍，美國c837F 01/24 23:08
→ epicurious : sp廠capex砍下來供應鏈就崩了

推 bj45566 : 看某位美國一流名校女博士天天拍 YouTube 就知道美839F 01/24 23:08
→ bj45566 : 國高科技業一堆爽缺閒缺...

推 newyorker54 : 真正開源的是meta，DS也是拿人家的來改根據開源條款841F 01/24 23:10
→ newyorker54 : 本來就要跟著開源，中國人有那麼好死，講一個自己完
→ newyorker54 : 全無到有的原創產品開源的再來說自己人格很崇高，不
→ newyorker54 : 然看你中國人德行就是垃圾

推 lon0623 : 女博士薪水說不定比台積很多主管高了845F 01/24 23:10

推 bj45566 : 真的不用拿文革和大躍進來嘴什麼民族性，要不然美846F 01/24 23:11
→ bj45566 : 國的民族性是不是崇尚內鬥和蓄奴(-- 當時全歐洲由英
→ bj45566 : 國帶頭都禁止蓄奴了)？？？

→ shorty5566 : 砍capex幹嘛好的模型算法+算力不是更飛天= =849F 01/24 23:11
→ shorty5566 : 除非你覺得AI已經發展到盡頭了不然算力永遠都不夠

推 lon0623 : 美國有些人事成本真的太高了，還有搞啥DEI851F 01/24 23:12

推 minazukimaya: 對啊算法改進了效率變好第一直覺當然是再放大模型852F 01/24 23:12

→ shorty5566 : 好的算法+更強的算力那才是事半功倍買越多省越多853F 01/24 23:13

→ minazukimaya: 或是再加訓練集吧對BigTech來說...854F 01/24 23:13

※ 看板: Stock　文章推薦值: 1 目前人氣: 0 累積人氣: 1469　

作者 Lushen 的最新發文:

+29 [請益] 記憶體最近是不是在偷漲價 - PC_Shopping 板

作者: Lushen 36.229.58.11 (台灣) 2025-03-31 20:41:31

如題，觀望一陣子金士頓 FURY Beast 記憶體本來想抄最底結果發現這週全部通路除了天價屋以外全部都調漲美光最近也宣布記憶體價格要調漲還要繼續等抄底嗎還是四條插滿先 …

50F 29推
-21 Re: [討論] 曹興誠宣布捐30億元加強台灣國防 - Military 板

作者: Lushen 36.229.56.153 (台灣) 2025-02-17 15:28:59

47F 8推 29噓
-10 Re: [新聞] 遭聯電切割「已非榮譽董事長」曹興誠回應 - Stock 板

作者: Lushen 36.229.56.153 (台灣) 2025-02-17 15:13:36

71F 21推 31噓
+88 [新聞] 三位臺灣AI專家發起DeepSeek R1改造計畫，要打造繁中版開源授權的推理模型 - Stock 板

作者: Lushen 36.229.57.249 (台灣) 2025-02-10 14:21:23

OpenAI去年發表了新一代推理模型o1之後，讓眾人看到GAI開始媲美真人博士或軟體開發高手般的解題能力，掀起了新一輪的大型語言模型競賽。春節期間，以開放權重釋出的DeepSeek R1模型，大幅降 …

217F 115推 27噓
+10 Re: [新聞] 美股褒貶與否美科技業者爭相導入DeepSeek - Stock 板

作者: Lushen 36.229.38.139 (台灣) 2025-02-02 20:21:39

24F 10推

點此顯示更多發文記錄

分享網址: 複製

DispBBS

(￣︶￣)ｂ markbb01 說讚！

1樓時間: 2025-01-25 01:51:40 (台灣)

→

is0124

　 01-25 01:51 TW

中國低價搶市是強項！

回到看板(←)《Stock》

→

guest

x)推文 r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄同主題: =)首篇 [)上篇 ])下篇

回列表(←) 分享