※ 本文轉寄自 ptt.cc 更新時間: 2025-01-24 23:45:50
看板 Stock
作者 標題 [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預
時間 Fri Jan 24 19:13:02 2025
原文標題:
Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預算難以解釋
原文連結:https://www.jiqizhixin.com/articles/2025-01-24-2
Meta陷入恐慌?内部爆料:在疯狂分析复制DeepSeek,高预算难以解释 | 机器之心 工程师正在疯狂地分析 DeepSeek,试图从中复制任何可能的东西。 ...
發布時間:2025/01/24
記者署名:機器之心
原文內容:
「工程師正在瘋狂地分析 DeepSeek,試圖從中複製任何可能的東西。」
DeepSeek 開源大模型的陽謀,切切實實震撼著美國 AI 公司。
最先陷入恐慌的,似乎是同樣推崇開源的 Meta。
最近,有 Meta 員工在美國匿名職場社群 teamblind 上面發布了一個貼文。貼文提到,國內 AI 新創公司 DeepSeek 最近的一系列動作讓 Meta 的生成式 AI 團隊陷入了恐慌,因為在前者的低成本高歌猛進下,後者無法解釋自己的超高預算的合理性。
原文如下:
這一切始於 DeepSeek-V3,它在基準測試中就已經讓 Llama 4 落後。更糟的是那個「擁有 550 萬訓練預算的不知名中國公司」。
工程師們正在瘋狂地分析 DeepSeek,試圖從中複製任何可能的東西。這一點都不誇張。
管理階層擔心如何證明龐大的生成式 AI 組織的成本是合理的。當生成式 AI 組織中的每個「領導」的薪資都比訓練整個 DeepSeek-V3 的成本還要高,而我們有好幾十個這樣的「領導」時,他們要如何面對高層?
DeepSeek-R1 讓情況變得更加可怕。雖然我不能透露機密信息,但這些很快就會公開。
這本來應該是一個以工程為重點的小型組織,但是因為很多人想要參與進來分一杯羹,人為地膨脹了組織的招聘規模,結果每個人都成了輸家。
https://i.imgur.com/hKZ6h5W.png
貼文中提到的 DeepSeek-V3 和 DeepSeek-R1 分別發佈於 2024 年 12 月 26 日和 2025 年 1 月 20 日。
其中,DeepSeek-V3 在發佈時提到,該模型在多項評測成績超越了Qwen2.5-72B 和Llama-3.1-405B 等其他開源模型,並在性能和世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet 不分伯仲。
不過,更引人注目的是,這個參數量高達 671B 的大型語言模型訓練成本僅 558 萬美元。具體來說,它的預訓練過程竟然只用了 266.4 萬 H800 GPU Hours,再加上上下文擴展與後訓練的訓練,總共也只有 278.8 H800 GPU Hours。相比之下,Meta 的 Llama 3 系列模型的計算預算則多達 3930 萬 H100 GPU Hours—— 如此計算量足可訓練 DeepSeek-V3 至少 15 次。
https://i.imgur.com/mJn5POl.png
而最近發布的 DeepSeek-R1 效能更猛 —— 在數學、程式碼、自然語言推理等任務上,它的效能比肩 OpenAI o1 正式版。而且模型在發布的同時,權重同步開源。很多人驚呼,原來 DeepSeek 才是真正的 OpenAI。 UC Berkeley 教授 Alex Dimakis 則認為, DeepSeek 現在已經處於領先位置,美國公司可能需要迎頭趕上了。
https://i.imgur.com/NLhp4Nj.png
看到這裡,我們不難理解為何 Meta 的團隊會陷入恐慌。如果今年推出的 Llama 4 沒有點硬本事,他們「開源之光」的地位岌岌可危。
有人指出,其實該慌的不只 Meta,OpenAI、Google、Anthropic 又何嘗沒有受到挑戰。 「這是一件好事,我們可以即時看到公開競爭對創新的影響。」
https://i.imgur.com/gQ5fHDH.png
還有人擔心起了英偉達的股價,表示「如果 DeeSeek 的創新是真的,那麼 AI 公司是否真的需要那麼多顯示卡?」
https://i.imgur.com/HIFcTx6.png
不過,也有人質疑,DeepSeek 究竟是靠創新還是靠蒸餾 OpenAI 的模型取勝?有人回覆說,這可以從他們的發布的技術報告中找到答案。
https://i.imgur.com/HIFcTx6.png
目前,我們還無法確定貼文的真實性。
不知道 Meta 後續會如何回應,即將到來的 Llama 4 又會達到怎樣的表現。
心得/評論:
Meta工程師在TeamBlind(一個匿名的職涯討論區,需要經過公司Email驗證)爆料中國的DeepSeek對內部影響很大
DeepSeek R1訓練成本550萬美元 可能比一個Meta大頭的年薪還便宜
DeepSeek 這件事情也不光是中國自己在吹噓
看了一下 Twitter/Reddit 美國AI工業界、學術界反響非常大
DeekSeek 的母公司幻方量化產出 DeepSeek 的故事也在 Twitter 廣受討論
https://i.imgur.com/NLhp4Nj.png
DeepSeek R1 開源+論文公開應該會推進一波AI界的發展
DeepSeek 後續發展值得關注一下
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.229.55.152 (臺灣)
※ 作者: Lushen 2025-01-24 19:13:02
※ 文章代碼(AID): #1datN1_K (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1737717185.A.FD4.html
※ 同主題文章:
● 01-24 19:13 ■ [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預算難以解釋
01-24 21:59 ■ Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預算難以解釋
01-25 03:00 ■ Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預
01-25 09:15 ■ Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預算難以解釋
01-25 11:46 ■ Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預算難以解釋
01-25 22:54 ■ Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預算難以解釋
01-26 13:15 ■ Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高
01-26 19:27 ■ Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預算難以解釋
02-01 22:44 ■ Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高
推 : 中又贏1F 01/24 19:14
DeepSeek 訓練成本低+跑起來的成本極低(硬體需求)
自己實際使用體感不覺得他贏 OpenAI
不過以成本場景來說真的是巨大的創新
美國知名的 AI 分析機構 Artificial Analysis
對 DeepSeek 的成本分析
https://i.imgur.com/0GRkj6Q.png
→ : 股價該跌了吧2F 01/24 19:15
推 : too good to be true3F 01/24 19:15
→ : 贏了贏了都贏了4F 01/24 19:15
推 : 贏麻了5F 01/24 19:16
噓 : 花大錢還輸別人 是設備的問題還是人的問題6F 01/24 19:16
推 : ai本來就可以減少運算,達到一樣的效果7F 01/24 19:18
推 : 真實性先打問號8F 01/24 19:18
DeepSeek R1 程式碼、論文都開源+公開了
https://github.com/deepseek-ai/DeepSeek-R1
GitHub - deepseek-ai/DeepSeek-R1
Contribute to deepseek-ai/DeepSeek-R1 development by creating an account on GitHub. ...
Contribute to deepseek-ai/DeepSeek-R1 development by creating an account on GitHub. ...
https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf
DeepSeek-R1/DeepSeek_R1.pdf at main · deepseek-ai/DeepSeek-R1 · GitHub
Contribute to deepseek-ai/DeepSeek-R1 development by creating an account on GitHub. ...
Contribute to deepseek-ai/DeepSeek-R1 development by creating an account on GitHub. ...
→ : 美國484真的滿廢的9F 01/24 19:18
→ : 難怪只能靠制裁來贏人了
→ : 難怪只能靠制裁來贏人了
推 : 美國的時代早就過去了11F 01/24 19:19
推 : 輸了就在砍人啊12F 01/24 19:19
推 : deepseek有開源,也有offline,鬼故事來了13F 01/24 19:20
推 : 因為西台灣為了管制,一堆問題不能回答,自然也不算14F 01/24 19:20
→ : 錯誤
※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 19:25:15→ : 錯誤
推 : DS就開源的 輸了就算了 裁部門 丟模型16F 01/24 19:22
→ : 硬體需求果然是吹的17F 01/24 19:22
→ : 拿DS去從頭開始而已18F 01/24 19:22
推 : 降本增效 遙遙領先 中國人可以贏兩次19F 01/24 19:22
推 : 中又贏 ,遙遙領先20F 01/24 19:22
推 : 沒空 阿祖現在忙著舔川普21F 01/24 19:22
→ : 你就當作花錢蓋了個蚊子館又拆掉 GDP增加了 就這樣22F 01/24 19:22
→ : 寫一大篇不知道想幹嘛
→ : 寫一大篇不知道想幹嘛
推 : 美國早就輸慘了24F 01/24 19:23
推 : 看到某族群崩潰狂酸的樣子 就覺的好笑 哈哈哈25F 01/24 19:23
推 : 只要慶豐帝仍在位,美國就不會輸26F 01/24 19:24
推 : 中國贏了,台積電嚇哭了,輝達沒有用了,美國七大27F 01/24 19:24
→ : 科技股都淚奔了
→ : 科技股都淚奔了
推 : 整理重點好嗎29F 01/24 19:25
網景公司創始人(美國公司;世界第一個廣泛使用的瀏覽器)
Facebbok、eBay、HP 董事會成員
風投
Marc Andreessen
幫你整理了重點
https://i.imgur.com/SmUbN8M.png
Deepseek R1 is one of the most amazing and impressive breakthroughs I’ve ever seen — and as open source, a profound gift to the world.
DeepSeek 翻譯:
https://i.imgur.com/5zX1uf2.png
推 : 亞洲專門搞詐騙的30F 01/24 19:26
推 : 中國本來在軟體就算強的 還能加班加到爆31F 01/24 19:26
推 : 不就魔改技術很猛?不然當年GPT3怎麼不是中國開發32F 01/24 19:27
推 : 看智障聳動標題就知道是中吹假新聞33F 01/24 19:27
推 : 歐美日常,幹輸人翻桌34F 01/24 19:28
→ : 然後又一堆壯世代在那瞎講胡吹35F 01/24 19:29
推 : 美國人很天真,很容易被詐騙,看看小米保時捷,那36F 01/24 19:29
→ : 真的是保時捷嗎
→ : 真的是保時捷嗎
推 : 算力過剩,丸子38F 01/24 19:29
噓 : 上次在那邊吹中國突破5奈米的公司 已經屍骨無存了39F 01/24 19:29
推 : 又要像電車一樣輸了就翻桌嗎?40F 01/24 19:29
噓 : 中吹日常,吹了半天強國還在通縮41F 01/24 19:30
→ : 對岸要是真的,早就大吹特吹42F 01/24 19:30
→ : 沒有外媒新聞? 怎麼只有中國跟twitter來源43F 01/24 19:30
→ : 遙遙領先 雙贏就是中國贏兩次44F 01/24 19:31
推 : 彎道超車吹了三十年還在超,這個彎道到底有多長啦45F 01/24 19:31
→ : ,笑爛
→ : ,笑爛
→ : 小米蘇7=美國老邏輯=保時捷怕拉沒拉,但真的擺上台48F 01/24 19:32
→ : 面真的是保時捷嗎
→ : 面真的是保時捷嗎
推 : 已經都開源了 怎麼還有人反智阿...50F 01/24 19:33
推 : 完蛋 算力過剩 overbooking 台G NV攔腰斬都不夠51F 01/24 19:33
→ : NV至少1/4膝蓋斬 歐印放空 台股一萬二見
→ : NV至少1/4膝蓋斬 歐印放空 台股一萬二見
推 : 美國再挖角或制裁 就好53F 01/24 19:34
推 : 看到某族群自嗨的樣子就覺得好笑54F 01/24 19:34
推 : 美國創意,中國實作,中美如果真正合作,早就登陸火55F 01/24 19:34
→ : 星了,可惜國家這個沒用的概念依然存在,地球村遙遙
→ : 無期
※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 19:39:47→ : 星了,可惜國家這個沒用的概念依然存在,地球村遙遙
→ : 無期
→ : 當初嘴台積電,也大力挖台積電的大將,對啊晶圓廠58F 01/24 19:34
→ : 可以生產啊,但真的能ㄧ直突破?
→ : 可以生產啊,但真的能ㄧ直突破?
推 : 開源又怎樣?笑死60F 01/24 19:35
推 : 開源就是全世界的人都能直接驗證 這也不是中國自己61F 01/24 19:35
→ : 在吹啦
→ : 在吹啦
推 : OK收到 以放空美台股 大力ALL IN鹿谷63F 01/24 19:35
→ : 開源又怎樣 原po也沒覺得他贏openai啊64F 01/24 19:35
→ : 詐騙集團,當然不能犯低接錯誤,你能看到的當然要65F 01/24 19:36
→ : 給你看你想看的
→ : 給你看你想看的
推 : 沒三小路用 中國直接武統是最有用的67F 01/24 19:36
→ : 自爽又贏 跟 開源 哪門子關係?68F 01/24 19:37
→ : 笑死中國要是真的能搞出來,當初中芯肯定能搞出來69F 01/24 19:37
→ : 每個llm都在吹自己很強 實際體驗就是那死樣子70F 01/24 19:37
→ : 中國軟體很強啊 抖音 小紅書 台灣?71F 01/24 19:38
推 : 台灣給那狗屎薪資想要找誰寫軟體?笑死72F 01/24 19:38
→ : 這本來就是 在等待程式架構進化,縮減算力73F 01/24 19:39
推 : 老早都去AWSGCP租就好,做LLM跟本不會賺錢74F 01/24 19:39
→ : 舊的程式架構自然需要突破天際的算力75F 01/24 19:39
推 : 對岸是小米蘇7保時捷,然後吹說你開保時捷嗎?76F 01/24 19:39
推 : 台灣軟體很爛啊,應該說台灣沒有軟體,所以呢?77F 01/24 19:40
推 : 簡單來說 AI的這個嶄新的領域配上開源 本來就很容易78F 01/24 19:40
→ : 做出超強的突破了 不一定是中國 美國隨時也會趕上
→ : 做出超強的突破了 不一定是中國 美國隨時也會趕上
→ : 馬斯克也是吹80F 01/24 19:40
推 : 這其實也是好事 如果能讓需要的算力降低 那能省很多81F 01/24 19:40
→ : 電
→ : 電
→ : 你遙想個人電腦和網路剛開始的時候 駭客橫行的時候83F 01/24 19:40
推 : 股板無腦中黑:不管啦,中國只會抄襲而已而已啦,一84F 01/24 19:40
→ : 定是偷美國的!原始碼都公開在網上了?不可能!看得
→ : 到的人一定是眼睛孽障太重,我什麼都看不到!(嘶喊)
→ : 定是偷美國的!原始碼都公開在網上了?不可能!看得
→ : 到的人一定是眼睛孽障太重,我什麼都看不到!(嘶喊)
→ : 中國軟體工程師戰力本來就不差87F 01/24 19:40
→ : 當你還在用數據機玩天堂的時候 可能想過幾年後馬上88F 01/24 19:41
※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 19:45:10→ : 對岸很多都是抄美國,卡卡西董嗎? 小米蘇7吹成保89F 01/24 19:41
→ : 時捷
→ : 時捷
→ : 變月租吃到飽?91F 01/24 19:41
推 : 別急92F 01/24 19:41
→ : 怎會熱血親中的人在高潮啊93F 01/24 19:42
→ : 對岸只會卡卡西,但真的有那個創意與技術? 接下來94F 01/24 19:42
→ : 真的能持續?
→ : 真的能持續?
推 : 完蛋 今天股價砍爛96F 01/24 19:42
→ : 拿meta這垃圾比較就好像拿intel跟台積電比97F 01/24 19:42
→ : META再裁個15%工程師吧98F 01/24 19:44
推 : 突破AI臨界點了?99F 01/24 19:44
噓 : ai 是不是關門放狗100F 01/24 19:45
→ : 樓上把軟體跟半導體製造放在一起比較的...好喔101F 01/24 19:48
推 : 說 Meta 是廢物的好像完全不知道 Meta 在 AI 開源碼102F 01/24 19:48
→ : 界是抗霸子 wwww 而且 DS 贏的也不只是 Meta Llama
→ : 界是抗霸子 wwww 而且 DS 贏的也不只是 Meta Llama
推 : 報告 所以會影響到什麼?想抄答案!104F 01/24 19:48
推 : 這個成果是中國其他公司都震驚吧 開源很好 科技不105F 01/24 19:49
→ : 應該分國界 競爭也不分你我 生死看淡 不服就幹
→ : 應該分國界 競爭也不分你我 生死看淡 不服就幹
噓 : 美國狗下棋輸人就翻桌 等中國強起來一定算帳107F 01/24 19:49
推 : 一個專案五千萬能弄 五百萬常常也可以 科科108F 01/24 19:50
→ : 不過仔細想想 這篇股點是什麼? meta利空?109F 01/24 19:50
→ : 不過五千萬弄大家都會很舒服 何必真的編五百110F 01/24 19:50
推 : 繼續裁員111F 01/24 19:51
推 : 鋼鐵家電手機電車都能卷翻,美歐日,憑什麼AI不能112F 01/24 19:51
→ : 卷,至少也要分走3成市場
→ : 卷,至少也要分走3成市場
推 : 便宜治百病114F 01/24 19:54
→ : 還是這篇是台積nv利空 大家不需要那麼多運算資源?115F 01/24 19:55
推 : Meta股價毫無反應116F 01/24 19:55
→ : 這樣如何對股東與投資機構交代117F 01/24 19:55
→ : 用低階顯卡AI性能就能和用高階的比了 反正美國錢很118F 01/24 19:55
→ : 多 嘻嘻
→ : 多 嘻嘻
→ : 為何高低成本的方案不能共存?120F 01/24 19:56
推 : 產能過剩要來了 啾咪121F 01/24 19:56
推 : 五千億鎂 有多少會進口袋122F 01/24 19:56
推 : DeepSeek 最大的影響就是證明中國能用不到 1/10 的123F 01/24 19:56
→ : 預算和更少、更便宜低階的 AI 晶片達成甚至超越美
→ : 國頂尖 AI 公司(s)狂開資源做出的大語言模型效能
→ : 預算和更少、更便宜低階的 AI 晶片達成甚至超越美
→ : 國頂尖 AI 公司(s)狂開資源做出的大語言模型效能
推 : 中國黑開始胡言亂語126F 01/24 19:56
→ : 現在深度探索全部開源給你 誰還要用高價裝備操作AI127F 01/24 19:57
→ : 嘻嘻
→ : 最近這幾天美國科技業真的瘋了 一直再找出為什麼可
→ : 以這麼便宜成本弄出來ww
→ : 嘻嘻
→ : 最近這幾天美國科技業真的瘋了 一直再找出為什麼可
→ : 以這麼便宜成本弄出來ww
推 : 我怎麼看起來再說deepseek造假131F 01/24 19:58
推 : 中國黑科技 猛了132F 01/24 19:58
→ : meta試著用h100訓練了15個開源的deepseek結果數據都133F 01/24 19:59
→ : 不如paper宣稱的
→ : 不如paper宣稱的
→ : 既然都開源了接下來就看能不能照刻出來啊 現在吹這135F 01/24 20:01
→ : 麼早都不怕跟之前超導體一樣翻車嗎?
→ : 麼早都不怕跟之前超導體一樣翻車嗎?
→ : 這根本就是沒辦法reproduce吧 meta工程師拿你程式碼137F 01/24 20:01
→ : 訓練這麼多次都拿不到你的結果
→ : 訓練這麼多次都拿不到你的結果
噓 : 笑死,就算成本降低需求只會更多,直到人手一個客139F 01/24 20:01
→ : 製ai
→ : 製ai
推 : 哈哈哈中國進來卷141F 01/24 20:02
→ : 那正常人用更爛的gpu或是deepseek宣稱的h800不是也142F 01/24 20:03
→ : 不辦法訓練出來嗎
→ : 不辦法訓練出來嗎
推 : 拿 AI 比高階晶圓製造的真的笑死!中國在 AI 領域一144F 01/24 20:03
→ : 直都能和美國爭霸,中國在 AI 頂尖會議的論文發表和
→ : 直都能和美國爭霸,中國在 AI 頂尖會議的論文發表和
推 : 看起來是 nvda ,tsm 股價準備崩潰,什麼你說市場沒146F 01/24 20:03
→ : 反應?怎麼會?
→ : 反應?怎麼會?
→ : 美國一直都是互有領先(之前中國 AI 強在 CV, PR,148F 01/24 20:03
→ : 美國強在 LLM, NLP -- 但現在看起來美國的強項不太
→ : 妙)
→ : 美國強在 LLM, NLP -- 但現在看起來美國的強項不太
→ : 妙)
→ : 中國不意外 只能騙騙外行人151F 01/24 20:03
推 : 果然演算法是最重要的152F 01/24 20:04
推 : 而且看不懂為啥對nv是利空 如果是真的那那些csp用153F 01/24 20:04
→ : 現在已有的算力不是更猛 需求只會更多吧 發展越快
→ : 越好
→ : 現在已有的算力不是更猛 需求只會更多吧 發展越快
→ : 越好
→ : 之前就懶得認真看deepseek 結果一看根本在騙白癡156F 01/24 20:05
→ : 這讓我想到智慧型手機android平台 一開始的硬體不157F 01/24 20:06
→ : 夠強 真的是要靠各家用軟體調效來拼順暢度
→ : 夠強 真的是要靠各家用軟體調效來拼順暢度
噓 : 就是美國抄襲中國啦 某族群最愛嘴的159F 01/24 20:06
→ : 後來硬體強到靠北 軟體就不用調效了 硬體隨便淦都爆160F 01/24 20:06
→ : 淦順
→ : 淦順
推 : 無腦中黑已經進入催眠自己的最高境界了 wwww wwww162F 01/24 20:06
推 : 中國人應該沒想到這次翻船 meta真的拿他的h100檢查d163F 01/24 20:08
→ : eepseek造假
→ : eepseek造假
推 : 搜尋一了一下DS在寫作編碼不如GPT但是推理媲美165F 01/24 20:08
→ : 超越美國製造的llm言之過早吧 每個新的出來都說贏166F 01/24 20:09
推 : 最近 AI 界最大的醜聞反而是 OpenAI o3 涉嫌在數學167F 01/24 20:09
→ : 能力測驗上作弊喔,嘻嘻
→ : 能力測驗上作弊喔,嘻嘻
→ : 重點是訓練便宜如果大規模訓練確實可能會顛覆AI市場169F 01/24 20:09
→ : 通常中國人ai論文喜歡造假說超越sota 但畢竟沒人會170F 01/24 20:10
→ : 這樣會浪費一堆算力證明造假
→ : 這樣會浪費一堆算力證明造假
→ : 如果可以便宜泛用的話對NV就不是好消息172F 01/24 20:10
→ : 然後講中國ai paper 之前就聽過中國的有些是吹的173F 01/24 20:10
推 : 正在用 只能說 好用174F 01/24 20:11
推 : 那麼厲害何必害怕晶片制裁狂拉貨?用爛晶片就好175F 01/24 20:11
→ : 講別人無腦黑中 自己才無腦親中 笑死176F 01/24 20:11
推 : 未來AI就中美有量能切入啊177F 01/24 20:11
→ : 但這次被meta抓到deepseek造假 好慘178F 01/24 20:12
→ : 最近剛好在玩google 的和這隻 互相179F 01/24 20:12
推 : 某樓是不是在酸所有IC設計啊,應該用7奈米就好啊,180F 01/24 20:12
→ : 一直想推先進製程幹嘛XDDD
→ : 一直想推先進製程幹嘛XDDD
→ : 歸結是成本的問題對吧?182F 01/24 20:13
→ : 是不是廢到只能靠製程來掩蓋廢物設計能力啊183F 01/24 20:13
→ : 不過我猜之後這種文會繼續洗 反正普通人也不懂ai184F 01/24 20:13
→ : 你們慢慢吵 哥買tsm nv等看戲185F 01/24 20:13
推 : 科技界名人包括 UC Berkeley 的 AI 教授都幫 DeepSe186F 01/24 20:13
→ : ek 背書說它是 AI 的 "breakthrough" 了,股板鍵盤
→ : 俠覺得自己比那些專家還懂 wwww wwww
→ : ek 背書說它是 AI 的 "breakthrough" 了,股板鍵盤
→ : 俠覺得自己比那些專家還懂 wwww wwww
推 : Deepseek用閹割版H800就能做到,189F 01/24 20:13
推 : 真的超強,只是不知道為什麼他無法回答我1989年6月4190F 01/24 20:14
→ : 日有什麼歷史事件
→ : 日有什麼歷史事件
→ : nlp更好吹sota 反正自製dataset 別人亂做 自己認真192F 01/24 20:14
推 : 終於要遙遙領先了193F 01/24 20:14
→ : 中黑病發作194F 01/24 20:14
推 : 英偉達的股價下跌 我就信195F 01/24 20:14
推 : 谷歌的很爛 問股票問題不敢回答 chatgpt比較大膽196F 01/24 20:14
→ : 哥布林不要只會網上酸 拿出東西比較有意義197F 01/24 20:15
→ : 怎麼不敢回答meta訓練15次 開源的deepseek結果數據198F 01/24 20:15
→ : 不如paper宣稱的?
→ : 不如paper宣稱的?
推 : 有競爭是好事 今年韓媒也有新聞200F 01/24 20:15
→ : 教授也會被騙啊 笑死 以為教授多懂 早就沒在做實驗201F 01/24 20:16
→ : 我快笑死 問中國最新jdk版本是啥 跟我說17202F 01/24 20:16
→ : 這不是造假不然是什麼203F 01/24 20:16
→ : 是不是沒讀過研究所阿 還吹教授204F 01/24 20:17
推 : 中國贏麻了,只好加大禁令了205F 01/24 20:17
推 : 對台積應該沒很大的影響就算少了輝達的訂單還有其他207F 01/24 20:18
推 : 是啦,中國發表在 AI 論文都是吹的、假的!要隨論208F 01/24 20:18
→ : 文附上的原始碼也都是假的!那些全世界 AI 專家組
→ : 成的審稿 TPC 都是一群白癡廢物,怎麼可能比股板鍵
→ : 盤俠更懂 AI 是吧? wwww
→ : 文附上的原始碼也都是假的!那些全世界 AI 專家組
→ : 成的審稿 TPC 都是一群白癡廢物,怎麼可能比股板鍵
→ : 盤俠更懂 AI 是吧? wwww
→ : 還是meta工程師都廢物 有一堆h100 還訓練不好deepse212F 01/24 20:18
→ : ek
→ : ek
推 : 某樓自己能力差讀水貨研究所找廢物教授,以為美國214F 01/24 20:19
→ : 教授跟你教授一樣廢,●●比雞腿,真的笑死
→ : 教授跟你教授一樣廢,●●比雞腿,真的笑死
推 : 教授審論文不會去嘗試reproduce吧,除非他叫底下的216F 01/24 20:20
→ : 博士生去試
→ : 博士生去試
推 : 12億人口免費的運算怎麼輸218F 01/24 20:20
推 : DS的初始模型是META的模型只是變得更有效率219F 01/24 20:20
推 : 反正股板的無腦中黑覺得自己比所有業界、學界的知名220F 01/24 20:21
→ : 專家都還要懂 AI wwww wwww
→ : 專家都還要懂 AI wwww wwww
推 : 更好笑的是pytorch就meta的 開源還要比三小222F 01/24 20:21
→ : 如果meta工程師無法reproduce,那可能真的有什麼貓223F 01/24 20:21
→ : 膩。企業一定是最緊張的
→ : 膩。企業一定是最緊張的
→ : 笑死 開始嘴別人教授喔 實際上就是這樣啦 國外也是225F 01/24 20:21
→ : AI paper一堆 真的沒人有空一篇一篇跟你對
→ : AI paper一堆 真的沒人有空一篇一篇跟你對
推 : 頂尖會議那些學界業界最知名的專家的審稿委員當然會229F 01/24 20:24
→ : 試跑隨論文附上的原始碼啊 -- 萬一原始碼有錯只有你
→ : 抓不出來,你直接名聲掃地好嗎
→ : 試跑隨論文附上的原始碼啊 -- 萬一原始碼有錯只有你
→ : 抓不出來,你直接名聲掃地好嗎
推 : 如果成功還是需要訓練模型 只是算力降低很多232F 01/24 20:24
→ : 2千多塊閹割版的H800只要訓練兩個月就超越Meta chat233F 01/24 20:24
→ : GPT,美國可憐啊
→ : GPT,美國可憐啊
推 : 中國在paper也喜歡造假硬體 明明用h100還說自己用h8235F 01/24 20:25
→ : 00或是3080
→ : 00或是3080
哥
我沒有看到任何所謂Meta工程師沒辦法reproduce的資料來源@@
可以請你提供一下嗎
推 : 美國一流大學教授就算是五六十歲都還在自己做研究、237F 01/24 20:26
→ : 寫程式,井底之蛙覺得自己比 UC Berkeley 教授還厲
→ : 害,哈哈哈哈
→ : 寫程式,井底之蛙覺得自己比 UC Berkeley 教授還厲
→ : 害,哈哈哈哈
推 : 便宜很好啊 大家股價修正一下 重新開始240F 01/24 20:27
推 : nv有什麼好怕的,越強的晶片不就代表可能做出越強241F 01/24 20:27
→ : 的ai
→ : 的ai
→ : 反觀台灣在AI運算這一塊484完全沒了243F 01/24 20:28
AI製造供應鏈台灣應該還是掌握得牢牢的
AI模型目前看起來是真的沒料
幾乎都是拿別人的成果fine-tune、扶不上牆
→ : NV沒啥好怕啊 軟體寫的好跟硬體強又不抵觸244F 01/24 20:28
→ : 真的 看不太懂對nv利空在哪 用現在最強的nv去算不245F 01/24 20:29
→ : 是更好更令人興奮嗎 而且入門門檻降低對整個ai發展
→ : 都是好事 集中在幾個大型csp才不好
→ : 是更好更令人興奮嗎 而且入門門檻降低對整個ai發展
→ : 都是好事 集中在幾個大型csp才不好
推 : https://reurl.cc/G5O0Nd 內文提到Deepseek使用閹割248F 01/24 20:29
→ : 版的H800顯卡,中黑趕快面對現實吧
→ : http://i.imgur.com/u8wpYYZ.jpg
→ : 版的H800顯卡,中黑趕快面對現實吧
→ : http://i.imgur.com/u8wpYYZ.jpg
美晶片戰難以對中國封喉 ? 彭博示警中國AI公司已突破「這1點」 - 自由財經
高佳菁/核稿編輯 〔財經頻道/綜合報導〕日前,中國AI公司推出與ChatGPT功能不相上下的新模型,但訓練時間極短、且成本不高,恐被視為中國AI技術的躍進象徵。《彭博》專欄作家、美國喬治‧梅 ...
高佳菁/核稿編輯 〔財經頻道/綜合報導〕日前,中國AI公司推出與ChatGPT功能不相上下的新模型,但訓練時間極短、且成本不高,恐被視為中國AI技術的躍進象徵。《彭博》專欄作家、美國喬治‧梅 ...
這紅媒吧?
推 : 台灣人力有限,與其發展AI運算,倒不如找應用端251F 01/24 20:30
推 : 無腦中黑已經無所不用其極在催眠自己一切都是假的 w252F 01/24 20:30
→ : www pathetic SORE losers !!!
→ : www pathetic SORE losers !!!
→ : 中國一堆都是去拿Mac mini來跑meta的模型 便宜又可254F 01/24 20:31
→ : 以玩
※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 20:32:09→ : 以玩
推 : 這完全開源,是假的早就被抓了吧256F 01/24 20:31
→ : 中國用2048張閹割版H800顯卡訓練兩個月就能超車Meta257F 01/24 20:31
→ : 及GPT,誰要花大錢買一堆NV最新顯卡?
→ : 及GPT,誰要花大錢買一堆NV最新顯卡?
→ : 不覺得台灣的做法有什麼錯誤,又不是有上億人口259F 01/24 20:31
→ : 還是要先跟研究生解釋什麼叫開源260F 01/24 20:31
推 : 你這篇的Lisan al …他說的就是這個意思261F 01/24 20:32
→ : 反過來說你用nv最強的顯卡去跑不是能進步得更快嗎262F 01/24 20:32
→ : ?還是你覺得ai的發展已經到盡頭了?
→ : ?還是你覺得ai的發展已經到盡頭了?
→ : 他不是說meta訓練了15次deepseek v3結果還是比他們264F 01/24 20:33
https://i.imgur.com/mJn5POl.png
尷尬
他在說Meta用LLAMA 3的訓練成本可以訓練DeepSeek-V3 15次
much better model
這大概國中英文
要不是你語言能力有缺陷
就是真的很純的中黑
→ : 宣稱的差嗎265F 01/24 20:33
噓 : Don’t look up 大陸人還生活在水深火熱266F 01/24 20:33
→ : 挫勒蛋的絕對是那些開發模型的公司吧267F 01/24 20:33
推 : 你覺得你想得到的NV想不到嗎?268F 01/24 20:33
→ : NV有他厲害的地方,不是只有算力
→ : NV有他厲害的地方,不是只有算力
推 : 連繁體中文都不能回答的模型270F 01/24 20:34
→ : 所以meta驗證了deepseek放出來的程式碼跟模型 發現271F 01/24 20:34
→ : 他們造假
→ : …. 建議你看英文
→ : 他們造假
→ : …. 建議你看英文
是你的英文能力有缺陷。
我建議你別搞笑了
這真的在扯中黑的腿
→ : 高鐵, 六代機, 核融合, LLM, 每天吹, 吹完就沒了274F 01/24 20:35
推 : deepseek我有用,真的蠻好用的275F 01/24 20:35
→ : 開發模型的公司即將進入紅海 倒是nv只怕大家都改用276F 01/24 20:35
→ : asic,但是門檻降低以後小型玩家可以進場,那些小
→ : 型玩家也沒能力調教asic 還是要跟nv買通用gpu
→ : asic,但是門檻降低以後小型玩家可以進場,那些小
→ : 型玩家也沒能力調教asic 還是要跟nv買通用gpu
→ : 功能也就是騙騙白痴.. 特別是中國白痴279F 01/24 20:36
推 : 就跟當初阿法狗一樣啊,deepmind搞出來後面一堆圍280F 01/24 20:36
→ : 棋AI小模型一下全出來了。純軟體你只是靠暴力解算力
→ : 堆,人家自然有優化後的更好解法,沒看openai也在回
→ : 頭做優化跟即時的深度運算
→ : 棋AI小模型一下全出來了。純軟體你只是靠暴力解算力
→ : 堆,人家自然有優化後的更好解法,沒看openai也在回
→ : 頭做優化跟即時的深度運算
→ : 我兩種都下載,都有用,後來都用deepseek284F 01/24 20:36
推 : 開始抹中黑了?285F 01/24 20:38
連國中英文都不會
還想在這邊大談
還嗆我去讀英文原文
中黑搞不好都不承認你是隊友
如果你是中黑這會顯得除了無腦黑中國沒有什麽思辨能力=.=
推 : 他能改用中芯晶片訓練更好286F 01/24 20:38
推 : 不然老黃幹嘛賣那台掌中型的AI機287F 01/24 20:39
→ : 國人捲出來的AI要打倒喝下午茶的工程師了嗎288F 01/24 20:39
推 : 那個英文很明顯在說15倍啦……289F 01/24 20:39
推 : 這不能說中國好話290F 01/24 20:39
推 : 造假就造假還在那護航292F 01/24 20:40
推 : 好像很多人誤以為AI是哪家先搞出AGI就贏了,現實是293F 01/24 20:40
→ : 就算搞出以後所有人知道該怎麼做很快就會用自己的
→ : 方法一樣能跟上,效率更好成本更低
→ : 就算搞出以後所有人知道該怎麼做很快就會用自己的
→ : 方法一樣能跟上,效率更好成本更低
→ : 另外推特翻譯那個GOOGLE翻得沒錯296F 01/24 20:40
→ : 他訓練還是要基於nv的gpu 用中芯的怎麼訓練297F 01/24 20:40
推 : 笑了,原來尼的出處是那,還以為尼有什麼meta內部的298F 01/24 20:40
→ : 消息
→ : 消息
→ : 我覺得這比較像吹很久的edge AI踏出第一步300F 01/24 20:41
→ : 那你抹中黑是怎麼回事?302F 01/24 20:41
→ : 好啦 假的啦 造假啦 中黑贏了 可以吧303F 01/24 20:41
那個英文能力在這邊大談
強烈建議看看eriker的推文真的超好笑
→ : 這樣是ok的 我都在講deepseek304F 01/24 20:42
推 : 無腦中黑在眾人面前證實了自己連簡單的英文都看不305F 01/24 20:42
→ : 懂胡扯亂翻譯,嘻嘻 wwww wwww
→ : 懂胡扯亂翻譯,嘻嘻 wwww wwww
推 : Meta訓練的預算拿來訓練Deepseek 都至少能訓練15次307F 01/24 20:42
→ : 了
→ : 了
→ : 簡體的可以SKIP了309F 01/24 20:42
推 : 關鍵字:開源程式碼310F 01/24 20:42
→ : meta 484太多冗員了啊311F 01/24 20:43
推 : 那些反智的人看不懂開源是什麼沒辦法,逢中就反真的312F 01/24 20:43
→ : 沒救
→ : 沒救
→ : 所以質疑deepseek造假就是中黑?314F 01/24 20:43
可以質疑的
不過哥你的行為真的相當反智
跟中國人民說祖國疫苗No1差不多 只是顏色不一樣而已
都是避著眼睛只相信自己相信的
噓 : 急了315F 01/24 20:44
→ : 只會做人身攻擊316F 01/24 20:44
推 : 質疑? 不是不行吧,要合邏輯…317F 01/24 20:44
→ : 你在繼續318F 01/24 20:44
→ : 不然不就變成抹屎?319F 01/24 20:45
推 : 這次中國真的會贏2次喔320F 01/24 20:45
→ : deepseek如果不是中國研究我覺得你應該就不會質疑了321F 01/24 20:45
→ : 中國的天賦點在紅海化 厲害了322F 01/24 20:45
推 : 胡扯亂翻譯人家公開的英文說明(而且是用很簡單的英323F 01/24 20:46
→ : 文)說是無腦都還太客氣了好嗎? wwww wwww
→ : 文)說是無腦都還太客氣了好嗎? wwww wwww
→ : 中國某些地方真的就是強啊 當然某些地方是不敢恭維325F 01/24 20:46
→ : 先玩過再說..,我兩套都玩過,deepseek真的不錯326F 01/24 20:46
→ : 如果deepseek不是中國的還會這樣罵人嗎?327F 01/24 20:46
→ : 小心釣魚,看他自己表演就好,建議啦328F 01/24 20:47
→ : 沒邏輯的講話最大聲
→ : 沒邏輯的講話最大聲
→ : 我沒差 反正我不會罵人 我只評論deepseek330F 01/24 20:48
→ : 最近這版衛兵執勤很認真,桶了幾波了,自己小心331F 01/24 20:48
推 : (看戲332F 01/24 20:48
→ : 反倒是某些人小心333F 01/24 20:48
※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 20:49:43推 : 評論?胡亂翻譯人家的英文也敢叫做評論?笑死人有334F 01/24 20:49
→ : 夠好笑 wwwww
→ : 夠好笑 wwwww
噓 : 一堆ai大老都中國人 哪天超車都不意外 軟體這種東西336F 01/24 20:50
→ : 限制沒有硬體這麼多
→ : 限制沒有硬體這麼多
→ : 不過這篇推文這麼火熱 沒半個人貼實例對話XDD338F 01/24 20:50
→ brella …
→ : 之前gpt在紅的時候 還有gpt幫忙回應的截圖340F 01/24 20:50
→ : 覺得好的 可不可以務實點 去玩幾個例子貼來看看
→ : 覺得好的 可不可以務實點 去玩幾個例子貼來看看
推 : 大驚小怪,這種前沿的技術,本來就是湖鄉合作,及互342F 01/24 20:51
→ : 相競爭的
→ : 相競爭的
→ : 讓我見識見識哪些是你們覺得好 哪些是回應差的344F 01/24 20:51
推 : deepseek有手機app啊!自己下載來用用看不就知道了346F 01/24 20:52
→ : ?用email就可以註冊了。
→ : ?用email就可以註冊了。
→ : 湖鄉=>互相348F 01/24 20:52
→ : 剛好今天才在用..349F 01/24 20:52
→ : 反倒是批評的?….
→ : 反倒是批評的?….
→ : 中國軟體強度上下限差很大 遇過一堆中國客戶連用AI351F 01/24 20:53
→ : 幫忙寫sql寫shell script寫yaml都不會= =
→ : 幫忙寫sql寫shell script寫yaml都不會= =
→ : 我兩套都常用啦,我自己112csie,也有研究ai主題353F 01/24 20:53
推 : 笑翻,被反向354F 01/24 20:53
→ : 樓上可以要他用正體中文回答。355F 01/24 20:53
→ : 倒是爬蟲後,發現一堆嘴的頭頭是道,結果背景令人358F 01/24 20:53
→ : 驚訝XDDD
→ : 驚訝XDDD
推 : 這就是第一個開頭的和跟班的差距啊 第一個一定要砸360F 01/24 20:54
→ : 大錢開發 後面的當然可以降低成本
→ : 大錢開發 後面的當然可以降低成本
→ : 就是不想註冊阿... 試想會黑的怎會想用362F 01/24 20:54
→ : 沒用過說的好像很熟一樣XDD 實事求是XDD363F 01/24 20:55
→ : 哪個行業不是這樣 開拓者都是要付出最多的364F 01/24 20:55
推 : 問題是開拓者能否一直保持領先優勢,看看Nokia跟Mot365F 01/24 20:56
→ : 所以我說,爬蟲後的心得,就是推文自己小心,最近審366F 01/24 20:56
→ : 查異己言論很勤勞的
→ : 查異己言論很勤勞的
→ : o蘿拉的下場368F 01/24 20:56
推 : DeepSeek是猛在CP值超級高370F 01/24 20:56
推 : 台灣軟體公司好少371F 01/24 20:56
推 : 連註冊都沒有就拼命在黑? wwww 人家台大資工親自372F 01/24 20:57
→ : 試用還截圖給你耶
→ : 試用還截圖給你耶
→ : OpenAI 目前還是領頭羊沒問題374F 01/24 20:57
噓 : 笑死,人家明明在說META用了15倍的預算,更好的GPU375F 01/24 20:57
推 : 我覺得一般用戶蠻鼓勵開發團隊都跳進甕被練蠱376F 01/24 20:57
→ : ,卻訓練出了比DS更差的模型,英文到底怎麼讀的,co377F 01/24 20:57
→ : uld have看不懂嗎?
→ : uld have看不懂嗎?
→ : 台灣搞LLM只能玩微調套皮379F 01/24 20:57
推 : 所以說 買大盤真安心啊 20年前市值前10公司跟現在380F 01/24 20:57
→ : 比已經大洗盤
→ : 比已經大洗盤
→ : 所以上面eriker說的meta復現準確度 有原文嗎?382F 01/24 20:58
推 : 我平常兩個都在玩啊,我沒說chatgpt不好吧?383F 01/24 20:58
推 : AI領域大陸那邊跟美國的差距本來就不大,有在關心AI384F 01/24 20:58
→ : 相關研究的大概都知道在說什麼,尤其中文大語言模型
→ : 就唯一只有大陸那邊的能打,反觀台灣研發的真的很爛
→ : ,呵呵!
→ : 相關研究的大概都知道在說什麼,尤其中文大語言模型
→ : 就唯一只有大陸那邊的能打,反觀台灣研發的真的很爛
→ : ,呵呵!
推 : 沒有 嘻嘻388F 01/24 20:58
推 : 暫時觀望389F 01/24 20:59
→ : 你問他llm吹很厲害的 有多少在搞啊 誰有空每個都試390F 01/24 20:59
推 : 我覺得不用太緊張啦 人家用H800真的能超越openai391F 01/24 20:59
→ : 你說的如果是原po貼的那段翻譯 應該是你翻譯的問題392F 01/24 20:59
→ : 我相信股價早就被灌下來灌爛了 那些大戶一定第一393F 01/24 20:59
→ : 個跑的
→ : 個跑的
噓 : 那個eriker連最基本的英文都讀不懂395F 01/24 20:59
推 : 我看有很多人都不知道自己用的網站是用vue3寫的396F 01/24 20:59
推 : costdown誰的比得過華人397F 01/24 21:00
推 : 中國軟體實力本來就是天下第二了398F 01/24 21:00
→ : 或者是就算如此 巨頭也不會降低支出 怕被同行超越401F 01/24 21:01
推 : 先不說是不是真的,但逢中必反那個鳥樣,酸別人砸402F 01/24 21:01
→ : 錢研發有夠莫名其妙
→ : 錢研發有夠莫名其妙
→ : copilot claude gemini gpt llmam 每個新出的都sota404F 01/24 21:01
推 : 還有人以為是costdown啊?不虧是台灣代工老舊代工思405F 01/24 21:01
→ : 維,那些發展AI的人才經費花費成本真算下來哪裡cost
→ : down了?
→ : 維,那些發展AI的人才經費花費成本真算下來哪裡cost
→ : down了?
噓 : 中國晶片都可以去買別人的晶片來磨改名字了==410F 01/24 21:02
推 : 說真的chatgpt也能回答這題XDD411F 01/24 21:02
→ : 搞不懂別人的問題點 還在以為我在黑中國412F 01/24 21:03
→ : 台灣的老問題上次已經講過了,目前全世界先進的未來413F 01/24 21:03
→ : 科技領域除了「我們有台積電」之外每一個能打的。
→ : 科技領域除了「我們有台積電」之外每一個能打的。
→ : 但好笑的是,拿這題當評斷AI的標準XDD415F 01/24 21:03
→ : 問題是 現在每個llm都吹自己最強 當我是llm測試員哦416F 01/24 21:03
→ : 很顯然不是理工人吧XD417F 01/24 21:03
→ : 美國變成copy cat418F 01/24 21:04
推 : deepseek不採用預標數據集(也就是先由人類標記數419F 01/24 21:04
→ : 據再給模型訓練)而是直接採用強化學習,自己訓練
→ : 自己,並且透過他們的局部Token啟動機制,可以減少
→ : 使用量,這也是為什麼Deepseek能夠大幅降低訓練成
→ : 本的原因,不確定OpenAi 或是其他AI模型,為什麼沒
→ : 有進行強化學習
→ : 據再給模型訓練)而是直接採用強化學習,自己訓練
→ : 自己,並且透過他們的局部Token啟動機制,可以減少
→ : 使用量,這也是為什麼Deepseek能夠大幅降低訓練成
→ : 本的原因,不確定OpenAi 或是其他AI模型,為什麼沒
→ : 有進行強化學習
→ : 所以才說,爬蟲後,再看一次推文會很有趣啊XD 另,425F 01/24 21:04
→ : 你知道ptt主機放哪?XD
→ : 你知道ptt主機放哪?XD
推 : 意識形態死腦筋沒救,拿六四事件當評斷AI標準XD427F 01/24 21:04
推 : 因為美國只相信大力出奇蹟那套,砸錢砸算力429F 01/24 21:05
推 : 成本更低 美國科技巨頭情何以堪430F 01/24 21:05
→ : 但是這確實是對AI界投下震撼彈吧,不過OpenAI改用431F 01/24 21:05
→ : 自主強化學習,不知道是否可以
→ : 自主強化學習,不知道是否可以
噓 : 理工人又在打手槍自慰啊433F 01/24 21:06
→ : 會審查訊息的AI就算在某方面超越其他人也是不可能
→ : 普吉的
→ : *普及
→ : 會審查訊息的AI就算在某方面超越其他人也是不可能
→ : 普吉的
→ : *普及
推 : 阿姨的機會來了437F 01/24 21:06
→ : DEEPSEEK 的數據集也許確實有部份來自ChatGPT,但438F 01/24 21:07
→ : 這並不影響他確實是一個蠻厲害的模型
→ : 這並不影響他確實是一個蠻厲害的模型
推 : 又有人硬要扯到晶片了。公開的論文告訴你實驗環境、440F 01/24 21:07
→ : 算法流程、效能評比;原始碼放在大家都可以下載的 G
→ : itHub 上,這要怎麼作弊???
→ : 算法流程、效能評比;原始碼放在大家都可以下載的 G
→ : itHub 上,這要怎麼作弊???
推 : 就事論事,如果你說會不會普及,那就另外一題了,443F 01/24 21:07
→ : 請另闢蹊徑吧
→ : 請另闢蹊徑吧
推 : Deepseek 是真的有些東西啊445F 01/24 21:07
推 : OPENAI的O3就是RL壓 聖誕節前的13天倒數也有RL出現446F 01/24 21:08
→ : O3就是O1 RL來的 省去訓練成本
→ : O3就是O1 RL來的 省去訓練成本
推 : 美國人都害怕被中國ai超越,還有中國黑認為是在吹448F 01/24 21:09
→ : 牛逼而已
→ : 牛逼而已
推 : 還好它開源 同樣的演算法創新讓資源更多的美國科技450F 01/24 21:09
→ : 巨頭來用 以他們握有的訓練資源能產出更驚人的結果
→ : 巨頭來用 以他們握有的訓練資源能產出更驚人的結果
→ : 碼農996用肝跟你拼了453F 01/24 21:10
推 : 這鯨魚真的邪門 花少少的預算幹大事 meta最好撐住啊454F 01/24 21:11
推 : 但感覺AGI和技術奇點的時間又被提前了.......455F 01/24 21:11
→ : 中國AI公司因為算力受限,只好動腦另闢蹊徑,走出一456F 01/24 21:11
→ : 片天,高階晶片也是一樣的道理
→ : 片天,高階晶片也是一樣的道理
噓 : 夠便宜我就自己訓練一個458F 01/24 21:11
→ : 這才是最恐怖的吧 感覺2030年前就要奇點了459F 01/24 21:11
推 : 那就對啦O3開始用RL的話,大概又會反超吧460F 01/24 21:12
→ : 真的好恐慌 zzz 嚇死人 只好再睡一下461F 01/24 21:12
推 : 開源的 只能導入462F 01/24 21:12
噓 : 跟文組講那麼多幹嘛 笑死463F 01/24 21:12
→ : 論文都出了464F 01/24 21:12
推 : 繼續吹起來 我要看到血流成河465F 01/24 21:13
推 : 傻鳥真的很傻很北七 一直那邊說DS造假 我還以為是真466F 01/24 21:13
→ : 的有什麼內幕勒。結果他媽的是英文太爛根本自己完全
→ : 的有什麼內幕勒。結果他媽的是英文太爛根本自己完全
→ : 跟股票一樣 有錢人不會輸468F 01/24 21:13
→ : 搞錯 連下面有中文的正確翻譯也不看469F 01/24 21:13
→ : 導入以後 3000e 的就更猛470F 01/24 21:13
推 : AI究極鬼故事!471F 01/24 21:14
→ : 550萬就這麼猛 3000e的 6倍猛472F 01/24 21:14
推 : 那個貼文確實是說Meta的訓練費用都可以訓練15次Dee473F 01/24 21:14
→ : pseek了
→ : pseek了
→ : 傻鳥真的北七 前幾天還看到黃仁勳去中國就瘋狂崩潰475F 01/24 21:14
→ : 的
→ : 的
推 : OpenAI的問題是核心科學家走了477F 01/24 21:14
→ : 就跟現在的預算一樣478F 01/24 21:15
→ : O3我記得之前altman有貼出他的比較,好像比O1強不479F 01/24 21:15
→ : 少,但是當然費用很貴,如果OpenAi把這個開源的機
→ : 制拿來用不知道行不行
→ : 少,但是當然費用很貴,如果OpenAi把這個開源的機
→ : 制拿來用不知道行不行
→ : 如果這是真的那麼那些CSP之後的資本支出根本不用那482F 01/24 21:16
→ : 麼高嘻嘻
→ : 麼高嘻嘻
推 : 訓練費降低是利多啊 趕緊出殺手級應用才是正軌484F 01/24 21:16
推 : 老黃484蛋雕惹QQ485F 01/24 21:17
推 : 訓練費代表所需的時間成本、算力跟電費等,自己想想486F 01/24 21:17
→ : 看囉!
→ : 看囉!
→ : 電力需求應該也不用那麼多吧488F 01/24 21:17
→ : 不過這件事沒多久前國內投資圈就有一些人知道了,489F 01/24 21:18
→ : 就看市場什麼時候反應了嘻嘻
→ : 就看市場什麼時候反應了嘻嘻
→ : OpenAI比較像是他有很多資訊,當你詢問他時,他會491F 01/24 21:18
→ : 依據他的知識庫中去找尋資料,並且給你。DEEPSEEK
→ : 則是有很多專門的朋友,會依據問的問題,分配給適
→ : 合的專門朋友去找資料回答(也就是不會全部Token調
→ : 動,可以減少Token使用量)
→ : 依據他的知識庫中去找尋資料,並且給你。DEEPSEEK
→ : 則是有很多專門的朋友,會依據問的問題,分配給適
→ : 合的專門朋友去找資料回答(也就是不會全部Token調
→ : 動,可以減少Token使用量)
推 : 訓練方式很華人496F 01/24 21:19
→ : 窩是上禮拜看節目聽一個物理學博士在分析497F 01/24 21:20
推 : 老黃沒差吧,算力永遠不夠,相同算力能做的事情更498F 01/24 21:20
→ : 多了,加速科技發展,是軟體公司要頭痛了,拼肝拼
→ : 軟體效率拼不過華人
→ : 多了,加速科技發展,是軟體公司要頭痛了,拼肝拼
→ : 軟體效率拼不過華人
推 : 國外有大神用兩台M3晶片的蘋果電腦搭載運行Deepseek501F 01/24 21:20
→ : 邏輯模型XDD
→ : 邏輯模型XDD
推 : 一堆人仇中仇到腦子壞掉了 可悲503F 01/24 21:20
推 : 厲害504F 01/24 21:21
→ : DS是分區塊 各領域專門訓練505F 01/24 21:21
推 : 沒錯,deepseek是MoA架構。506F 01/24 21:22
推 : 演算法創新會反過來創造出新的算力需求啊 因為對智507F 01/24 21:22
→ : 能的追求沒有上限 更高效的演算法=更快到奇點
→ : 能的追求沒有上限 更高效的演算法=更快到奇點
噓 : 一堆低能中黑 看了就好笑509F 01/24 21:23
推 : 哈哈黑黑不知道一堆模型都會說他是chatgpt,因為監510F 01/24 21:24
→ : 督學習步驟最多人用的就是拿chatgpt當那個監督模型
→ : 督學習步驟最多人用的就是拿chatgpt當那個監督模型
噓 : 剛問了美國地47屆總統是誰,連這個都答不出來,資513F 01/24 21:24
→ : 料庫還停在2023(模型為DeepSeekV3)
→ : https://i.imgur.com/XXmbi1v.jpeg
→ : 料庫還停在2023(模型為DeepSeekV3)
→ : https://i.imgur.com/XXmbi1v.jpeg
推 : OpenAI o3 是非開源碼啊,而且最近被揭露它表現最516F 01/24 21:24
→ : 驚人的 FrontierMath 指標有作弊的嫌疑!相關的英
→ : 文報導和討論不少,這裏給一個實例!
→ : https://tinyurl.com/yw55fcwk
→ : 驚人的 FrontierMath 指標有作弊的嫌疑!相關的英
→ : 文報導和討論不少,這裏給一個實例!
→ : https://tinyurl.com/yw55fcwk
OpenAI Secretly Funded Benchmarking Dataset Linked To o3 Model
OpenAI secretly funded and had access to a benchmarking dataset, raising questions about high scores achieved by its new o3 AI model. ...
OpenAI secretly funded and had access to a benchmarking dataset, raising questions about high scores achieved by its new o3 AI model. ...
推 : 連ai都能卷 了不起我的國522F 01/24 21:26
→ : P.S. 那隻看不懂國中等級英文的中黑歡迎繼續跳出來523F 01/24 21:26
→ : 吶喊丟人現世 wwww wwww
→ : 吶喊丟人現世 wwww wwww
→ : 因為deepseek不用運轉那麼多參數來產生回答,而Open525F 01/24 21:26
→ : AI的必須要,所以以電力消耗、算力消耗跟微型化來說
→ : 都不利,但也不是代表這樣不好。我是覺得OpenAI自從
→ : 變成Altman的玩物之後,進步幅度有限,反而吹噓成分
→ : 增加了,呵呵!
→ : AI的必須要,所以以電力消耗、算力消耗跟微型化來說
→ : 都不利,但也不是代表這樣不好。我是覺得OpenAI自從
→ : 變成Altman的玩物之後,進步幅度有限,反而吹噓成分
→ : 增加了,呵呵!
推 : DeepSeek有價值的地方不是它自身模型有多強..530F 01/24 21:26
→ : 而是他提出的創新可以被其他有更大訓練集和更多算力
→ : 而是他提出的創新可以被其他有更大訓練集和更多算力
推 : 差別在喝的茶葉或咖啡比較貴啦532F 01/24 21:27
→ : 的公司複用533F 01/24 21:27
→ : 強的是訓練的方式,裡面的秘密我相信應該沒有開源,534F 01/24 21:27
→ : 呵呵!
→ : 呵呵!
推 : 現在面臨作弊醜聞的反而是美國 & 世界最強的非開源536F 01/24 21:28
→ : 碼 OpenAI o3
→ : 碼 OpenAI o3
推 : 又贏了又贏了,中国贏兩次538F 01/24 21:28
推 : 那叫做他沒有使用網路 不是他不會 問這種沒鑑別度的539F 01/24 21:28
→ : 蠢問題要證明什麼
→ : 蠢問題要證明什麼
推 : 不要再搞笑了,他的資料庫到2023年根本就不是什麼541F 01/24 21:29
→ : 缺陷,只差在有沒有網路搜尋最新資訊而已
→ : 缺陷,只差在有沒有網路搜尋最新資訊而已
推 : DeepSeek很公開啊 演算法和工程改進都寫在論文裡543F 01/24 21:29
推 : 那個博士認為 因為成本優勢 注定美國以外地區會傾544F 01/24 21:29
→ : 向DS 所以DS將是最後贏家
→ : 向DS 所以DS將是最後贏家
→ : 真的是還好它夠公開546F 01/24 21:30
推 : 加大制裁547F 01/24 21:30
→ : 不過它也是站在一堆前輩肩上 現在給人站肩膀 這就是548F 01/24 21:30
推 : 意外的是DS竟然這麼大方公開研究方法549F 01/24 21:30
→ : 科學研究啊550F 01/24 21:30
推 : 論文都出來了551F 01/24 21:31
推 : 哇啊,削價競爭欸552F 01/24 21:32
推 : DeepSeek 如果在演算流程上沒有開創性的突破,美國553F 01/24 21:33
→ : 業界大老絕對不會用 "breakthrough" 來形容啦,這
→ : 個字義和 "cost down" 或 "內卷" 相差十萬八千里 -
→ : - 而且 " cost down" 是標準的台式英文
→ : 業界大老絕對不會用 "breakthrough" 來形容啦,這
→ : 個字義和 "cost down" 或 "內卷" 相差十萬八千里 -
→ : - 而且 " cost down" 是標準的台式英文
推 : 好到不可思議的好,就是假的557F 01/24 21:33
→ : 跟運動員吃禁藥一樣,不是apple 對apple
→ : 跟運動員吃禁藥一樣,不是apple 對apple
推 : Buy the rumor559F 01/24 21:34
推 : 讓子彈飛一會兒~~~~560F 01/24 21:34
推 : 令人恐懼的反而是模型的效率一日千里 對齊的研究牛561F 01/24 21:35
→ : 步慢行...
→ : 根本是直通文明毀滅的最短路線XD
→ : 步慢行...
→ : 根本是直通文明毀滅的最短路線XD
→ : 看起來就改進一個東西 就吹到天上去564F 01/24 21:36
→ : DeepSeek把人類文明的毀滅倒數時鐘又撥快了一格565F 01/24 21:36
推 : DS API的費用是 o1 的1/30566F 01/24 21:37
→ : DeepSeek可不止改進一個東西 論文都有 白話技術文也567F 01/24 21:37
推 : 不用擔心OPENAI 那個瘋子一心只想要真的AGI 就跟馬568F 01/24 21:37
推 : 樓上是在說 OpenAI 的 FrontierMath benchmark 嗎?569F 01/24 21:38
→ : 好到不可思議結果...
→ : 好到不可思議結果...
推 : 沒辦法,讓AI對齊人類的道德沒辦法賺錢,呵呵!571F 01/24 21:38
推 : 這個應該不怎樣吧 去年看太多篇宣稱更頂 驗證一下572F 01/24 21:38
推 : 中國很會利用別人的研究偷雞 先聽聽就好573F 01/24 21:38
→ : 就沒戲了 @@574F 01/24 21:38
→ : 斯克一心想上火星一樣 賽道不同575F 01/24 21:38
→ : 有 至少在大膽創新+高效工程這兩方面是非常優秀的576F 01/24 21:38
推 : 已經玩了一整天的R1,真的不差577F 01/24 21:38
→ : 去年一堆 現在不是很愛看中國出的論文 拿到長官面578F 01/24 21:38
→ : 前介紹都容易被罵
→ : 前介紹都容易被罵
推 : 人家原始碼、論文跟效能測試結果都公佈了啊,請問580F 01/24 21:41
→ : 樓上舉例一下哪個說自己更頂的有公開這些?好酸的
→ : 葡萄 wwww
→ : 樓上舉例一下哪個說自己更頂的有公開這些?好酸的
→ : 葡萄 wwww
推 : 中國一堆騙錢公司是事實 但DeepSeek和他們不一樣也583F 01/24 21:41
→ : 是事實 這兩個事實又不衝突...
→ : 是事實 這兩個事實又不衝突...
推 : 不是啊 論文就是有新方法 數據更漂亮 但實驗效果585F 01/24 21:42
→ : 跑了不佳 真的有啊
→ : 跑了不佳 真的有啊
推 : 藍白糞高潮587F 01/24 21:43
推 : 樓上中黑請解釋一下人家論文、原始碼都公開的情況下588F 01/24 21:43
→ : 要怎麼「利用別人的研究偷雞」?只會無腦黑嗎?
→ : 要怎麼「利用別人的研究偷雞」?只會無腦黑嗎?
噓 : 最近炒作很大,讓我們繼續看下去590F 01/24 21:43
→ : 我找一下 我有標記過591F 01/24 21:43
推 : 說減少算力能達到一樣效能,那一樣算力不是能達到更592F 01/24 21:43
→ : 高效能?為何要以減少算力為前提?
→ : 高效能?為何要以減少算力為前提?
→ : 論文公布了 但能 repro 嗎594F 01/24 21:43
→ : 請問有哪個可信消息來源說「實驗結果不佳」?又在595F 01/24 21:44
→ : 自己腦補嗎?
→ : 自己腦補嗎?
推 : 原始碼公開又不代表什麼 你是沒看過原始碼公開喔!!597F 01/24 21:44
→ : 你不是藍白糞幹嘛入座598F 01/24 21:44
推 : 啊 像那個LLaMA-omni就是同事報告時直接露餡599F 01/24 21:45
→ : 說能事半功倍,那不能事倍功四倍嗎?600F 01/24 21:45
→ : 開源就可以去repro601F 01/24 21:45
推 : 論文出來了,所以有人可以說明一下,他到底是不是拿602F 01/24 21:47
→ : 現有Ai模型為底去訓練的嗎
→ : 現有Ai模型為底去訓練的嗎
推 : 要跑過才知道604F 01/24 21:47
推 : 原始碼公開多久了?美國頂級業界學界大老也高度評605F 01/24 21:48
→ : 價讚賞,台大資工板友也早就註冊測試覺得表現很好了
→ : -- 請問中黑還要怎麼樣才願意承認人家做出一個好東
→ : 西???
→ : 價讚賞,台大資工板友也早就註冊測試覺得表現很好了
→ : -- 請問中黑還要怎麼樣才願意承認人家做出一個好東
→ : 西???
→ : 等哪天這個技術在公司一堆人講才是真的 我現在沒聽609F 01/24 21:48
→ : 到就是了
→ : 到就是了
你公司如果在做AI模型研究/工程的
這幾天全公司上下應該都在研究這個
推 : 簡單來說就是最近有一個新的AI能力測驗,找了好幾位611F 01/24 21:49
→ : 費爾茲數學獎得主來出超高難度題目,幾乎所有AI模型
→ : 都回答得跟屎一樣,只有o3脫穎而出,大家正震驚Open
→ : AI的技術力時,被爆料出來因為這個AI能力測驗OpenAI
→ : 有贊助能事先拿到題目作弊,Altaman的作為我是不意
→ : 外啦!呵呵!
→ : 費爾茲數學獎得主來出超高難度題目,幾乎所有AI模型
→ : 都回答得跟屎一樣,只有o3脫穎而出,大家正震驚Open
→ : AI的技術力時,被爆料出來因為這個AI能力測驗OpenAI
→ : 有贊助能事先拿到題目作弊,Altaman的作為我是不意
→ : 外啦!呵呵!
推 : 你現在沒聽到要啟MoE項目 只是表示你公司不在最前沿617F 01/24 21:49
→ : 對岸弱點還是0到1,但改造能力真的很強618F 01/24 21:49
推 : 看來你待的公司比 Meta AI 還強 wwww wwww619F 01/24 21:49
推 : 成本低,跟使用者收費就可以便宜620F 01/24 21:50
推 : 因為老馬的之前也拿過高分。就看囉621F 01/24 21:50
噓 : 機器之心 是誰?622F 01/24 21:51
→ : 現在最前沿的美國公司一定會啟新項目投入MoE方向了623F 01/24 21:51
推 : 分領域導出答案 假如問題是跨領域不就GG了624F 01/24 21:51
→ : 沒有啊 大家也是會謹慎看結果 OpenAi在很多篇論文625F 01/24 21:51
→ : 數據都平均佳 所以謹慎看待每一版表現囉
→ : 數據都平均佳 所以謹慎看待每一版表現囉
推 : 說個事實 某些人就開始藍白粉壯世代的 這些爛貨627F 01/24 21:52
→ : 還是早點被時代淘汰吧
→ : 還是早點被時代淘汰吧
→ : 拉板凳看戲629F 01/24 21:52
推 : 這說明小公司也可作出好的模型,那大家就會躍躍欲630F 01/24 21:52
→ : 試,Al伺服器需求也會增加啊!
→ : 試,Al伺服器需求也會增加啊!
推 : 其實MoA架構比較符合人類的思考方式,人類大腦功耗632F 01/24 21:52
※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 21:53:14→ : 才30W參數量才4GB,演化的威能不是蓋的。633F 01/24 21:52
推 : 台灣不應該發展中文語言模型,教授都嘛拿國家錢產出634F 01/24 21:53
→ : 沒用的東西。直接全民學英文比較有效率
→ : 沒用的東西。直接全民學英文比較有效率
推 : duriamon 板友講的 OpenAI o3 在高難度數學測驗的涉636F 01/24 21:53
→ : 弊醜聞我在樓上就貼了一個應為報導短網址了,現在 A
→ : I 圈內最被懷疑的反而是這個
→ : 弊醜聞我在樓上就貼了一個應為報導短網址了,現在 A
→ : I 圈內最被懷疑的反而是這個
→ : 而且重點是資料庫吧 目前以資料庫取得難易程度639F 01/24 21:53
→ : 有Altman亂搞,OpenAI遲早會完蛋,我先預言在這邊,640F 01/24 21:54
→ : 對岸的13億免費資料庫真的比歐美簡單多了641F 01/24 21:54
→ : 呵呵!642F 01/24 21:54
推 : 我記得OpenAI數學不好吧643F 01/24 21:54
→ : *英文報導644F 01/24 21:54
推 : Meta AI不錯 但現在使用者標竿是OpenAI645F 01/24 21:54
推 : 一堆井蛙還是不信 呵呵646F 01/24 21:54
→ : 難怪你待的公司沒人在討論 DeepSeek,都 2025 年了647F 01/24 21:55
→ : 還在講 OpenAI 數學不好,嘻嘻 wwww wwww
→ : 還在講 OpenAI 數學不好,嘻嘻 wwww wwww
推 : 對 OpenAI是標竿 因為大多比較數據出在別人的論文649F 01/24 21:55
→ : 裡 GPT都平均拿到最佳 但數學是真的爛
→ : 裡 GPT都平均拿到最佳 但數學是真的爛
→ : OpenAI 涉嫌作弊的是普通人一輩子都碰不到邊的 Fron651F 01/24 21:56
→ : tierMath benchmark !!!
→ : tierMath benchmark !!!
→ : 現在由於用於訓練AI模型所使用的開源資料已經幾乎耗653F 01/24 21:56
→ : 盡,現在流行的是新型AI架構的研發以及超參數的蒸餾
→ : 和分析,如何從已經有的超參數產生更好的產品才是顯
→ : 學。
→ : 盡,現在流行的是新型AI架構的研發以及超參數的蒸餾
→ : 和分析,如何從已經有的超參數產生更好的產品才是顯
→ : 學。
→ : 我是沒有很常使用數學相關的沒錯。記憶停在數學爛657F 01/24 21:56
→ : 沒錯
→ : 沒錯
推 : o3應該不久後就會出來了吧 而且免費用戶也有o3 mini659F 01/24 21:56
→ : 到時候就知道openAI有沒有吹牛了
→ : 到時候就知道openAI有沒有吹牛了
→ : 看那個整天吹噓的Sora我是不期待啦!呵呵!661F 01/24 21:57
→ : 還在繼續幻想說 OpenAI o3 數學爛 wwww 人家輕鬆碾662F 01/24 21:57
→ : 壓你好嗎!
→ : 壓你好嗎!
噓 : 叫美國時代過去之前,他科技還是屌打世界2-30年…664F 01/24 21:58
→ : 新的架構我覺得會是比較有趣的發展,傳統的transfor665F 01/24 21:59
→ : mer已經差不多了。
→ : 說是傳統不過也才2-3年的事,AI發展就是這麼競爭,
→ : 呵呵!
→ : mer已經差不多了。
→ : 說是傳統不過也才2-3年的事,AI發展就是這麼競爭,
→ : 呵呵!
推 : 等很多paper報告看到比較時DS贏再說吧 最近兩個月669F 01/24 22:00
→ : 沒時間看paper 小組報告都延期了 趕年末案子要GM
→ : 沒時間看paper 小組報告都延期了 趕年末案子要GM
推 : OpenAI o3 的 AIME 2024 benchmark 分數是 96.7% 好671F 01/24 22:05
→ : 嗎?
→ : 嗎?
推 : o3不是12月才推出嗎 我剛好沒用 哈 以前很爛是真673F 01/24 22:07
→ : 的
→ : 的
推 : 很好啊 有威脅度才有理由打死675F 01/24 22:07
→ : 那我就期待一下2025的各大paper囉676F 01/24 22:07
推 : OpenAI o3 現在被質疑的 FrontierMath benchmark 是677F 01/24 22:07
→ : 絕大多數人一輩子都碰不到的高等數學
→ : 絕大多數人一輩子都碰不到的高等數學
噓 : meta就是故意開源AI不給微軟賺的 還在演啥679F 01/24 22:08
推 : 又在講笑話了,嘻嘻。OpenAI 在 AIME benchmark 早680F 01/24 22:09
→ : 就超過大部分人的數學水準了 wwww
→ : 就超過大部分人的數學水準了 wwww
推 : 丸子,台積和美股7巨頭都要暴跌682F 01/24 22:10
→ : 難怪你的公司沒聽過 DerpSeek,嘻嘻 wwww683F 01/24 22:10
推 : 教科書的數學是可以 邏輯陷阱還是會踩684F 01/24 22:10
→ : 聖誕節才發布 不要急哇
→ : 聖誕節才發布 不要急哇
推 : 只要中國的開發者還開源就不可能贏美國啦,美國穩的686F 01/24 22:12
→ : 暴跌就想太多了,尤其台積本益比才二十幾687F 01/24 22:12
推 : 開源的遠不只 Meta 一家,DeepSeek 是用少得嚇人的688F 01/24 22:12
→ : 成本打平、打敗檯面上所有的開源大語言模型
→ : 成本打平、打敗檯面上所有的開源大語言模型
推 : NV盤前大跌-0.5% 蒸的丸子690F 01/24 22:13
→ : 為什麼有人要為了中國的AI很厲害感到自豪?691F 01/24 22:13
→ : 你問中國用的晶片是不是台積做的692F 01/24 22:14
推 : 我也不知道 而且我習慣謹慎多看幾版693F 01/24 22:14
→ : 而且AI只是台積的一部分而已694F 01/24 22:14
推 : Deepseek不是open的嗎@@695F 01/24 22:15
推 : 因為 DS 狠狠打臉股板數不清的無腦中黑啊,嘻嘻 www696F 01/24 22:16
→ : w
→ : 連 OpenAI 數學早就很強都完全不知道的人說自己「
→ : 謹慎」 wwww wwww
推 : 看到無腦的____ 被狠狠打臉就覺得爽快是人之常情吧
→ : wwww
→ : w
→ : 連 OpenAI 數學早就很強都完全不知道的人說自己「
→ : 謹慎」 wwww wwww
推 : 看到無腦的____ 被狠狠打臉就覺得爽快是人之常情吧
→ : wwww
推 : 兄弟 聽我說 這個ds 有料702F 01/24 22:21
→ : 真的沒什麼好爭的 就看你能拿它來做什麼 有真的帶來703F 01/24 22:21
→ : 創造性的價值 那就是對你有利的
→ : 創造性的價值 那就是對你有利的
推 : 料敵從寬也不是壞事阿,多多想台灣有什麼能介入的705F 01/24 22:22
→ : 黑貓白貓會抓老鼠的就是好貓706F 01/24 22:22
→ : 如果他再厲害不能為你所用也是沒用
→ : 如果他再厲害不能為你所用也是沒用
噓 : 支那XDXDXD 聽聽就好708F 01/24 22:23
→ : 謝遜拿了屠龍刀雙眼失明 頂多拿來砍樹709F 01/24 22:24
推 : 中國景氣不好有時對科研反而有好處,逼人去研究710F 01/24 22:24
推 : 有更好的算法能產生更快投入市場,就會有更多廠商願711F 01/24 22:24
→ : 意堆更多硬體來搶佔市場,永遠沒人在嫌硬體效能過剩
→ : 的
→ : 意堆更多硬體來搶佔市場,永遠沒人在嫌硬體效能過剩
→ : 的
噓 : 想想半導體造假,先觀望一下好了714F 01/24 22:24
→ : 沒有不好好嗎 每天那麼多人張口就是要吃飯715F 01/24 22:25
→ : 吃的用的沒少過 只是沒有以前這樣亂花
→ : 吃的用的沒少過 只是沒有以前這樣亂花
推 : 資料都被分析完 那就有可能走向預測了717F 01/24 22:25
推 : 很快的。論文1、2個月內會有一堆去證明。718F 01/24 22:26
→ : 連他們自己一堆人都在說景氣下行了,不用否認719F 01/24 22:26
推 : 這個方法好,那當所有人都用這方法,那最後不是還是720F 01/24 22:26
→ : 拚誰堆的硬體多?
→ : 拚誰堆的硬體多?
推 : 自己去用用看不就得了,免費722F 01/24 22:26
→ : 要推廣給更多人用,還是要硬體阿723F 01/24 22:27
→ : 甚至能普及的話,硬體需求更多
→ : 甚至能普及的話,硬體需求更多
推 : 是要看驗證數據 不同篇會用不同場景要解決的問題去725F 01/24 22:28
→ : 驗證 我不可能自己去弄那個資料
→ : 驗證 我不可能自己去弄那個資料
推 : 現在反而怕應用普及不了到一般消費者,硬體需求反而727F 01/24 22:28
→ : 曇花一現,真能更快達到普及至消費端,硬體需求才真
→ : 的會井噴
→ : 曇花一現,真能更快達到普及至消費端,硬體需求才真
→ : 的會井噴
推 : $$$$$$$$$$$$$$$730F 01/24 22:29
→ : 裁員滾滾,股價又可以噴噴731F 01/24 22:29
→ : 這就跟省油車出來,汽車反而賣更好的道理依樣732F 01/24 22:29
推 : 小金庫被拆了733F 01/24 22:30
推 : 中國人比較卷 贏美國早晚的734F 01/24 22:30
推 : H800 GPU不也是NV的嗎?735F 01/24 22:31
→ : 半年整個指數漲了快¼你說經濟很差?736F 01/24 22:32
推 : H800效果就很好,那用GB200不就飛天了?737F 01/24 22:33
推 : 模型是科研 應用是商業 其實這兩件事關連不大~~738F 01/24 22:33
→ : 商業上 還是擁有直接面對消費者布署能力和通路的巨
→ : 頭們優勢最大
→ : 商業上 還是擁有直接面對消費者布署能力和通路的巨
→ : 頭們優勢最大
→ : 1990年到現在漲了10倍741F 01/24 22:36
→ thigefe …
推 : 港股一年來漲了26.20%,但5年來跌了28.21%,所以說743F 01/24 22:37
→ : 經濟不好沒問題吧?而且比疫情時期還低就更慘了...
→ : 經濟不好沒問題吧?而且比疫情時期還低就更慘了...
→ : 那只是一個相對的概念745F 01/24 22:38
推 : 中國政府都在催促國家隊進場買股了,這樣叫好?746F 01/24 22:38
→ : 一個人如果有10億 然後他現在剩下七億每天跟你說他747F 01/24 22:38
→ : 很窮 你要同情他嗎?
→ : 很窮 你要同情他嗎?
→ : 他們本來就不是正常股市了,做空還會被政府抓749F 01/24 22:39
→ : 你可能沒有看過1990的大陸750F 01/24 22:40
→ : 1990的人忍耐力一定比現在高很多好嗎751F 01/24 22:40
推 : 百萬輸出 tokens 16 元,輸出 API 價格只有 OpenAI752F 01/24 22:40
→ : o1 的 3%。熟悉的味道
→ : o1 的 3%。熟悉的味道
→ : 那時候他們就已經過得不錯了 只是沒有現在好而已754F 01/24 22:40
→ : 1990過得不錯是平行時空嗎?755F 01/24 22:41
→ : 現在一定比35年前好啦,但人民的需求也會上升
→ : 現在一定比35年前好啦,但人民的需求也會上升
→ WD640G …
→ : 之前一直吹的解封行情,現在也沒了758F 01/24 22:43
→ : 有吃有喝 有得住 還要怎樣? 就是交通不發達 醫療技759F 01/24 22:43
推 : 爛爆,deepseek錯誤百出760F 01/24 22:43
→ : 術不發達761F 01/24 22:43
推 : 中國有些團隊paper提供無限量用很佛是真的 尤其gen762F 01/24 22:45
→ : 多媒體 同事分享過 覺得挖paper最大好處
→ : 多媒體 同事分享過 覺得挖paper最大好處
推 : 1. 中國現在經濟差景氣不好;2. 中國中下層百姓過得764F 01/24 22:45
→ : 比疫情前還苦;這些都沒錯,但是:3. 中國投入科研
→ : 的經費持續增加;4. 中國 2024 年在頂尖科學和、工
→ : 程期刊和頂尖 CS 會議的論文發表數持續突破新高 esp
→ : . Nature, Science
→ : 比疫情前還苦;這些都沒錯,但是:3. 中國投入科研
→ : 的經費持續增加;4. 中國 2024 年在頂尖科學和、工
→ : 程期刊和頂尖 CS 會議的論文發表數持續突破新高 esp
→ : . Nature, Science
推 : 中國東西 先打3折769F 01/24 22:46
推 : 剛剛meta ath 看來不影響?770F 01/24 22:46
推 : 景氣不好,會讓一些人才寧願去科研阿771F 01/24 22:46
推 : 真得先打3折 QQ772F 01/24 22:46
→ : 蠢鳥也很笨 這東西明明對台灣也好773F 01/24 22:48
推 : 中國人很卷終獲勝?1990日本也過得不錯啊774F 01/24 22:48
→ : 這都他們自己控制的775F 01/24 22:48
→ : 要是解法一直是堆GPU 你堆得贏那些CSP大廠嗎776F 01/24 22:48
推 : 中國民企要存活,基本上就是要走出海外777F 01/24 22:49
→ : 過度信用擴張的人才會有問題778F 01/24 22:49
→ : 有deepseek的發表 至少讓台灣還有入場券779F 01/24 22:50
→ : 不然國內越捲就越不敢請人,繼續惡性循環780F 01/24 22:50
推 : 我只說一句如果真的那麼好,中國人完全不可能開源,781F 01/24 22:50
→ : 對標open AI就只是滿足自卑感自己吹吹。完全沒有原
→ : 創性的產品
→ : 對標open AI就只是滿足自卑感自己吹吹。完全沒有原
→ : 創性的產品
噓 : 唬爛,沒底層光靠蒸餾要趕英超美784F 01/24 22:50
推 : 怎麽一堆人看到中國就黑785F 01/24 22:51
推 : 美國最大優勢其實還是強大的內需786F 01/24 22:52
→ : 那些中國公司產出在好,不進歐美會被自己人卷死
→ : 那些中國公司產出在好,不進歐美會被自己人卷死
推 : 都是中共同路人啦788F 01/24 22:54
→ : 大家還不夠瞭解中國人嗎?又狠又卷又不要臉,文革大789F 01/24 22:54
→ : 躍進死的人比二戰還多,把錯都推給毛澤東,那根本是
→ : 一個全體人民劣根性的完全展現結果,只怪一個人??
→ : ?
→ : 躍進死的人比二戰還多,把錯都推給毛澤東,那根本是
→ : 一個全體人民劣根性的完全展現結果,只怪一個人??
→ : ?
→ : 中國會沒有內需嗎? 而且四倍的人口793F 01/24 22:54
推 : 問題是他們的對手也是中國公司啊 自己人卷死794F 01/24 22:55
→ : 有人還抹我是中國同路人,笑死!中國六代戰機有開源795F 01/24 22:57
→ : 嗎?但是中國人也不要偷著樂,六代機和老美十幾年前
→ : 就有的F22也不會有優勢,看有沒有五五波就偷笑了
→ : 嗎?但是中國人也不要偷著樂,六代機和老美十幾年前
→ : 就有的F22也不會有優勢,看有沒有五五波就偷笑了
推 : 都被美國業界學界大頭稱讚是 "breakthrough" 了還在798F 01/24 22:58
→ : 「完全沒有原創性」,笑死 wwww 講這句話的人根本
→ : 不懂什麼什麼叫作原創性
→ : 「完全沒有原創性」,笑死 wwww 講這句話的人根本
→ : 不懂什麼什麼叫作原創性
→ : 原本就太肥了 nv的算力可能撐不起他們那種演算法801F 01/24 22:58
→ : 沒差就看誰先算出有用的東西
→ : 沒差就看誰先算出有用的東西
→ : 中國是變強了,是世界第二強國,但是民族劣根性永遠803F 01/24 22:59
→ : 去除不掉
→ : 去除不掉
→ : 而且中國領先的 AI 公司的語言模型幾乎都是開源讓大805F 01/24 22:59
→ : 家下載,遠不只 DS,一點常識都沒有 wwww wwww
→ : 家下載,遠不只 DS,一點常識都沒有 wwww wwww
推 : 看效能和背後的財務模式不覺得恐怖嗎807F 01/24 23:00
推 : Deepseek的模型有借鑒之處,美國人也不是白癡,學808F 01/24 23:00
→ : 過來調整一下,馬上模型就降本增效了
→ : 過來調整一下,馬上模型就降本增效了
→ : 美國、歐洲大部分做 AI 研究的也是開源,OpenAI 反810F 01/24 23:00
→ : 而是世界的少數例外
→ : 而是世界的少數例外
→ : 真的OpenAI 真的反而是例外812F 01/24 23:01
→ : 老黃還稱讚華為手機不可思議,中國人不要那麼自卑好813F 01/24 23:01
→ : 不好?? 等到學界公認再來說吧
→ : 不好?? 等到學界公認再來說吧
推 : 說不定是美國人過太爽了,人事費用太高815F 01/24 23:02
推 : 如果deepseek可以搞到gb200 不是更強 AI永遠需要N816F 01/24 23:02
→ : V
→ : V
推 : 現在 AI 還是離起跑點不遠的階段,當然最後美中誰818F 01/24 23:02
→ : 贏不知道,更有可能是互有擅場
→ : 贏不知道,更有可能是互有擅場
→ : 你看你能不能算出一個 比馬斯克更棒的火箭系統820F 01/24 23:02
→ : 看一堆影片還說美國科技業過多爽821F 01/24 23:03
推 : 付費打不過open還有人要付錢822F 01/24 23:04
推 : 推開源823F 01/24 23:04
推 : 組織文化的問題 DeepSeek作得到但是華為騰訊百度沒824F 01/24 23:04
→ : 作到 就說明了這不是中美差異 而是組織文化差異
→ : 作到 就說明了這不是中美差異 而是組織文化差異
推 : Deepseek的強化學習模式,也是O3的訓練模式,所以827F 01/24 23:05
→ : 等O3公布以後,大家應該又會來比拼
→ : 等O3公布以後,大家應該又會來比拼
→ : open AI算力爆棚錢又多,窮人用窮人演算法自己自嗨829F 01/24 23:05
→ : !笑死。大腕花幾十萬玩明星一次,窮人打手槍打到扁
→ : 掉,還很得意說不花錢還射比較爽,哈哈
→ : !笑死。大腕花幾十萬玩明星一次,窮人打手槍打到扁
→ : 掉,還很得意說不花錢還射比較爽,哈哈
→ : 要論軟工高手和996的強度 中國大公司比DeepSeek強多832F 01/24 23:05
→ : 的確是很爽 但是壓力也很大 而且整個人的思路都不一833F 01/24 23:05
→ : 樣了
→ : 樣了
→ : 了 這幾年騙錢的中國AI公司也沒少過 DeepSeek能成功835F 01/24 23:06
→ : 自然有其公司文化的獨特之處
→ : 自然有其公司文化的獨特之處
推 : 重點是沒有要比美國好啊,差一點點但便宜5倍,美國c837F 01/24 23:08
→ : sp廠capex砍下來供應鏈就崩了
→ : sp廠capex砍下來供應鏈就崩了
推 : 看某位美國一流名校女博士天天拍 YouTube 就知道美839F 01/24 23:08
→ : 國高科技業一堆爽缺閒缺...
→ : 國高科技業一堆爽缺閒缺...
推 : 真正開源的是meta,DS也是拿人家的來改根據開源條款841F 01/24 23:10
→ : 本來就要跟著開源,中國人有那麼好死,講一個自己完
→ : 全無到有的原創產品開源的再來說自己人格很崇高,不
→ : 然看你中國人德行就是垃圾
→ : 本來就要跟著開源,中國人有那麼好死,講一個自己完
→ : 全無到有的原創產品開源的再來說自己人格很崇高,不
→ : 然看你中國人德行就是垃圾
推 : 女博士薪水說不定比台積很多主管高了845F 01/24 23:10
推 : 真的不用拿文革和大躍進來嘴什麼民族性,要不然美846F 01/24 23:11
→ : 國的民族性是不是崇尚內鬥和蓄奴(-- 當時全歐洲由英
→ : 國帶頭都禁止蓄奴了)?? ?
→ : 國的民族性是不是崇尚內鬥和蓄奴(-- 當時全歐洲由英
→ : 國帶頭都禁止蓄奴了)?? ?
→ : 砍capex幹嘛 好的模型算法+算力不是更飛天= =849F 01/24 23:11
→ : 除非你覺得AI已經發展到盡頭了 不然算力永遠都不夠
→ : 除非你覺得AI已經發展到盡頭了 不然算力永遠都不夠
推 : 美國有些人事成本真的太高了,還有搞啥DEI851F 01/24 23:12
推 : 對啊 算法改進了效率變好 第一直覺當然是再放大模型852F 01/24 23:12
→ : 好的算法+更強的算力那才是事半功倍 買越多省越多853F 01/24 23:13
→ : 或是再加訓練集吧 對BigTech來說...854F 01/24 23:13
--
※ 看板: Stock 文章推薦值: 1 目前人氣: 0 累積人氣: 1425
作者 Lushen 的最新發文:
- 24F 10推
- 18F 12推 1噓
- 114F 29推 31噓
- 〔記者徐子苓/台北報導〕中國DeepSeek開發的AI大模型引發用戶資料被「送中」的安全 疑慮,美國海軍率先開出第一槍,要求其成員不得下載DeepSeek;我國數位發展部今天也 表示,DeepSee …85F 36推 15噓
- 27F 5推 12噓
點此顯示更多發文記錄
( ̄︶ ̄)b markbb01 說讚!
→
guest
回列表(←)
分享