※ 本文轉寄自 ptt.cc 更新時間: 2025-03-06 23:39:31
看板 Stock
作者 標題 [新聞] 阿里發布新開源模型 家用顯卡就能跑
時間 Thu Mar 6 21:01:52 2025
原文標題:DeepSeek有勁敵!阿里發布新開源模型 家用顯卡就能跑
原文連結:https://udn.com/news/story/7333/8590256?from=udn-catebreaknews_ch2
發布時間:2025-03-06 14:25
記者署名:聯合報/ 記者陳湘瑾
原文內容:
阿里巴巴AI To C業務旗下AI應用「阿里通義」在6日正式發布最新的開源推理模型通義千
問QwQ-32B,其官方介紹稱,透過大規模強化學習,千問QwQ-32B在數學、代碼及通用能力
上進步飛躍,整體性能比肩DeepSeek-R1,同時大幅降低部署使用成本,在消費級顯卡上
能實現本地部署。
問QwQ-32B,其官方介紹稱,透過大規模強化學習,千問QwQ-32B在數學、代碼及通用能力
上進步飛躍,整體性能比肩DeepSeek-R1,同時大幅降低部署使用成本,在消費級顯卡上
能實現本地部署。
使用者已可免費下載及商用QwQ-32B模型,或透過網頁版Qwen Chat體驗,該模型也將免費
上架通義App。
阿里通義團隊表示,QwQ-32B模型針對數學和編程任務、通用能力分別進行2輪大規模強化
學習,在32B的模型尺寸上獲得推理能力提升,印證了大規模強化學習(Reinforcement
Learning,一種機器學習技術)可顯著提高模型性能。
該團隊指,千問QwQ-32B能提供極強的推理能力,以及滿足更低的資源消耗需求,背後關
鍵在於強化學習。該團隊表示,希望能夠證明強大的基礎模型疊加大規模強化學習,也許
是一條通往通用人工智能(AGI)的可行之路。
鍵在於強化學習。該團隊表示,希望能夠證明強大的基礎模型疊加大規模強化學習,也許
是一條通往通用人工智能(AGI)的可行之路。
此外,QwQ-32B模型中還集成了與智能體(AI Agent,指的是能夠自主做出決策、完成行
動,且毋需人類介入的人工智慧)相關的能力,能在使用工具的同時進行批判性思考,以
及根據環境回饋調整推理過程。
動,且毋需人類介入的人工智慧)相關的能力,能在使用工具的同時進行批判性思考,以
及根據環境回饋調整推理過程。
受此消息影響,6日阿里巴巴集團港股早盤大幅高開漲逾6%,截至午盤漲逾7%。
心得/評論:
原來今天阿里巴巴是在漲這個
看來DS確實帶動了AI走出了不同的局面與蓬勃發展
同時也帶動了港股與其他科技類股不小的漲幅
00753跟00752今天也幾乎要收復去年十月開始的跌幅了
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.167.19.153 (臺灣)
※ 作者: nisi0773 2025-03-06 21:01:52
※ 文章代碼(AID): #1doPp5hO (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1741266117.A.AD8.html
推 : 40大盜1F 03/06 21:02
→ : 我蒸餾別人蒸餾你的蒸餾2F 03/06 21:03
推 : 蛤今天在漲這個?3F 03/06 21:03
推 : 賣杈,我的模型用內顯就可以跑啦4F 03/06 21:03
推 : 接下來還要觀察manus ai agent正式推出的時候到底付5F 03/06 21:06
→ : 費方案跟效用有沒有像它展示的那麼炫炮了
→ : 費方案跟效用有沒有像它展示的那麼炫炮了
推 : 也太卷了吧 太扯!7F 03/06 21:09
推 : 過幾天就會研發出用3.5磁片運作的ai,不要不信8F 03/06 21:13
→ : QwQ 這表情是邊哭邊發抖嗎?9F 03/06 21:14
推 : 內卷AI, 馬上改玩邊緣10F 03/06 21:17
→ : 老黃gg11F 03/06 21:18
→ : 以後會不會內顯就跑的動
→ : 以後會不會內顯就跑的動
→ : QwQ13F 03/06 21:19
推 : 雖然慢 但台幣8000就能跑14F 03/06 21:24
推 : 阿里都不知道漲多少15F 03/06 21:28
→ : CUDA被攻破遲早的事情16F 03/06 21:29
→ kimula01 …
推 : qwen有些模型真的不錯18F 03/06 21:30
→ : 中文側的使用者用起來比LLama好用多了
→ : 中文側的使用者用起來比LLama好用多了
→ : Nvidia BBQ了20F 03/06 21:38
推 : CUDA一座城池 攻破難, 繞過去就好21F 03/06 21:40
→ : 能跑是能跑但是多久才跑完22F 03/06 21:40
→ : 被逼上絕路才會激發潛力23F 03/06 21:41
推 : 阿里阿多24F 03/06 21:41
推 : 跑本來就什麼都能跑 效率問題而已 當初挖BTC不用gp25F 03/06 21:49
→ : u用cpu也行 只是別人一天相當你跑一個月
→ : u用cpu也行 只是別人一天相當你跑一個月
→ : 馬其頓防線直接被繞阿登森林?27F 03/06 21:50
推 : 好強28F 03/06 21:55
推 : 顯卡娘!29F 03/06 21:56
→ : PC DIY仔丸子30F 03/06 22:02
→ : No on car ,DS是欽定的31F 03/06 22:05
推 : 還不是要買nv32F 03/06 22:08
→ : 你好,我是阿里的爸爸,阿里巴巴33F 03/06 22:18
推 : 我的模型用電子鍋就可以運行了34F 03/06 22:22
推 : 5070也要買不到了嗎35F 03/06 22:34
→ : 矩陣運算就是這麼多資料要過,家用顯卡記憶體夠?4k36F 03/06 22:37
→ : 影片用480就能放?這什麼壓縮技術?
→ : 影片用480就能放?這什麼壓縮技術?
推 : 馬董真會通用化38F 03/06 22:53
--
※ 看板: Stock 文章推薦值: 0 目前人氣: 0 累積人氣: 30
作者 nisi0773 的最新發文:
- 阿里巴巴AI To C業務旗下AI應用「阿里通義」在6日正式發布最新的開源推理模型通義千 問QwQ-32B,其官方介紹稱,透過大規模強化學習,千問QwQ-32B在數學、代碼及通用能力 上進步飛躍,整體 …38F 20推
- 美國AI類股三日普遍收黑,但輝達重挫近百分之九,股價下探至六個月低點,反映輝達面 臨的問題讓投資人憂心不已。 輝達股價三日收在每股一一四點○六美元,單日市值蒸發二六五○億美元,市值已跌破三 兆美元,目 …87F 55推 10噓
- 6F 3推 2噓
- 延續上個交易日的漲勢,周一(3日)美股開高。在美國總統川普宣布5種加密貨幣為戰略 儲備之後,比特幣與相關概念股大漲,但隨著美國對墨西哥與加拿大徵收關稅的最後期限 逼近,關稅緊張局勢加劇,市場不確定性攀 …34F 22推
- 24F 17推
點此顯示更多發文記錄
→
guest
回列表(←)
分享