看板 Stock作者 messi5566 (虹粉)標題 [新聞] DeepSeek深夜發布新款開源AI模型時間 Tue Jan 28 03:47:28 2025
原文標題:
DeepSeek深夜發布新款開源AI模型Janus-Pro
原文連結:
https://news.cnyes.com/news/id/5847178
發布時間:
2025-01-28 01:51
記者署名:
羅昀玫
原文內容:
DeepSeek 週二 (28 日) 發布開源多模態人工智慧 (AI) 模型 Janus-Pro,其中
Janus-Pro-7B 在 GenEval 和 DPG-Bench 基準測試中打敗 OpenAI 的 DALL-E 3 和
Stable Diffusion。
DeepSeek 團隊正式發表兩款多模態框架,即 Janus-Pro 和 JanusFlow。
(圖片:蘋果)
(圖片:DeepSeek 專家)
Janus-Pro 是一款統一多模態理解與生成的創新框架,透過去耦合視覺編碼的方式,大幅
提升了模型在不同任務中的適配性與表現。
JanusFlow 是一款透過生成流 (Rectified Flow) 與自迴歸語言模型融合實現統一的框架
,不僅在理解任務中表現優異,還能製作高品質影像,同時展現框架設計的極簡與強大。
其優異表現顯示,Janus-Pro-7B 在人工智慧任務中具有競爭優勢,這可能會影響該領域
未來的研發方向。
隨著科技業努力應對 Janus-Pro-7B 的推出及其影響,現在市場高度關注在其他公司將如
何應對 DeepSeek 的挑戰。
AI 觀察家 Rowan Cheung 表示,DeepSeek 的新模型可以為人工智慧效能設定新標準。
AI 戰局正迅速變化,競爭可能會更加劇,新模式的出現,會導致進一步的創新,並可能
導致更多的市場波動。AI 寵兒輝達 (NVDA-US) 在美股週一午盤時段暴跌超過 17%。
心得/評論:
github
https://github.com/deepseek-ai/Janus
https://arxiv.org/abs/2410.13848
github與論文
解決了多模態模型中,視覺理解與生成之間的衝突
去年已經發布過1.3B的模型,就有不少人覺得在理解prompt和圖片辨識方面很有潛力
現在最新的pro 7b還有待測試
不知道對市場的影響如何,但openai的dalle本來就蠻爛的
--
https://i.imgur.com/DDUQjOU.jpeg
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.233.141.114 (臺灣)
※ 作者: messi5566 2025-01-28 03:47:28
※ 文章代碼(AID): #1db-BLL3 (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1738007253.A.543.html
※ 同主題文章:
[新聞] DeepSeek深夜發布新款開源AI模型
01-28 03:47 messi5566
推 hkcdc: 補刀?2F 01/28 03:48
→ IBIZA: 論文有提供基於GenEval跟DPG-Bench的測試5F 01/28 03:50
推 Eshia: 熔斷就在今晚!!! NV AVGO TSM 三兄弟一起下去!!!12F 01/28 03:57
→ IBIZA: 應用AI我都不知道在跌什麼 還很多跌5%的25F 01/28 04:10
推 Diesigy: 費半-10% 精彩精彩26F 01/28 04:10
推 JMSDF: 只能說 這就是開源的可怕 open-ai準備被打到掛29F 01/28 04:12
推 ck6m454: 納指3% 費半9% 知道問題是誰了吧30F 01/28 04:12
推 w60904max: 應用AI 暫時也很慘 除非像蘋果品牌護城河32F 01/28 04:12
推 bj45566: @gn02118620:你這樣講也有道理,這個時間點有些太巧合了,而且 DS 顯然不只儲備一波衝擊33F 01/28 04:14
推 bior1234: 沒有跟SD3.5 Large對比有點避鋒芒的感覺39F 01/28 04:16
→ bior1234: 而且SD3 Medium才2B參數 相比LLM的表現,生圖方面就沒那麼驚艷了43F 01/28 04:18
推 wzshi: 完了45F 01/28 04:25
推 bj45566: 為了做精準的時間點連續攻擊,就算沒那麼驚艷只要能拿上檯面的東西就先丟出來再說吧... 我猜...50F 01/28 04:34
→ bj45566: 反正攻擊重點都是打破你拼命兜售的金鏟子神話53F 01/28 04:35
推 cleanx: 台積電這次會跌破813嗎?55F 01/28 04:43
推 love80: 深層政府送給川普的上任禮物,劇本都寫好了,一步一步進行57F 01/28 04:45
推 sqt: 美股大跌就雙王: NV和TSM.都是黃皮猴公司
對川皇而言是外國企業.盡量殺沒差.主持人FB還猛漲62F 01/28 04:53
推 bj45566: 真的好笑 XDDDDDDD 不過現實是 DS 發表的論文還是用英文寫、還是放在 arXiv 讓人下載啊64F 01/28 04:56
推 sqt: 好奇Himx.US(奇景)跌快30%卻沒人討論?66F 01/28 04:57
推 w60904max: deepseek 聯網陰陽怪氣時事 超強的 海放其他家67F 01/28 04:58
推 BRIANERIC2: 會不會是因為中文本身很強,所以表達海放美國?
算法最後跟文組的邏輯有關係嗎...68F 01/28 04:59
推 sqt: 川皇就職與會的各企業大咖.可能全認為NV漲太高70F 01/28 05:01
→ sqt: 然後聯合(含川皇?)放空那不被邀請的黃皮衣客?72F 01/28 05:03
推 bunjie: 繼續看下去75F 01/28 05:09
推 Skydier: 這波如果鏟子賣得速度變慢 準備看MU回7076F 01/28 05:11
推 fgkor123: 科展股點槓精沒出現了,好懷念78F 01/28 05:15
→ fgkor123: 躲個三個月應該可以回來喊鏟子必勝。.。80F 01/28 05:18
推 bj45566: 科展股點槓精真的讓人莫名懷念 wwww 昨天義正詞嚴咄咄逼人到五分鐘之內就連續問了至少十次股點在哪裏,笑死81F 01/28 05:21
推 sqt: NV不到1年半從108漲約15倍到1531.太高該跌了84F 01/28 05:22
推 ketter: 搞半天美股只是找個理由小修正而已
看科技大佬沒人出來講話就知道中國搞笑了
當初韓國超導體也是有提供給大家製作方法85F 01/28 05:25
推 bj45566: 有人好像不知道連 Nature 都已經為 DS 寫了一篇專欄?阿祖和黃董都跳出了喊話穩定軍心了 wwww88F 01/28 05:28
推 kohonen: 圖像生成模型對nvidia應該是利多吧!91F 01/28 05:29
推 qtzbbztq: 鬼故事連發 本來可以見證台股跌停的 有夠會躲92F 01/28 05:29
推 bj45566: 韓國超導體事件 Nature 從頭到尾理都不理93F 01/28 05:30
推 ksjr: 我記得nature有寫篇blog解說韓國超導體怎麼被破解的95F 01/28 05:32
→ ev331: 夭壽99F 01/28 05:37
推 bike3905: @bj45566 台灣真的沒有很強的CS/EE女生 對岸和歐美有342F 01/28 11:27
--