※ 本文轉寄自 ptt.cc 更新時間: 2025-02-10 18:39:52
看板 Stock
作者 標題 [新聞] 三位臺灣AI專家發起DeepSeek R1改造計畫,要打造繁中版
時間 Mon Feb 10 14:21:23 2025
原文標題:
三位臺灣AI專家發起DeepSeek R1改造計畫,要打造繁中版開源授權的推理模型
原文連結:https://ithome.com.tw/news/167280
三位臺灣AI專家發起DeepSeek R1改造計畫,要打造繁中版開源授權的推理模型 | iThome
這項計畫將以DeepSeek R1為基礎來進行改造,透過重新訓練模型的方式,並以開源授權釋出模型權重,也就是採取開放權重的策略釋出,最後還會打造新的模型身份與品牌 ...
這項計畫將以DeepSeek R1為基礎來進行改造,透過重新訓練模型的方式,並以開源授權釋出模型權重,也就是採取開放權重的策略釋出,最後還會打造新的模型身份與品牌 ...
發布時間:2025-02-08
記者署名:王宏仁
原文內容:
OpenAI去年發表了新一代推理模型o1之後,讓眾人看到GAI開始媲美真人博士或軟體開發高手般的解題能力,掀起了新一輪的大型語言模型競賽。春節期間,以開放權重釋出的DeepSeek R1模型,大幅降低了這一波推理模型競賽的門檻,成了全球AI產業的熱門焦點,開始浮現客製化推理模型的趨勢。
臺灣也有三位AI專家,在2月7日發起了一項臺灣製造大型語言模型計畫,專案代號「自由鋼普拉」(FreedomGunpla R1),希望募資3千萬元,預計在3月底釋出第一版預覽的推理模型。
這款引起全球AI圈熱議的DeepSeek R1模型,在論文中揭露了多項媲美甚至超越OpenAI o1推理模型的能力,因為可以部署到本地端,來避免企業自己的機敏資料上傳到網路,而引起AI圈的重視,不過,R1模型簡體版用戶協議中提到自己通過三項中國AI法規的備案,也讓外界擔心這款模型生成的內容偏重於對齊中國價值。
因此,臺灣有三位不同AI領域的專家,發起了這項重新改造DeepSeek R1,來打造對齊多元價值的繁體中文版推理模型計畫「自由鋼普拉」。這三位發起人,包括了AI PM助理新創MeetAndy AI創辦人薛良斌,Taiwan LLM開發者林彥廷以及雲端遊戲軟體開發供應商Ubitus的執行長郭榮昌。
薛良斌是台灣生成式AI年會主辦人,也是知名售票平臺KKTIX和MLOps新創InfuseAI的共同創辦人,由他來負責募集這項模型改造計畫的資源。
林彥廷則是具有中文大型語言模型訓練經驗的專家,他剛結束了在Meta的實習,參與了Meta訓練Llama模型的過程。林彥廷將負責FreedomGunpla R1的模型訓練工作。而最後一位郭榮昌則擁有大規模GPU叢集管理經驗,旗下公司曾獲得Nvidia破億元投資,也擁有亞洲最大的GPU農場。郭榮昌將負責算力架構和管理。
臺灣目前也有幾款繁中版大型語言模型,主要以Meta釋出的Llama模型為基礎來客製訓練,但薛良斌認為,Llama 3模型不夠聰明,甚至用以「太笨了」來形容,他指出,如果想要打造出自主能力的AI代理,使用媲美O1等級推理能力的模型是最低標準。
這項計畫的技術重點包括了,將以DeepSeek R1為基礎來進行改造,透過重新訓練模型的方式,並以開源授權釋出模型權重,也就是採取開放權重的策略釋出,最後還會打造新的模型身份與品牌。薛良斌強調,這不只是一個技術專案,更是一項文化工程,因為這是一項多元價值觀的對齊任務。
預計分三階段來實現目標,第一階段先對齊西方價值觀,可能導致模型推理能力下滑,薛良斌評估,很高機率達成這個里程碑。第二階段再進一步讓變笨的模型變得聰明,這部分則需要投入更多資源來驗證。這項計畫的終極目標是,不論使用者用繁體中文或是英文時,這款模型的表現可以比使用簡體中文更好。
這項計畫希望募資3千萬元,將由財團法人開放文化基金會(OCF)處理募資,專款專用,透過這筆資金,希望至少可以訓練兩次模型。在時程上,初步預計2025年3月底前釋出第一版預覽模型,開始搜集早期測試者的意見回饋後快速迭代,再釋出最終的版本。
心得/評論:
有料有料
台灣軟體界的大前輩出來號召要用中文資料改進 Deepseek
這樣就對了
比起開源社群那些意識形態掛帥
Deepseek剛出來在那邊喊偷資料、繞過天安門好棒棒
台灣純軟圈大佬出來喊
那些就乖乖閉嘴了XD
可以正視 Deepseek 的實力
借力使力才是真的
開發團隊陣容也相當OK
期待成果
AI PM助理新創MeetAndy AI創辦人薛良斌
Taiwan LLM開發者林彥廷
雲端遊戲軟體開發供應商Ubitus的執行長郭榮昌(由NVIDIA投資)
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.229.57.249 (臺灣)
※ 作者: Lushen 2025-02-10 14:21:23
※ 文章代碼(AID): #1dgPhb7P (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1739168485.A.1D9.html
推 : 沒問題吧,開源本來就是給你自己玩1F 02/10 14:22
原文: https://reurl.cc/aZjjK4
推 : 怎麼可以依賴中國?!我們要自立自強啊!2F 02/10 14:22
推 : 真香.jpg3F 02/10 14:23
噓 : 中共同路人4F 02/10 14:23
推 : 推推 中共同路人站出來5F 02/10 14:24
→ : 有資源都可以玩啊6F 02/10 14:24
推 : 抄台灣凸面的對岸政府是不是都是台獨同路人 白O7F 02/10 14:24
→ : 圖面
→ : 圖面
推 : 小心等等就要被出征了9F 02/10 14:25
→ diefishfish …
推 : 感覺會被出征11F 02/10 14:25
→ diefishfish …
推 : 完了要被吊路燈了13F 02/10 14:25
推 : 募資白嫖 台灣人真好騙14F 02/10 14:25
推 : 青鳥怎麼不快出征啊 用對岸的東西還敢募資(咦?)15F 02/10 14:25
推 : 所以就是用簡中會變笨的模型嘛 防偷神器XDDD16F 02/10 14:26
→ : 再套一件衣服就有3000萬17F 02/10 14:26
→ : 專家?有比鳥群懂嗎18F 02/10 14:26
噓 : 難怪賴皇300億預算可以搞ai 原來是要當中共同路人19F 02/10 14:26
推 : 現在打者民主自由的標語我都會怕...20F 02/10 14:26
噓 : 這三位有脆鳥跟點麵線部長懂AI嗎?21F 02/10 14:26
推 : 很好啊 開源的用爆就對了22F 02/10 14:27
→ : 數發部震怒23F 02/10 14:27
→ : 專案名稱中二到有剩24F 02/10 14:27
→ : 台灣真的要加緊腳步了。AI基礎建設硬體供應鍊在台25F 02/10 14:27
→ : 灣已經是很大的優勢,軟體方面則尚未成火候,硬體
→ : 灣已經是很大的優勢,軟體方面則尚未成火候,硬體
→ : 還要募資 真可憐……27F 02/10 14:27
→ : 主要是企業自己拼的。政府要多重視軟體這一塊。28F 02/10 14:27
噓 : 不就拿人家開源下去改,然後說是原創的,要花幾百E29F 02/10 14:27
推 : 哈哈哈 股版的反中假專家還唱衰DS那麼久30F 02/10 14:27
→ : 管他中國還北韓做的,能用最大,傻了才在政治腦31F 02/10 14:27
→ : 摳憐吶32F 02/10 14:28
推 : 別玩抄襲別人啊33F 02/10 14:28
推 : 本來就是 白癡到極點 股票多好賺還要當工讀生34F 02/10 14:28
推 : 又要花錢做垃圾了35F 02/10 14:28
推 : 剛普啦XDDDD36F 02/10 14:28
→ : 募資然後簡轉繁37F 02/10 14:29
推 : 三千萬不如無腦買台積38F 02/10 14:29
推 : 發展Deepfake 嗎?39F 02/10 14:29
※ 編輯: Lushen (36.229.57.249 臺灣), 02/10/2025 14:30:40推 : 抄40F 02/10 14:31
→ : 套皮要3000萬?41F 02/10 14:31
推 : 會不會會第二版叫正義鋼普拉 這三個都SEED 迷嗎?=.42F 02/10 14:31
→ : =
→ : =
推 : 點麵線部長:我才是專家44F 02/10 14:31
推 : 軟硬體,中共國早就超越台灣了45F 02/10 14:31
推 : 說好的抄襲呢46F 02/10 14:31
推 : 快抄吧 在不抄連搶椅子上桌的資格都沒有 不要被那群47F 02/10 14:32
→ : 垃圾的意識形態綁住
→ : 垃圾的意識形態綁住
→ : 一起抄起來49F 02/10 14:32
→ : 去麥當勞找老人募資應該可以50F 02/10 14:32
→ : 蒸餾計劃51F 02/10 14:32
→ : 蒸丸了,要成為青鳥啄食的目標52F 02/10 14:33
→ : 這個需要預算處理53F 02/10 14:33
噓 : 套皮還要募資白嫖??54F 02/10 14:33
推 : 抓到了 中共同路人55F 02/10 14:33
推 : 拿開源去改的專家56F 02/10 14:33
→ : 左岸的來改好意思?57F 02/10 14:33
→ : 做成功了放在自己的計畫上58F 02/10 14:33
→ : 失敗了反正也不是花自己的錢??
→ : 失敗了反正也不是花自己的錢??
推 : 加油,希望真的弄出來,不然會被鄉民笑的喔60F 02/10 14:34
→ : 你說成立公司,大家有股份也就算了61F 02/10 14:34
推 : 不會自己出錢還在那邊圈錢....62F 02/10 14:34
→ : 這個募資真的好笑63F 02/10 14:34
→ : 自己要做實驗還要到市場圈錢 真的笑死64F 02/10 14:34
推 : 好球福利蛋65F 02/10 14:34
推 : 重新定義抄襲66F 02/10 14:35
推 : 拿開源的來改還要募資 是在搞笑嗎67F 02/10 14:35
推 : 沒有台灣價值!全面抵制CC68F 02/10 14:36
推 : 人家是星際之門 我們是門都沒有69F 02/10 14:36
推 : 抄作業前 你要先看懂作業內容阿.................70F 02/10 14:37
推 : 自由鋼彈XD71F 02/10 14:37
→ : 有本事就改出來賣!還募股是殺小XD72F 02/10 14:37
推 : 又在抄 然後換個皮就變成民主AI 太舒服了73F 02/10 14:38
→ : 黃仁勳發大財74F 02/10 14:38
推 : 先罵完再拿來募資 自助餐好吃75F 02/10 14:38
推 : Dotline NOODLES SYSTEM?76F 02/10 14:38
噓 : 肛噗拉?77F 02/10 14:40
→ : 還不快基處健設,多買ㄧ點自己的GPU78F 02/10 14:40
推 : 有問過我們創世神跟添財少女(?)嗎79F 02/10 14:40
→ kimula01 …
→ : 大佛普拉絲81F 02/10 14:41
推 : 簡轉繁的笑話,要再一次嗎?82F 02/10 14:41
推 : 種命 FREEDOM vs JUSTICE?83F 02/10 14:41
推 : .......84F 02/10 14:42
推 : chatdpp....85F 02/10 14:42
→ : 改造 (致敬86F 02/10 14:42
推 : 加個自由就要募3千萬87F 02/10 14:42
→ : 怎麼不去用llama呢,嘻嘻88F 02/10 14:42
推 : 募資 恩89F 02/10 14:43
推 : 感覺就是要斂財 cc90F 02/10 14:43
推 : 加油吧91F 02/10 14:44
→ : 這個感覺沒什麼用,等你募資好弄好,人家又換代了92F 02/10 14:44
→ : ,誰還用你的舊東西
→ : ,誰還用你的舊東西
→ : 講ㄧ下要用多少GPU?94F 02/10 14:44
推 : 直接複製來用喔?可悲95F 02/10 14:45
→ : 開源啊.我就投96F 02/10 14:45
→ : 為什麼要這麼多錢啊?李飛飛50鎂耶?97F 02/10 14:45
推 : Gunpla?你取名字前有先問過萬代嗎98F 02/10 14:45
推 : 這個年頭還有誰不是AI專家的嗎99F 02/10 14:45
→ : 這三個人隨便一個身價都不知道是3000的幾倍 3000還100F 02/10 14:46
→ : 要發募資新聞 自己完全不想拿錢嗎?
→ : 要發募資新聞 自己完全不想拿錢嗎?
推 : 盜版?102F 02/10 14:46
→ : 二次蒸餾?103F 02/10 14:47
推 : 大家對專案名稱的自由也不用太在意 這很明顯就鋼彈S104F 02/10 14:47
→ : EED 粉 XD
→ : EED 粉 XD
推 : 我的Ai叫紅色有角渣古106F 02/10 14:50
推 : 數發部兩百億預算都不幹了,你三千萬是一人一千萬107F 02/10 14:51
→ : 嗎?
→ : 嗎?
噓 : 點麵線:109F 02/10 14:51
推 : 蒸餾你的蒸餾110F 02/10 14:52
推 : 沒找唐鳳 跟我說專家? 我不信111F 02/10 14:52
→ : 不過還是支持啦 加油
→ : 不過還是支持啦 加油
→ : 會被萬代告嗎114F 02/10 14:54
噓 : 又想騙錢?115F 02/10 14:54
噓 : 可悲116F 02/10 14:54
推 : 開源的不用要幹嘛 就像參考書一樣117F 02/10 14:54
推 : Meta 實習 vs AI教母118F 02/10 14:56
推 : 第五縱隊119F 02/10 14:58
噓 : 請大家注意政治推文,避免被釣魚120F 02/10 14:59
推 : AI都爛大街了 學李飛飛蒸餾的就好 50鎂 不能再多了121F 02/10 15:00
→ : 以後花超過50鎂 都算智商稅
→ : 以後花超過50鎂 都算智商稅
推 : 這不是粉不粉的問題,Gunpla是有商標註冊的123F 02/10 15:01
推 : 募資呵呵124F 02/10 15:02
→ : 自由鋼彈模型XD 專家是鋼彈迷喔125F 02/10 15:03
→ : 怎沒找我們鳳哥 繞過去大師126F 02/10 15:03
噓 : 很有斂財的味道127F 02/10 15:04
推 : 這是一種NTR嗎?128F 02/10 15:04
推 : 典型詐騙129F 02/10 15:06
推 : 未看先猜R2名字叫正義鋼普拉130F 02/10 15:06
→ : 商標問題不說 pla…131F 02/10 15:07
推 : Nchc應該要給錢132F 02/10 15:08
推 : 請給我黃金133F 02/10 15:08
噓 : 當我們鬼島AI大師唐鳳塑膠逆134F 02/10 15:08
推 : AI現在就是低端 白菜價135F 02/10 15:09
→ : 青鳥:怎麼可以用中國開發的136F 02/10 15:09
推 : 麵線加強版137F 02/10 15:09
推 : 很可以啊,樂見其成138F 02/10 15:10
推 : 連這一點錢都沒有做啥ai139F 02/10 15:11
推 : 數位部:140F 02/10 15:13
推 : 中共同路人 這樣沒有國安問題嗎141F 02/10 15:13
→ : 又來騙錢了,三千萬,連一個8卡 AI server都買不起142F 02/10 15:14
→ : 。
→ : 。
推 : 天才科技大臣在幹嘛??144F 02/10 15:14
推 : 盜版的盜版145F 02/10 15:15
推 : 趕快跟中國合作才是正解 脱離美國魔爪146F 02/10 15:15
推 : 跟中國合作是請鬼拿藥單吧XD147F 02/10 15:16
推 : 盲猜就是拿deepseek來蒸餾另一個開源模型。台灣沒能148F 02/10 15:17
→ : 力自己搞一個新算法的高效模型出來
→ : 力自己搞一個新算法的高效模型出來
推 : 補上天安門那一塊150F 02/10 15:19
→ : 比原版更完整
→ : 比原版更完整
噓 : 笑死152F 02/10 15:20
推 : 才3000萬是準備做繁中翻譯嗎153F 02/10 15:20
推 : 拿免費開源的東西來募資是可以的嗎?154F 02/10 15:20
→ : 我猜做出來就是能問64這樣吧155F 02/10 15:20
推 : 推推,這才是有料的156F 02/10 15:22
→ : 圈錢規模太小了吧? 先叫老黃留一些貨給我們啊157F 02/10 15:22
推 : Llama-3-Taiwan 還不錯158F 02/10 15:23
噓 : 靠北 chatdpp我真的會笑死159F 02/10 15:25
噓 : 別怕..咱麼民進黨有天才唐鳳160F 02/10 15:25
推 : 點麵線APP下去改不行嗎 就一定要用中國貨???161F 02/10 15:27
推 : 哄堂大笑162F 02/10 15:29
推 : 所以台灣自己做不出來?163F 02/10 15:33
推 : 改名字,就想收錢??164F 02/10 15:34
推 : 要錢的都搞笑165F 02/10 15:35
→ : 台灣有免費的,提計畫就好
→ : 台灣有免費的,提計畫就好
噓 : 站在巨人上的肩膀看事情啊 哈 嚼氰快出征阿167F 02/10 15:35
→ : ......台灣AI專家 ... 這背景有夠好笑168F 02/10 15:36
推 : 唐老大一下就做好了 不需要169F 02/10 15:39
推 : 我蒸餾你的蒸餾170F 02/10 15:41
推 : 這會是所謂的主權AI嗎 ?171F 02/10 15:42
推 : 很好啊不然難道台灣軟體業要一直爛下去嗎173F 02/10 15:45
→ : 開源就是百家齊放,誰能做到標竿才厲害174F 02/10 15:47
→ : 不是一味的全面反對,還能創造更多機會
→ : 不是一味的全面反對,還能創造更多機會
推 : ncc 上路了176F 02/10 15:49
推 : 沒有天才挨踢大臣 我不信177F 02/10 15:51
噓 : 先檢查有沒有後門吧!不要到時候機密都外洩了178F 02/10 15:52
噓 : 領預算囉179F 02/10 15:55
→ : 中共同路人,哈哈哈哈180F 02/10 15:59
推 : 募資? 笑死人181F 02/10 15:59
推 : 聽都沒聽過的 AI 專家 =.=182F 02/10 16:09
噓 : 中共同路人出來罵183F 02/10 16:10
→ : 現在連玩別人訓練好開源出來的模型都能發新聞稿了啊184F 02/10 16:11
→ : …
→ : …
推 : 台獨同路人吧,到時候中共價值都被洗成台獨186F 02/10 16:15
噓 : 笑死 下個指令給DS說要繁體中文要花三千萬187F 02/10 16:23
→ : 他們根本不用訓練,我用DS都繁體中文阿
→ : 還有人附和這些人 真笑死人
→ : 不要到時候被挖出來是串DS API 呵呵
→ : 他們根本不用訓練,我用DS都繁體中文阿
→ : 還有人附和這些人 真笑死人
→ : 不要到時候被挖出來是串DS API 呵呵
噓 : 還蒸餾勒 等等就只是繁中化而已191F 02/10 16:27
→ : 台灣政府最早和nvidia合作192F 02/10 16:35
→ : 有一台 台灣1號
→ : 有一台 台灣1號
推 : 這是不是詐騙阿194F 02/10 16:38
推 : Taipei-1 所有人提計畫都能使用195F 02/10 16:42
推 : 剛好一人分一千196F 02/10 16:43
推 : taipei-1 算力 22PFlop197F 02/10 16:44
→ : 建議找真的在跑大模型的
推 : taipei-1. 64片h100
→ : 建議找真的在跑大模型的
推 : taipei-1. 64片h100
推 : 3000萬!美股完蛋了200F 02/10 16:49
推 : 低預算 大概就是5B,50B 的參數吧201F 02/10 16:50
噓 : 3000萬改造DeepSeek,嗯哼~202F 02/10 16:50
噓 : 嗯203F 02/10 16:56
→ : 台灣真的越來越像當年鄙視的幹話國204F 02/10 16:57
推 : 之前勞動部分署長因為要搞低預算,霸凌搞死一個公205F 02/10 17:02
→ : 務員....
→ : 務員....
推 : 改造大陸AI?是不是串共?207F 02/10 17:03
推 : 建議先用 taipei-1 跑一款出來再改208F 02/10 17:07
→ : taipei-1 只能學術用 改完就能商用了
→ : taipei-1 只能學術用 改完就能商用了
噓 : 跑屁跑啊 DS就有繁體中文阿 笑死210F 02/10 17:10
→ : 宣傳比較強的中國211F 02/10 17:18
噓 : 可悲212F 02/10 17:21
推 : 真香.jpg213F 02/10 17:24
噓 : 又專家214F 02/10 17:33
推 : 我怕,台灣只會大外宣,拿錢不辦事的募資平台專案多215F 02/10 17:53
→ : 了是,勿忘台版黑鯊5
→ : 了是,勿忘台版黑鯊5
推 : 代號 大和煌嗎217F 02/10 18:11
--
※ 看板: Stock 文章推薦值: 0 目前人氣: 0 累積人氣: 68
作者 Lushen 的最新發文:
- 24F 10推
- 18F 12推 1噓
- 114F 29推 31噓
- 〔記者徐子苓/台北報導〕中國DeepSeek開發的AI大模型引發用戶資料被「送中」的安全 疑慮,美國海軍率先開出第一槍,要求其成員不得下載DeepSeek;我國數位發展部今天也 表示,DeepSee …85F 36推 15噓
- 27F 5推 12噓
點此顯示更多發文記錄
1樓 時間: 2025-02-10 21:09:46 (台灣)
→
12 小時以前 TW
看來設備很閒喔! 應該拿自己的資源下去改良後去訓練模型!! 模型比別人好自然有人投資! 不過這批人真的有能力改演算法?
→
guest
回列表(←)
分享