回上層
Disp BBS
作者:
DaOppaiLoli
(大歐派蘿莉) 在 PTT 的推文記錄
※ 選擇年份:
所有年份(1)
2023年(1)
※ 選擇看板:
所有看板(222)
C_Chat(96)
LoL(87)
Military(19)
DIABLO(8)
HatePolitics(4)
kartrider(3)
Gossiping(2)
Soft_Job(1)
TY_Research(1)
Hip-Hop(1)
在Soft_Job板第1篇
+52
Re: [討論] 中研院繁中LLM被爆直接拿對岸的來套 - Soft_Job 板
作者:
DrTech
(竹科管理處網軍研發人員)
42.72.54.199
(台灣)
2023-10-09 14:53:30
推
DaOppaiLoli
: 台智雲那段我想提醒一下,一開始他們是用 BLOOM 176B 下去訓練,當時(推測是二月開始訓練) QLoRA 即使還沒出來。雖然 BLOOM 架構與 Llama 架構差滿多的,但我想 AFS 訓練千億級參數量模型的能力應該還是有的。只是說台智雲這個系列的模型是閉源的,所以也
65F 10-09 22:58
… 共有 15 則推文
,
點此顯示
所有年份(1)
2023年(1)
點此顯示發文記錄