作者:
icrose (人本良心)
223.89.14.114 (中國)
2025-01-30 09:08:09 → linzero: AI應用應該還有很多領域還沒完善,還是有砸錢搞算力的需求吧,不過可能語言這部分會降低需求
而且應用落實後,研發可能需求降低,但應用方面需求也可能會更多 48F 01-30 12:03
作者:
Lushen (pttlushen)
36.229.38.139 (台灣)
2025-01-30 08:59:21 → linzero: 之前有人就在猜這些大廠已經在用自家大型模型來訓練小型模型來直接應用獲利 109F 01-30 12:00
作者:
chordate (にんきもの)
114.32.7.252 (台灣)
2025-01-30 00:35:32 → linzero: 跑正式程序總是要明確詢問跟應答吧 11F 01-30 00:41
作者:
IBIZA (溫一壺月光作酒)
1.169.68.61 (台灣)
2025-01-29 23:20:33 → linzero: 估狗到有針對一般蒸餾法做改良的,可以用更少的資料達到舊有的蒸餾效果,像google有開發個DistillingStep-by-Step技術 35F 01-29 23:42
→ linzero: 那所謂80%,照我的閱讀理解,應該不是指相較傳統蒸餾可以減少的工作量,只能看有無專業的能解釋一下吧 43F 01-29 23:51
作者:
mangle (mangle123)
118.161.216.24 (台灣)
2025-01-29 22:38:47 → linzero: 自家的東西條款就想怎麼做就怎麼做。不過上法院怎麼判可能會有所不同 34F 01-29 22:47
作者:
andy3021515 (上車請先戴好口罩再上)
106.64.82.233 (台灣)
2025-01-29 21:37:22 → linzero: 告不告的贏是一回事,跟金主跟政府表示砸錢買卡搞算力並不是在浪費錢是另一回事 117F 01-29 22:11
→ linzero: 有些人說DS蒸餾GPT是基於GPT是較全面的大模型,而DS 182F 01-29 22:21
→ linzero: 是有分主題類別的專家系統,相對是較小的模型 189F 01-29 22:22
→ linzero: 用蒸餾訓練等大的模型,研究表明是會逐漸劣化。但訓 205F 01-29 22:24
… 共有 17 則推文,點此顯示
作者:
ng101281 49.215.56.15 (台灣)
2025-01-29 21:03:16 → linzero: 可能也知道也可能告不贏或者告了也不能怎樣,但也算一種表態、證明 29F 01-29 21:19
→ linzero: 以前好像就有人翻譯用蒸餾了 35F 01-29 21:22
→ linzero: 使用蒸餾的情況跟AI未經授權抓資料來訓練不一樣吧? 72F 01-29 21:33
→ linzero: 證明是蒸餾的話,可以說這種模式本就會省時省力,就 91F 01-29 21:37
… 共有 9 則推文,點此顯示
作者:
ll6a (老成a~)
27.51.105.165 (台灣)
2025-01-29 19:21:13 → linzero: 要純種的嗎? 6F 01-29 20:35
作者:
lonzoball02 (東南亞廢文肥宅)
27.240.128.65 (台灣)
2025-01-29 19:21:12 → linzero: 要打壓不是沒如當初預期的發展後會一起遵守遊戲規則來一起玩嗎? 45F 01-29 20:36
→ linzero: 或者說不想遵守歐美一起制定的規則而想自己制定或 49F 01-29 20:38
→ linzero: 硬碟商希捷就因被查稅搞到而開始退出中國的產線吧, 70F 01-29 21:58
… 共有 6 則推文,點此顯示
作者:
gn02118620 (Howard)
1.200.7.21 (台灣)
2025-01-29 17:42:49 → linzero: 閉源好像也可以用蒸餾等方式抓出內部資料參數 4F 01-29 17:46
作者:
a0808996 (dammmmm)
123.194.128.122 (台灣)
2025-01-29 17:18:31 → linzero: 自駕這種目前還沒完善吧,應該還有其他領用的AI應用還有待砸錢硬幹 1F 01-29 17:20
→ linzero: 像翻譯看過一些成果,感覺還是有待加強 5F 01-29 17:21