※ 本文轉寄自 ptt.cc 更新時間: 2025-02-01 23:42:27
看板 C_Chat
作者 標題 Re: [閒聊] DeepSeek是不是真的很強?
時間 Sat Feb 1 20:08:19 2025
說回來
感覺很多人很氣訓練用別人資源
但是感覺又對openAI沒反應
我覺得這就很奇怪
因為OpenAI最知名的一個點
就是因為盜用別人資料訓練所以官司纏身
這幾年可非常多新聞
但很妙的似乎有人看到DeepSeek才開始氣到中風
這種現象真的很神奇
真的要氣 打從前幾年就要一直罵OpenAI了吧?
甚至整個生成式AI都要全罵了
因為根本沒有幾家是拿到全部授權才訓練的
幾乎每家的產品都踩到「未經授權」這個大問題了
要生氣 應該打從這波AI浪潮一開始
就一路氣瘋到現在了 中風幾十次了吧
怎麼是看到DeepSeek才突然暴跳如雷?
--
提個ACG點
鋼彈Seed裡面最後誰都在用鋼彈臉
很多根本沒得到聯邦團隊授權
但最後還是滿地的鋼彈跑
最後最強的幾台大多都是札夫特設計的
然後歐普再拿去魔改
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 39.15.0.64 (臺灣)
※ 作者: astrayzip 2025-02-01 20:08:19
※ 文章代碼(AID): #1ddWwrKr (C_Chat)
※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1738411701.A.535.html
推 : 回文我記得不用acg點1F 02/01 20:09
※ 編輯: astrayzip (39.15.0.64 臺灣), 02/01/2025 20:09:20推 : 現在ai界都覺得用網路上的資料沒關係2F 02/01 20:09
→ : 用別人訓練的東西才有關係
→ : 用別人訓練的東西才有關係
推 : 異端用基拉的戰鬥資料有經過授權嗎? 應該有4F 02/01 20:10
→ : 貓貓釣魚.jpg5F 02/01 20:10
推 : 因為法律允許小偷報警抓小偷啊呵呵7F 02/01 20:11
推 : 其實這個問題就反應了台灣這幾年根本不太重視AI吧8F 02/01 20:11
→ : 繪師早就戰爛了哪有沒戰9F 02/01 20:11
推 : 這就是繪師一直在戰的東西啊10F 02/01 20:11
但氣到中風的繪師不會突然跳出幫OpenAI唉吧XD應該是全部一起罵
畢竟OpenAI自己也是盜圖訓練的大咖啊XD
→ : 像我自己有買chatgpt 身邊朋友還是工程師的 說要11F 02/01 20:11
→ : 付費他就不用了
→ : 付費他就不用了
→ Justisaac …
→ : 然後新聞也沒在報導這塊14F 02/01 20:12
推 : 繪師就算說了不給AI用也無法阻止15F 02/01 20:12
推 : 大概...公司廚吧 (x18F 02/01 20:13
→ : 自己生的圖不能拿去訓練19F 02/01 20:13
→ : OPENAI同理
→ : OPENAI同理
→ : 畫師根本防範不了啊 現在連歌手的聲音都有辦法用 A21F 02/01 20:13
→ : I重現了
→ : I重現了
→ : 國內新聞有報阿23F 02/01 20:13
※ 編輯: astrayzip (39.15.0.64 臺灣), 02/01/2025 20:13:55→ : 像前陣子那個用陶喆年輕的唱腔 唱五百的淚橋也是爆24F 02/01 20:14
→ : 紅
→ : 紅
→ : 其實說難聽點就是因為難以維權直接變成被剝削階層26F 02/01 20:14
→ Justisaac …
→ : 製作AI的人說是因為想念陶喆嗓子還沒壞的年代才做28F 02/01 20:14
→ : 的
→ : 的
→ : 然後ai咒術師都會覺得自己才是剝削別人的那一方30F 02/01 20:14
→ : 我覺得OpenAI用版權物訓練模型合法、DS用GPT生成內容訓練也31F 02/01 20:14
→ : 根本無法舉證32F 02/01 20:15
→ : 合法啊,但雙標的人我就不懂了33F 02/01 20:15
→ Justisaac …
推 : OpenAI感覺只是想打商業戰而已,用專利侵權去卡別人的腳35F 02/01 20:15
→ : 是基本招。是不是真的能告侵權成功並不重要,是要妨礙對
→ : 手而已。
→ : 是基本招。是不是真的能告侵權成功並不重要,是要妨礙對
→ : 手而已。
→ Justisaac …
→ : 一些MOD甚至用AI模仿知名配音員的聲音40F 02/01 20:16
推 : 提起訴訟肯定是可以啦 畢竟那是公民的權利41F 02/01 20:17
推 : 民主的盜能算盜嗎42F 02/01 20:17
→ Justisaac …
→ : 違反使用者合約當然違反,但違不違法可不是合約說了算44F 02/01 20:17
→ Justisaac …
→ : 我記得都有電玩廠商禁止玩家賣二手實體片了46F 02/01 20:18
→ : 如果這社會對未來的想像就是賽博龐克那樣,openAI那麼大47F 02/01 20:18
→ : 的商業利益,感覺買兇殺人還比法律戰來得有可能
→ : 的商業利益,感覺買兇殺人還比法律戰來得有可能
→ : 民間契約 但法令要不要保護你就是另外一回事49F 02/01 20:18
推 : 直接進入2077嗎50F 02/01 20:18
→ Justisaac …
→ : 現在OPENAI要開始派人暗殺ds製作方了吧52F 02/01 20:19
推 : 也要有法可以讓你違吧,目前AI的法律有訂定出來了嗎?53F 02/01 20:19
推 : 看圖卡跟kol站隊的低認知族群的想法不用試圖去理解54F 02/01 20:19
→ Justisaac …
→ : 著作權類型的法令當然也可以去加啦56F 02/01 20:20
推 : 資安考量 滿多公司工作不給用ai滴 以後就各家公司開發自家57F 02/01 20:20
→ : ai 不然就跟大ai公司簽保密合約惹
→ : ai 不然就跟大ai公司簽保密合約惹
→ : 只是著作權法令要怎麼幫這個案例? DS做了什麼樣的事情59F 02/01 20:20
推 : 沒專利問題吧60F 02/01 20:20
→ : 會妨礙創意的發展?61F 02/01 20:20
→ : 8964占占占 deepseek快抓網路文章訓練喔62F 02/01 20:20
→ : 這跟專利肯定沒有關係啦 至少我看不太出OpenAI有什麼專利63F 02/01 20:21
→ Justisaac …
→ : 被DS侵犯了 總不會LLM變成OpenAI的專利吧65F 02/01 20:21
→ Justisaac …
推 : 中國發明=抄襲偷竊 美國發明=知識共享 懂的都懂67F 02/01 20:21
推 : chatgpt剛出來時,三星有員工把公司資料丟上去問68F 02/01 20:21
推 : 蒸餾技術是用別人的模型當老師,Open AI有規範,跟非法拿69F 02/01 20:22
→ : 資料概念不同
→ : 資料概念不同
推 : 資安考量主要是線上版問的東西都會被後面的公司看到71F 02/01 20:23
→ : 如果用本地模型應該是不會怎樣 只是目前本地版
→ : 要到線上版的程度對一般中小企業來說成本又太高
→ : 如果用本地模型應該是不會怎樣 只是目前本地版
→ : 要到線上版的程度對一般中小企業來說成本又太高
推 : 歐布才是先趨吧 想拐人啊74F 02/01 20:23
推 : 那個規範有比繪師在自己的圖上貼禁止ai學習浮水印厲害嗎75F 02/01 20:23
推 : 網路上一堆訓練集 為啥不能用==?76F 02/01 20:23
→ Justisaac …
→ : 簡單來說一個是偷書賊,一個是盜錄教學影片79F 02/01 20:25
→ : 只是偷書的話成本是降不下來的
→ : 只是偷書的話成本是降不下來的
→ : 違反使用者規範就停權跟法律懲罰還有點差距81F 02/01 20:26
推 : 他有這使用者規範的話,他如果刪除你的帳號,我覺得消保82F 02/01 20:26
推 : 著作權肯定也沒有83F 02/01 20:26
推 : 鋼彈臉應該是聯邦和歐普都有版權吧 只有扎夫特才有 不過84F 02/01 20:26
推 : DeepSeek平台的審查我記得是另外接的?85F 02/01 20:27
→ : 官拿他沒轍86F 02/01 20:27
→ : 他原始model對占占占的梗搞不好比你還熟,那還需要污染87F 02/01 20:27
推 : 現在就等開盤大媽發紅包 撿便宜233088F 02/01 20:27
→ : 違反OpenAI的政策只能BAN帳號89F 02/01 20:27
推 : 難得說人話90F 02/01 20:27
→ : 扎夫特一開始就是搶來的 沒在管版權 XD91F 02/01 20:27
→ : 因為歐噴Ai是美國的,美國爸爸不會錯92F 02/01 20:27
→ : 資安這點的話反而是開源模型優勢93F 02/01 20:28
→ : 一堆訓練包裡面都有gpt 的對話集 這也就是為什麼一堆模94F 02/01 20:28
→ : 型你問他是誰 他會直接跟你說他是chat gpt 的關係 然後
→ : openai 這一大部分都不抓 跑去抓威脅到他的 嗯…
→ : 型你問他是誰 他會直接跟你說他是chat gpt 的關係 然後
→ : openai 這一大部分都不抓 跑去抓威脅到他的 嗯…
→ : DeepSeek 會審查啥嗎?97F 02/01 20:28
→ : 審查模型都是一個模組塊 停用那個就好啦98F 02/01 20:28
推 : OpenAI今天推出o3-mini,然後通過一堆安全性檢查99F 02/01 20:29
噓 : 加工過後價值提高後歸加工人 跟另外一個直接沒授權偷100F 02/01 20:29
沒授權直接偷是這波AI浪潮全部都有的問題啊?沒有任何一家是訓練資料有全部取得授權的欸
→ : 因為蒸餾實際也很難抓,除非你自首101F 02/01 20:29
→ : 紅區測試102F 02/01 20:29
→ : 然後這也只是自稱的,因為他沒有open source
→ : DeepSeek-R1就丟在GitHub,大家都能看
→ : 然後這也只是自稱的,因為他沒有open source
→ : DeepSeek-R1就丟在GitHub,大家都能看
→ : AI不是一直在被罵嗎?105F 02/01 20:29
推 : 言論審查的是模型資料的一部份吧?106F 02/01 20:30
※ 編輯: astrayzip (39.15.0.64 臺灣), 02/01/2025 20:30:33→ : 中國製造就是DS最大原罪107F 02/01 20:31
推 : 網路爬蟲就完全沒經過人家同意阿XD108F 02/01 20:31
→ : 沒有,言論審查是模組快,離線模型沒有言論審查的109F 02/01 20:31
→ : 難不成說你沒放robot.txt就是可以讓我偷110F 02/01 20:31
→ : 其實Ai的發展跟權益問題世界各國政府早就開會討論的如111F 02/01 20:31
→ : 火如荼了
→ : 火如荼了
→ : OpenAI當初會創立的原因之一就是避免濫用113F 02/01 20:32
→ : 所以才有教你怎麼讓DS回答8964... 本機跑就可以114F 02/01 20:32
→ : 因為大家資料都是網路上沒授權就拿來餵AI115F 02/01 20:32
推 : DeepSeek官方的試用平台存在政治審查,但是可以完全關掉116F 02/01 20:32
→ : 我以為是另外串一個審查,但可能是像TheDon大說的那樣(?
→ : 我以為是另外串一個審查,但可能是像TheDon大說的那樣(?
推 : 模型是可以內建censorship的 但可以被破解 這次120F 02/01 20:34
→ : 有種可能是他的學習資料是有刻意刪除習近平啦... 這幾B的啊121F 02/01 20:34
→ : deepseek的模型有沒有被破解要看一下hugginface122F 02/01 20:34
→ : 那個是 R1 14B 的123F 02/01 20:34
→ : 我很確定他認得習近平 而且我如果攻擊習近平,這個LLM會
→ : 跟我說討論國家領導人要心存敬意
→ : 我很確定他認得習近平 而且我如果攻擊習近平,這個LLM會
→ : 跟我說討論國家領導人要心存敬意
→ : 看一下能不能改它的system prompt126F 02/01 20:36
推 : 這幾個問題我去問Phi都可以取得很正常的回答127F 02/01 20:37
推 : 怎麼現在還在討論DS禁言問題啊==128F 02/01 20:38
推 : 其實問題不是禁言,而是這反應出DS有一些語言判定上的129F 02/01 20:39
→ : 先天缺點
→ : 但很專業的用途應該是不太會受到影響
→ : 先天缺點
→ : 但很專業的用途應該是不太會受到影響
推 : 順便提一下 14B的其實不太算是deepseek v3/r1模型132F 02/01 20:40
→ : 因為有推文拿來嘴,話題就變成討論技術了w133F 02/01 20:40
→ : 那幾個小模型 是蒸餾的llama/qwen模型134F 02/01 20:41
推 : 不是一堆人退X了135F 02/01 20:41
→ : 就算如此還是能Finetune這些問題吧,只是要另外花時間136F 02/01 20:41
推 : 喔喔 了解了 這個我之前倒是沒有注意到137F 02/01 20:42
→ : 而且如果DS成本是真的這麼低,應該很快有其它模型跟上138F 02/01 20:42
→ : 唐鳳在Threads上表示,在本機離線的情況下,使用運行大型語139F 02/01 20:43
→ : 言模型的平台LM Studio操作DeepSeek,「只要用 U先輸入思考
→ : 過程和回答的前綴,再用→繼續生成回答」,就可以繞過言論審
→ : 查。
→ : 看起來有用Prompt控制輸出結果了,但就可以讓它無效
→ : 言模型的平台LM Studio操作DeepSeek,「只要用 U先輸入思考
→ : 過程和回答的前綴,再用→繼續生成回答」,就可以繞過言論審
→ : 查。
→ : 看起來有用Prompt控制輸出結果了,但就可以讓它無效
推 : 那個做法是「破解DS不能批評習大大」的過程144F 02/01 20:44
→ : 但我希望LLM本身不要有認知偏差
→ : 但我希望LLM本身不要有認知偏差
推 : 記得sam在該的時候好像是美國出版協會直接在推文下酸他146F 02/01 20:45
→ : 有什麼資格該
→ : 有什麼資格該
→ : 我倒不是太在意他不能在一個對談中迴避習近平問題148F 02/01 20:45
推 : 我覺得比較可惜的是調用api沒想像中的便宜149F 02/01 20:45
→ : 雖然是很便宜了 在openrouter上完整r1大概是4o的1/6
→ : 但我原本以為能幹到跟4o mini差不多價
→ : 然後看到b站有人在問能不能讓他不要"想"
→ : 他一堆錢都被他給"想"掉了w
→ : 雖然是很便宜了 在openrouter上完整r1大概是4o的1/6
→ : 但我原本以為能幹到跟4o mini差不多價
→ : 然後看到b站有人在問能不能讓他不要"想"
→ : 他一堆錢都被他給"想"掉了w
推 : 因為台灣其實不怎麼懂AI 只懂AI可以讓台積電乃至於台154F 02/01 20:45
→ : 廠賺大錢 股價upup 現在誰干擾到股價就是敵人 懂嗎
→ : 廠賺大錢 股價upup 現在誰干擾到股價就是敵人 懂嗎
推 : 左膠甲團體對這個就很過敏156F 02/01 20:46
推 : 沒錯,看到會一直在那邊想才能有近似的答案,不用想直接輸出157F 02/01 20:56
→ : 真的好用多了 XD
→ : 真的好用多了 XD
推 : 其實我覺得有好的開源模型gg應該要漲才對啊159F 02/01 20:56
→ : 這應該會讓更多企業有本地AI的需求讓晶片需求提升
→ : 這應該會讓更多企業有本地AI的需求讓晶片需求提升
推 : 講的好像沒戰一樣161F 02/01 20:56
推 : 行不行是拳頭大的說話162F 02/01 21:00
推 : 只要是中國,吃別人拉的屎,也會氣死,這就是台灣163F 02/01 21:01
推 : DS aka 想想164F 02/01 21:07
推 : 覺得別人沒反應是幻覺吧165F 02/01 21:07
→ : 從openai 還有那堆生成式產圖ai,都有訓練資料來源未授
→ : 權的問題,只是發展到現在如果要把這些東西一刀切,那
→ : 你可能要問還有多少蒸汽機沒砸到
→ : 從openai 還有那堆生成式產圖ai,都有訓練資料來源未授
→ : 權的問題,只是發展到現在如果要把這些東西一刀切,那
→ : 你可能要問還有多少蒸汽機沒砸到
推 : 4-11169F 02/01 21:13
推 : 畢竟很多人 非我族類170F 02/01 21:13
推 : 嘻171F 02/01 21:18
→ : 可悲啊 政治立場決定台灣人怎麼看科技172F 02/01 21:20
→ : 島國某群雙標又正常發揮而已173F 02/01 21:22
推 : 很簡單阿,美國可以 他國不行阿174F 02/01 21:23
→ : 就自卑心作祟,恨不見別人好
→ : 就自卑心作祟,恨不見別人好
推 : 又用AI又想站在道德制高點 不要臉= =176F 02/01 21:35
--
※ 看板: ACG 文章推薦值: 0 目前人氣: 0 累積人氣: 106
作者 astrayzip 的最新發文:
- 說回來 感覺很多人很氣訓練用別人資源 但是感覺又對openAI沒反應 我覺得這就很奇怪 因為OpenAI最知名的一個點 就是因為盜用別人資料訓練所以官司纏身 這幾年可非常多新聞 但很妙的似乎有人看到 …176F 59推 1噓
- 15F 5推
- 很多角色本身都月光 然後吃泡麵 比如兩津 就常常搞到要吃泡麵過活 那麼 有沒有其他角色也理財完全不行 總是有正常的餐吃不成 把自己搞到吃不了正常的三餐 必須幾餐吃一碗泡麵果腹等發薪水的 …30F 23推
- 28F 18推
- 11F 7推
點此顯示更多發文記錄
回列表(←)
分享