Re: [新聞] 日本AI研究第一人這樣評價Deepseek - Stock板

看板 Stock
作者 enunion (回來囉)
標題 Re: [新聞] 日本AI研究第一人這樣評價Deepseek
時間 Sun Feb 16 11:12:21 2025

三民治以及蟾蜍網紅
很喜歡用北一女筆記這個比喻去打DS
應該是當時候收錢
給的文案就是這樣寫的吧

但是對AI有一點概念的人
看了真的覺得在瞧不起人民智商
根本是在亂噴

對AI有興趣的
強烈推薦台大李宏毅老師的頻道
https://youtu.be/cCpErV7To2o?si=fhemvtkydilYOMwt

https://youtu.be/Q9cNkUPXUB8?si=Sb2uv6f1KWu1XnlC

https://youtu.be/v12IKvF6Cj8?si=KBFxIZn6KfNDNQoR

簡單來說
AI的成形分三階段
比較好的比喻是
第一階段是生一個小朋友（pretrain）
第二階段是讓他學校上課學習（督導式學習）
第三階段則是對這位小朋友的回答提供反饋(RLHF), 告訴他哪一個回答比較好

很明顯第一步要生出小朋友是比較困難的
要花很多的資源去train一個模型

打造他的樣子捏他的臉型膚色外型比例之類的
這也是為什麼OpenAI 和meta花了這麼多錢的原因

而台灣乃至美國的學校所謂的發展AI
大部分都是拿這些Meta開源的模型(小朋友）
去用他們自己的資料去微調參數
有點像是讓這些Meta生的小朋友
去不同學校上課
培養出不同個性和學識的小朋友
這個就相當簡單
簡單到幾個禮拜就可以做完
也不用花什麼錢
所以當你看到新聞
說什麼哪個學校或哪個機構發展自己的AI
花的時間少成本還很低
你可以看看就好
沒什麼稀奇的

而 Deepseek 呢？
他是和那些學校和機構一樣
拿別人已經生出來的小朋友去上學
就說自己發展出AI了嗎？
人家可不是這樣
他跟OpenAI 和Meta一樣
都是從頭開始
自己捏出一個自己的小朋友
生出這個小朋友的成本還極低
而且在運作時
這位小朋友消耗的能量也少

生的時候花的力氣少
生出來後吃的東西也少
這是什麼神仙寶寶

這才是各界震驚的原因

Deepseek的確是讓人類在AI發展邁進一大步
並不是三民治在那邊造謠就可以抹滅

有良知的媒體和政府
應該讓人民認知我們自己目前的不足
然後砥礪大家前進
而不是拿一塊布把大家眼睛遮住
一直騙說別人只是作弊
我們沒有很差

把時間浪費在造謠和口水
倒不如把時間花在了解和學習
人家跑在前面又怎樣
努力跟上去就有機會反超
而不是自欺欺人
導致永遠地落後

-----------------
附上懶人包
簡單介紹AI成形三階段
再次感謝李宏毅老師的貢獻
http://i.imgur.com/6KO6GvX.jpg

※引述《netflix06 (OK )》之銘言：
: 我的理解啦～
: 這就好像一個北一女的筆記本出售，
: 有人去讀那個筆記，
: 可以在考試上接近不錯的分數，
: 後來又再出售自己的筆記，賣得很便宜，
: 然後呢讀書方法這種事真的還是講興趣跟天份的吧，
: 有興趣的話，可以融會貫通，
: 跨領域聯想，可以一直舉一反三，
: 再來，也有底蘊底氣的不同，
: 西方國家如果做比喻的話就像三代文人家族，
: 從祖父開始是哪裡的狀元在哪裡當官，
: 有什麼門生人脈再到父輩；
: 然後中國就像寒窗苦讀，
: 不是鬥不起，
: 是資源掌握跟運用的問題，
: 幾十幾百個寒窗苦讀的人，
: 讓他們都考上狀元榜眼探花舉人秀才，
: 全部加起來，也很難比過三代文人望族世家貴族階層；
: （例如被限制取得先進光刻機）
: 再來，個性決定命運，
: 這話也能套用在國家民族特性，
: 如果將美國跟中國各看成一個人，
: 一個是擅長創新而且鼓勵自由發展，
: 一個是偷竊邀功欺上瞞下，鼓勵不公平競爭個性的人，
: 這兩個人會有什麼發展，其實不難推斷，
: 回到現實面，科技的發展取決於晶片，
: 晶片的IC設計-美國矽谷跟以色列最強，
: 晶片的製造-先進製程-台灣台積電最強，
: 目前deepSeek 就像剛剛舉例抄筆記，
: 可以達到AI運算，
: 但是實際比較運算能力跟速度，
: DeepSeek 還是比不上chatgpt.
: DeepSeek 對比 chatgpt
: 就像比亞迪追趕特斯拉，每當追上了硬體或軟體，
: 特斯拉又去研究新的領域，
: 無人駕駛技術或機器人發展或太空領域探索。
: ※ 引述《anti87 (天機老和尚)》之銘言
: : 原文標題：日本AI研究第一人這樣評價Deepseek
: : 原文連結：https://reurl.cc/5DxgVR
: : 發布時間：2025/02/13
: : 記者署名：徐潮、鈴木健二朗、岩澤明信
: : 原文內容：
: : 中國初創企業DeepSeek（深度求索）開發的高性能、低成本生成式AI（人工智慧）大規模
: : 語言模型（LLM）受到了全世界的關注。日本經濟新聞（中文版：日經中文網）就如何評
: : 價該公司的最新AI模型、安全性方面的風險、以及對日本企業的影響等問題，採訪了日本
: : AI研究領域的第一人、東京大學教授松尾豐。
: : 性能與美國OpenAI接近
: : 記者：您如何評價DeepSeek的技術？
: : 松尾豐：技術很出色，性能與運營「ChatGPT」的美國OpenAI接近。（DeepSeek）
: : 每次發佈新的AI模型，都會發表論文，詳細説明模型採用了什麼樣的技術，以及花費心思
: : 實施的改進之處。
: : 該公司還同時以（任何人都可使用的）開源方式進行公開。1月發佈的最新模型「
: : R1」進行了提升推理能力的強化學習。最終展現出了與OpenAI的「o1」同等的推理性能。
: : 在中國，AI開發十分活躍，孕育實力企業的環境不斷擴大（DeepSeek的APP界面，REUTERS
: : ）
: : 記者：在AI開發方面，美國一直處於領先地位。競爭的勢力格局是否會發生變化？
: : 松尾豐：作為大前提，中國的AI水準相當高，可以與美國比肩。至少從頂尖（學會
: : 採納的）論文數量來看，中國已經超過美國。
: : 另外，中國還有阿里巴巴、騰訊、百度等其他很多實力強勁的企業，擁有眾多優秀
: : 原文標題：日本AI研究第一人這樣評價Deepseek
: : 原文連結：https://reurl.cc/5DxgVR
: : 發布時間：2025/02/13
: : 記者署名：徐潮、鈴木健二朗、岩澤明信
: : 原文內容：
: : 中國初創企業DeepSeek（深度求索）開發的高性能、低成本生成式AI（人工智慧）大規模
: : 語言模型（LLM）受到了全世界的關注。日本經濟新聞（中文版：日經中文網）就如何評
: : 價該公司的最新AI模型、安全性方面的風險、以及對日本企業的影響等問題，採訪了日本
: : AI研究領域的第一人、東京大學教授松尾豐。
: : 性能與美國OpenAI接近
: : 記者：您如何評價DeepSeek的技術？
: : 松尾豐：技術很出色，性能與運營「ChatGPT」的美國OpenAI接近。（DeepSeek）
: : 每次發佈新的AI模型，都會發表論文，詳細説明模型採用了什麼樣的技術，以及花費心思
: : 實施的改進之處。
: : 該公司還同時以（任何人都可使用的）開源方式進行公開。1月發佈的最新模型「
: : R1」進行了提升推理能力的強化學習。最終展現出了與OpenAI的「o1」同等的推理性能。
: : 在中國，AI開發十分活躍，孕育實力企業的環境不斷擴大（DeepSeek的APP界面，REUTERS
: : ）
: : 記者：在AI開發方面，美國一直處於領先地位。競爭的勢力格局是否會發生變化？
: : 松尾豐：作為大前提，中國的AI水準相當高，可以與美國比肩。至少從頂尖（學會
: : 採納的）論文數量來看，中國已經超過美國。
: : 另外，中國還有阿里巴巴、騰訊、百度等其他很多實力強勁的企業，擁有眾多優秀
: : 工程師。在這樣的生態系統中，AI不斷得到開發與應用。出現DeepSeek這樣極具實力的企
: : 業，並不令人驚訝。
: : 對日本企業來説也是一種鼓舞
: : 記者：您如何看待DeepSeek的出現對日本産生的影響？
: : 松尾豐：日本也需要努力開發生成式AI模型。像DeepSeek這樣並非大型科技企業、
: : 也沒有雄厚資本的公司，竟然能夠實現世界最先進的精度，這對日本的初創企業來説也是
: : 一種鼓舞。即便在日本國內，只要紮實地進行技術開發，就有可能實現這樣的飛躍。
: : 很多日本的AI初創企業從松尾教授的研究室誕生（2024年10月攝）
: : 記者：您如何看待像DeepSeek這樣的企業採取開源戰略的動向？
: : 松尾豐：最初採取開源戰略的企業是美國Meta，該公司推出了「Llama」。後來，
: : 中國阿里巴巴推出了性能非常高的模型「Qwen（通義千問）」。在日本，基於這兩家企業
: : 的模型進行追加學習的動向也十分活躍。如果基礎模型紮實，就能輕鬆提升性能。
: : 不過，開源強大，還是OpenAI及美國谷歌這樣的非公開系統強大，競爭始終存在
: : 。哪一方勝出會因狀況而變。
: : 這次DeepSeek的出現，使得開源方面的勢力得到了很大的恢復。雖然OpenAI及谷
: : 歌擁有性能卓越的非公開模型，但這表明開源也能夠做到同樣的事情。
: : 安全風險因使用方式而異
: : 美國OpenAI在應對DeepSeek的崛起（首席執行官薩姆· 阿爾特曼，REUTERS）
: : 記者：對於利用現有AI模型輸出的數據來創建新的生成AI的DeepSeek的「蒸餾」技
: : 術，OpenAI指出這種做法違規。
: : 松尾豐：我不知道情況的真假。在美國企業之間，這樣的傳聞非常常見。這次也可
: : 能涉及（中美的）政治含義。
: : 記者：您如何看待使用中的安全等風險？
: : 松尾豐：是利用DeepSeek的開源還是使用其服務？根據使用方式的不同，風險也不
: : 同。開源可以下載程式並在本地運作。這樣的話，數據不可能被發送到某個地方。
: : 另一方面，DeepSeek的APP服務在中國的伺服器上運作。一旦輸入數據，這些數據
: : 就會發送到中國的伺服器，在中國進行處理並返回。雖然表示不使用這些數據進行學習，
: : 但實際上並不排除使用的可能性。
: : 這點不管對於DeepSeek還是OpenAI來説都一樣。這是一個你對對方投以多大信任的
: : 問題。
: : 記者：圍繞AI的智慧財産權和資訊洩露問題，中美間的對立似乎還會加劇。
: : 松尾豐：美國（海軍和某些州）提出不要使用DeepSeek。但從研究者的角度來看，
: : 我並不認為DeepSeek做了什麼特別的事情。相反，我認為他們只是在好好搞技術並將其發
: : 佈。

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.138.127.23 (臺灣)
※ 作者: enunion 2025-02-16 11:12:21
※ 文章代碼(AID): #1diLUNRQ (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1739675543.A.6DA.html

※ 同主題文章:

[新聞] 日本AI研究第一人這樣評價Deepseek

02-13 13:45 anti87

Re: [新聞] 日本AI研究第一人這樣評價Deepseek

02-16 01:37 netflix06

Re: [新聞] 日本AI研究第一人這樣評價Deepseek

02-16 11:12 enunion

Re: [新聞] 日本AI研究第一人這樣評價Deepseek

02-16 23:08 amidha

Re: [新聞] 日本AI研究第一人這樣評價Deepseek

02-17 00:52 ImHoluCan

Re: [新聞] 日本AI研究第一人這樣評價Deepseek

02-19 22:44 Jimny5566

推 bustinjieber: 清晰的比喻1F 02/16 11:17

推 sonnyc: 好奇如果是自己生出來的怎麼會回答我是chatgpt？還是其實也是被黑的XD2F 02/16 11:23

→ LDPC: 因為第三塊啊合成數據原因RLHF用RL取代=_=...4F 02/16 11:27

推 stlinman: 因為"我是誰"是哲學問題，現在AI還只能靠人餵的資料去認知自己。5F 02/16 11:30

噓 good5755: Deepseek也是用別人模型蒸餾出來的好嗎= =7F 02/16 11:30

推 stlinman: 看別人教材自己編講義有什麼問題嗎? 至少學習方法跟8F 02/16 11:33

推 kirayue: 推臺大李宏毅老師9F 02/16 11:34

→ stlinman: 講義編法有改良進步啊!10F 02/16 11:34

噓 sazabik: 起手勢就扯政治，證明這種廢文就沒可信度
對於有這種立場的帳號，當廢話聽聽11F 02/16 11:37

推 ilw4e: DS一個重點就是證明第二階段不重要，之前花一堆力氣在那邊人工做教材教，結果發現AI自己就能通了13F 02/16 11:37

噓 Rickyyy: 去政黑15F 02/16 11:38

推 kistar: DS如果不是中國發布，大概就不會有人扯政治了16F 02/16 11:38

推 s0914714: DeepSeek v3並不是蒸餾好奇的是training data來源17F 02/16 11:38

→ LDPC: 樓樓樓樓上你認真=_=?
第三方的open deepseek 搞出自己版本的合成數據了現在一堆人殺入如何設計用大模型生數據創造思考
ai真他x捲今天我看到paper已經提到關鍵是structure18F 02/16 11:39

→ TheBeast: 很懷疑就去了解別人的論文很難？22F 02/16 11:41

推 s0914714: 說真的很感慨啦尤其是唐鳳沾沾自喜繞過64議題
台灣什麼時候變得這麼沉淪我們應該趕快發展AI
而不是阿Q心態說這又沒多強23F 02/16 11:46

推 WANGSH: 羨慕中國研發能力強大反觀26F 02/16 11:47

→ LDPC: @@ 買個4090 實作一下就很有快感啊去摸摸比吵架好27F 02/16 11:48

噓 as6633208: deepseek 現在問第二次就死，答案還一直幻覺，這東西早就沒用了。我現在只想等這個月gpt5 和claude4付好費等他更新28F 02/16 11:49

推 qazedcrfv: 我只能說用過deepseek 後，真的沒想像中的好用，控制力真的還不能拿來應用在各種場域中31F 02/16 11:51

→ as6633208: 我觀察這邊deepseek吹的問題，不是生活或工作幾乎沒真的使用過ai，就是連deepseek都沒打開來用過只看新聞，實際要用，gpt claude才是最好的工具，不是deepseek這垃圾==33F 02/16 11:54

推 lon0623: DS強項是便宜好嗎
沒有你腦補這些
而且DS並沒有那麼神，會震驚一方面是他從中國來37F 02/16 11:54

推 godog: 松尾豐說DS技術很出色樓上說強在便宜誰是對的?40F 02/16 11:59

推 lon0623: 台灣是小國，能選的路線有限，倒不一定要去
硬拼AI
便宜不算技術出色嗎？41F 02/16 11:59

推 SRNOB: 都對啊 ds不如o1 claude 但是免費
o1 claude 20/200 鎂刀44F 02/16 12:00

→ lon0623: 我沒有說他不出色啊，但不是原po講的那樣46F 02/16 12:01

→ SRNOB: o1大概6-10萬可以下載在本地端接你的知識庫
說錯ds ds可以你在家自己部署 closeai claude 可不行47F 02/16 12:01

噓 alenn: 優化很強並不代表基礎全都自己做耶 MOE才是重點50F 02/16 12:02

→ SRNOB: 不要671b的甚至一般顯卡也能跑開源就是屌
你看上面免費仔網頁用一用就判定死亡51F 02/16 12:03

推 audic: 誰被中國便宜貨卷到都沒好處，現在在吹什麼，股板53F 02/16 12:04

推 b05605019: 推54F 02/16 12:05

→ SRNOB: 台灣軟體實在不行55F 02/16 12:05

→ audic: 看企業獲利，不是看百姓便不便宜56F 02/16 12:05

→ lon0623: 但DS只會是AI發展的一個過程
遠遠不會是最終解
我不覺得台灣要發展軟體，人口不夠
台灣務實的方法，應該是利用台積的優勢發展本土供應鏈57F 02/16 12:05

推 duriamon: 你就算講那麼白話還是一堆人看不懂啦！他們只會中共抄襲，還好台灣沒有什麼AI軟體股，要不然這群人一定是韭菜中的韭菜，笑死！62F 02/16 12:07

→ b05605019: 小國可以拿人家的東西來改啊，而不是直接禁止啊，當年荷蘭打獨立戰爭一樣有和哈布斯王朝貿易啊65F 02/16 12:07

噓 FK6819: 台灣學DS幹嘛？你先學不發廢文先67F 02/16 12:07

推 SRNOB: 跟著喊抗中保台抵制china68F 02/16 12:08

→ lon0623: 我們才兩千多萬人口，怎麼跟人比69F 02/16 12:08

→ SRNOB: 我們有台積電！！70F 02/16 12:09

推 alenn: 開源就是站在過去的巨人上優化在優化 meta/MOE都是71F 02/16 12:09

→ duriamon: 這波AI大語言模型都降低那麼多軟體業門檻了，寫碼成本直接爆減，有好的idea都可以靠這波新創起家了，台灣還不趁這個機會發展軟體產業，有錢賺也不會賺，真的棒！呵呵！72F 02/16 12:09

→ alenn: 就是優化很好的AI演算法邁一大步有點誇張哈76F 02/16 12:09

→ lon0623: 倒不如去研究光阻劑之類的77F 02/16 12:09

→ duriamon: 研究光阻劑？認真？專利早就被人家卡死了啦！呵呵！78F 02/16 12:10

推 stlinman: 會說問第二次就死...大概不知道要調一下對話流設計!79F 02/16 12:10

→ lon0623: 看到什麼都想做，只會資源分散80F 02/16 12:11

→ stlinman: 當然我也認為"花錢無腦用"才是最好商業模式，問題這這串是在討論技術。81F 02/16 12:11

→ lon0623: 被卡也要培養啊83F 02/16 12:11

→ duriamon: 軟體產業寫程式碼是最不會被專利卡的，結果台灣完全放棄，連到現在有好的idea餵ChatGPT搞不好程式碼就生出來了，也不會用，難怪只能花大錢生個點麵線，笑死！84F 02/16 12:12

→ lon0623: 而且AI不一定賺錢，台積供應鏈是有母雞的
那你怎麼不去研究88F 02/16 12:12

→ duriamon: 連用AI工具都不會還想研究光阻劑？人家該研究的早就搞完了，真的是想太多，研究光阻劑還是洗洗睡吧？你知道人家研究光阻劑的都是專利直接卡官能基嗎？好用的早就沒了，還輪到台灣？90F 02/16 12:14

推 lon0623: 人家AI都是多少規模的在做，你以為只有寫code喔
都是幾億人口大國才撐得起來94F 02/16 12:17

推 duriamon: 軟體產業不是只有AI懂嗎？用AI來產生服務性軟體可以大幅降低成本，懂嗎？96F 02/16 12:18

→ lon0623: 台灣可以做應用面就好了
資源有限的小國，不可能面面俱到98F 02/16 12:18

噓 ian41360: 還要拿台大教授來背書…教授知道嗎？這邊不是八卦版387F 02/16 18:07

噓 blackjose: 笑死
走水溝反超，棒棒的。389F 02/16 18:15

推 taikouhncheu: 看來很多人V3和R1傻傻分不清楚391F 02/16 18:31

推 jboys75: 買個5090實作一下很好用的392F 02/16 18:44

作者 enunion 的最新發文:

+27 [新聞] 下斡旋「馬上成交」首購傻眼：不知房 - home-sale 板

作者: enunion 42.77.66.210 (台灣) 2025-04-04 10:58:25

連結：內文：房市進入反轉下修格局，但有前幾年看屋、苦於追價買不到房子的小白，因對房價敏感度較差，近期就有一出斡旋金就成交的狀況。一名讀者提到，仲介提議出斡旋談談看，沒想到屋主馬上點頭答應，斡旋金 …

61F 33推 6噓
+7 [請益] 3115 富榮鋼為什麼不會倒 - Stock 板

作者: enunion 223.139.127.20 (台灣) 2025-03-10 18:33:36

14F 8推 1噓
+26 Re: [新聞] 日本AI研究第一人這樣評價Deepseek - Stock 板

作者: enunion 223.138.127.23 (台灣) 2025-02-16 11:12:21

三民治以及蟾蜍網紅很喜歡用北一女筆記這個比喻去打DS 應該是當時候收錢給的文案就是這樣寫的吧但是對AI有一點概念的人看了真的覺得在瞧不起人民智商根本是在亂噴對AI有興趣的強烈推薦台大李 …

392F 55推 29噓
+2 [請益] 台股和美股公司產品佔營收比例 - Stock 板

作者: enunion 118.232.136.47 (台灣) 2025-01-30 21:24:18

20F 4推 2噓
+8 Re: [問卦] 雞排以前只要35元是真的嗎？？？ - Gossiping 板

作者: enunion 42.77.229.6 (台灣) 2025-01-05 23:56:55

23F 8推

點此顯示更多發文記錄