作者 strlen (strlen)標題 Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預時間 Sat Jan 25 17:37:24 2025
很多人看著benchmark多高多高吹滿天
如果你也是個老電腦玩家
就知道評測基本只能當參考
老黃前陣子在大會上拿出新的遊戲顯卡5070說對標4090
新玩家們個個目瞪口呆
老玩家們則是
https://i.imgur.com/Sxb1f15.jpeg
評測數據嚇死人
實跑遊戲笑死人
然後再來怪優化不佳
這種我們中老年都看多了
講那摸多
不用不用
實際動手玩
就知道惹
反正大過年的
閒著也是閒著
就來實地評測AI
也不用拿什麼多複雜難解的數學題
就拿前端碼農拿到設計圖要切版就好
最實際在工作上會用到
https://i.imgur.com/sLl860H.jpeg
這是網路上找到的一個簡單的註冊網頁設計圖
目標是把圖丟給AI
叫它照著圖寫程式
然後要有基本的驗證輸入欄位功能
像是你email沒填
或是密碼格式不對要檢查之類的
我的提示詞如下:
使用html css javascript網頁前端技術
請完全依照設計圖
製作一個註冊頁面
網頁裡各項欄位必須在驗證是否留空
密碼欄位需驗證是否至少含有一個大寫字母及一個特殊符號
驗證未通過在欄位右方加入提示方塊
接著各家AI產出的結果如下:
Gemini 2.0 Flash Thinking Experimental
https://thelonesomeera.com/signuptest/gemini/
ChatGPT o1
https://thelonesomeera.com/signuptest/chatgpt/
Claude 3 Haiku
https://thelonesomeera.com/signuptest/claude/
DeepSeek R1
https://thelonesomeera.com/signuptest/deepseek/
大家可以自己進去玩一玩比較一下
這些都是AI產出的我一行程式碼都沒有改完全複製貼上
然後也沒有串接後端程式和資料庫所以你真的點Sign Up也不會紀錄任何資料
懂程式的可以自己右鍵檢查看code或直接下載回去研究
結論是我想我還是繼續用ChatGPT好了
Gemini那個新模型四天前剛出
總算是有進步了
然後皮皮鬼也有去給川皇下跪
GOOG現在可以考慮進場...吧?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.169.31.248 (臺灣)
※ 作者: strlen 2025-01-25 17:37:24
※ 文章代碼(AID): #1dbB3SIC (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1737797852.A.48C.html
※ 同主題文章:
Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預
01-25 17:37 strlen
推 itwt: 差異自己測一下就知道吧...2F 01/25 17:46
推 iaminnocent: CHATGPT 跟Claude是真的有規則的,沒有達成規則會跳出提示,Chatgpt填寫完成還有註冊成功訊息XD
deepseek的R1我剛剛也有跟ChatGPT o1進行同問題測試,在路徑規劃問題上O1推理得到正確路徑,R1則是完全錯誤,另外毒藥問題上也是O1回答比R1好3F 01/25 17:52
→ silveriii: Claude Sonnet比較強 Haiku是來聊天的9F 01/25 18:46
→ karcher: Gemini連切版都會,感覺web前端快失業
看來要找工程師直接找全端了10F 01/25 19:34
推 ohha0221: 但價錢差很大 一分錢一分貨 XD17F 01/25 21:02
→ ActionII: 這個就是對岸擅長的啊,雖然你的比較好,但我的巨便宜
這種東西落地就是要看成本,這東西只有一半好用但成本差了幾個數量級
那些meta 的人恐懼的不就是這樣嗎18F 01/25 21:16
推 yumumu: 推,不過你Claude怎麼拿Haiku,應該拿Sonnet吧24F 01/25 21:35
它說現在流量太高免費仔暫時停用
等開放再測一次
推 TaiwanUp: 一拳超人 美中的差距就在這裡25F 01/25 22:12
→ ken85: 飛彈很精準好用 但是決定戰場的是便宜的無人機吧~~26F 01/25 22:21
※ 編輯: strlen (118.169.31.248 臺灣), 01/25/2025 22:23:13
推 doubi: Claude 寫程式一定要選 Sonnet, 真心不騙
成功率比 ChatGPT 好很多
Deepseek 的 Code 我沒有一次採用 ...
但是文書處理 DeepSeek 蠻好用的27F 01/25 23:46
推 AudiA4Avant: Deepseek的降本架構拿去改良Meta的Model,不會讓meta更強嗎?31F 01/25 23:52
→ TaiwanUp: DS證明偷工減料果然行不通 仍須更多基礎設施投資33F 01/25 23:58
→ ActionII: 無人機是超乎想像好用,但傳統精準武器還是決定戰場啊34F 01/26 00:04
→ TaiwanUp: 電詐好用 要牆內外買單訂閱還是免了36F 01/26 00:12
--