看板 Stock 關於我們 聯絡資訊
很多人看著benchmark多高多高吹滿天 如果你也是個老電腦玩家 就知道評測基本只能當參考 老黃前陣子在大會上拿出新的遊戲顯卡5070說對標4090 新玩家們個個目瞪口呆 老玩家們則是 https://i.imgur.com/Sxb1f15.jpeg 評測數據嚇死人 實跑遊戲笑死人 然後再來怪優化不佳 這種我們中老年都看多了 講那摸多 不用不用 實際動手玩 就知道惹 反正大過年的 閒著也是閒著 就來實地評測AI 也不用拿什麼多複雜難解的數學題 就拿前端碼農拿到設計圖要切版就好 最實際在工作上會用到 https://i.imgur.com/sLl860H.jpeg 這是網路上找到的一個簡單的註冊網頁設計圖 目標是把圖丟給AI 叫它照著圖寫程式 然後要有基本的驗證輸入欄位功能 像是你email沒填 或是密碼格式不對要檢查之類的 我的提示詞如下: 使用html css javascript網頁前端技術 請完全依照設計圖 製作一個註冊頁面 網頁裡各項欄位必須在驗證是否留空 密碼欄位需驗證是否至少含有一個大寫字母及一個特殊符號 驗證未通過在欄位右方加入提示方塊 接著各家AI產出的結果如下: Gemini 2.0 Flash Thinking Experimental https://thelonesomeera.com/signuptest/gemini/ ChatGPT o1 https://thelonesomeera.com/signuptest/chatgpt/ Claude 3 Haiku https://thelonesomeera.com/signuptest/claude/ DeepSeek R1 https://thelonesomeera.com/signuptest/deepseek/ 大家可以自己進去玩一玩比較一下 這些都是AI產出的我一行程式碼都沒有改完全複製貼上 然後也沒有串接後端程式和資料庫所以你真的點Sign Up也不會紀錄任何資料 懂程式的可以自己右鍵檢查看code或直接下載回去研究 結論是我想我還是繼續用ChatGPT好了 Gemini那個新模型四天前剛出 總算是有進步了 然後皮皮鬼也有去給川皇下跪 GOOG現在可以考慮進場...吧? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.169.31.248 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1737797852.A.48C.html
MoonCode : 你倒是講一下差異 01/25 17:44
itwt : 差異自己測一下就知道吧... 01/25 17:46
iaminnocent : CHATGPT 跟Claude是真的有規則的,沒有達成規則會 01/25 17:52
iaminnocent : 跳出提示,Chatgpt填寫完成還有註冊成功訊息XD 01/25 17:52
iaminnocent : deepseek的R1我剛剛也有跟ChatGPT o1進行同問題測 01/25 17:54
iaminnocent : 試,在路徑規劃問題上O1推理得到正確路徑,R1則是 01/25 17:54
iaminnocent : 完全錯誤,另外毒藥問題上也是O1回答比R1好 01/25 17:54
Lenon4561 : 聽君一席話 如聽 01/25 18:10
silveriii : Claude Sonnet比較強 Haiku是來聊天的 01/25 18:46
karcher : Gemini連切版都會,感覺web前端快失業 01/25 19:34
karcher : 看來要找工程師直接找全端了 01/25 19:37
INIKS : 功能普通,不支援圖形語音,這種文字模型不是到處都 01/25 20:16
INIKS : 是嗎? 01/25 20:16
INIKS : 一看價格.....真香! 01/25 20:16
INIKS : https://i.imgur.com/LNrfvQm.jpeg 01/25 20:30
newyorker54 : 你不要這麼專業好不好,中吹會崩潰 01/25 20:38
ohha0221 : 但價錢差很大 一分錢一分貨 XD 01/25 21:02
ActionII : 這個就是對岸擅長的啊,雖然你的比較好,但我的巨 01/25 21:16
ActionII : 便宜 01/25 21:16
ActionII : 這種東西落地就是要看成本,這東西只有一半好用但 01/25 21:18
ActionII : 成本差了幾個數量級 01/25 21:18
ActionII : 那些meta 的人恐懼的不就是這樣嗎 01/25 21:19
ImHoluCan : 小米蘇7是保時捷沒錯 01/25 21:28
yumumu : 推,不過你Claude怎麼拿Haiku,應該拿Sonnet吧 01/25 21:35
它說現在流量太高免費仔暫時停用 等開放再測一次
TaiwanUp : 一拳超人 美中的差距就在這裡 01/25 22:12
ken85 : 飛彈很精準好用 但是決定戰場的是便宜的無人機吧~~ 01/25 22:21
※ 編輯: strlen (118.169.31.248 臺灣), 01/25/2025 22:23:13
doubi : Claude 寫程式一定要選 Sonnet, 真心不騙 01/25 23:46
doubi : 成功率比 ChatGPT 好很多 01/25 23:47
doubi : Deepseek 的 Code 我沒有一次採用 ... 01/25 23:47
doubi : 但是文書處理 DeepSeek 蠻好用的 01/25 23:47
AudiA4Avant : Deepseek的降本架構拿去改良Meta的Model,不會讓meta 01/25 23:52
AudiA4Avant : 更強嗎? 01/25 23:53
TaiwanUp : DS證明偷工減料果然行不通 仍須更多基礎設施投資 01/25 23:58
ActionII : 無人機是超乎想像好用,但傳統精準武器還是決定戰 01/26 00:04
ActionII : 場啊 01/26 00:04
TaiwanUp : 電詐好用 要牆內外買單訂閱還是免了 01/26 00:12