作者toro736 (草木本有心)
看板Gossiping
標題Re: [問卦] DeepSeek V4 為什麼這次影響這麼大?
時間Tue Jun 9 07:47:28 2026
※ 引述《s213092921 (麥靠貝)》之銘言
: 懶人包:
: 因為鉅額的AI投入無法帶來相對的回報,所以各家公司開始尋找便宜好用的deepseek
: (1. 極致的性價比:成本較美國模型便宜達 100 倍 「美國 AI 太貴了」已成為企業共
: 識。報導指出,矽谷工程師若每月執行 Claude Opus 4.7 模型,成本可能高達 2.5 萬美
: 元,每百萬 Tokens 價格約 25 美元。相較之下,DeepSeek 每百萬 Tokens 的成本僅為
: 0.28 美元,同等業務量的月支出可壓低至 280 美元。
: 即使以官方 API 標價來看,DeepSeek V4 Pro 的輸入價格僅為每百萬 Tokens 0.30 美元
: ,約為 OpenAI GPT-4.1(2.00 美元) 的七分之一,或是 Anthropic Claude Sonnet(3.00
: 美元) 的十分之一。)
便宜真的治百病啊
https://www.koc.com.tw/archives/645064
GPT-5.5 在資安實測 10 次成功 7 次,DeepSeek V4 Pro 每次解題成本只要 0.62 美元,G
emini 幾乎直接拒絕
每次測試的預算上限為 10 美元、執行時間上限為 2 小時。
除了 Claude 採用 Claude Code 的 -p 模式之外,其餘模型大多透過 pi 這套測試框架(h
arness),搭配 pi-goal-x extension 執行,目的是讓模型在遇到失敗或卡關時,還是能
持續嘗試不同方法完成任務。
最終表現最好的是 GPT-5.5,10 次測試成功 7 次,解題率達 70%。平均每次測試成本為 6
.62 美元,每次成功解題成本為 9.46 美元,中位數 token 使用量約 260k。
Kasra 觀察到,GPT-5.5 多數成功案例在解開 APK 後,很快就把重點轉向 Firebase,而不
是被 API 或 React Native App 本身牽著走,這也成為它在這項任務中最明顯的優勢。
DeepSeek V4 Pro 的成功率雖然不如 GPT-5.5,10 次測試中成功 3 次,但成本效率非常突
出。它平均每次測試只花 0.19 美元,每次成功解題成本也只有 0.62 美元,明顯比 GPT-5
.5 低很多。
Claude 表現就普普,Sonnet 4.6 和 Opus 4.8 都是 10 次成功 2 次,但成本偏高。Kasra
提到,Opus 4.8 有幾次其實非常接近答案,只是最後因安全 guardrails 在後段中止,不
是像 Gemini 幾乎一開始就拒絕。
Gemini 這次明顯受到安全政策影響。Gemini 3.1 Pro Preview 和 Gemini 3.5 Flash 都是
10 次成功 0 次,其中 Gemini 3.1 Pro Preview 的中位 token 使用量只有 9k,明顯低
於其他模型,代表大多數很早就拒絕任務。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 27.53.233.206 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1780962451.A.BC6.html
推 mclarenjpn: GEMINI勸退文? 61.228.210.194 06/09 07:49
→ Harmai: 什麼時候有台灣出的AI平台啊 27.240.216.114 06/09 07:50
推 jeffguoft: 再撐一陣子,以現在的迭代速度,下一代 49.159.77.106 06/09 07:53
→ jeffguoft: deepseek應該就足夠執行任務了 49.159.77.106 06/09 07:54
→ jeffguoft: 到時候我也來研究從美系切中系模型 49.159.77.106 06/09 07:54
→ sturmpionier: 推優惠洗一波後閹割 蠻賤的 110.28.64.118 06/09 08:03
推 raygod: gemini已廢 49.216.223.82 06/09 08:07
推 locdan: 哪一次不是便宜治百病,便宜必勝阿 220.132.166.54 06/09 08:08
推 lastphil: gemini只能拿來寫寫小作文 1.161.186.155 06/09 08:10
→ meatbear: 連AI都要卷了嗎 209.53.30.82 06/09 08:10
→ yesonline: gemini產品經理宣布Plus方案降價到4.99 220.133.253.85 06/09 08:18
→ yesonline: 儲存空間翻倍增加至400GB 220.133.253.85 06/09 08:19
推 tsubasawolfy: 任務完成上的便宜治百病在於你時間 163.15.167.119 06/09 08:20
→ tsubasawolfy: 不用錢 163.15.167.119 06/09 08:20
推 mclarenjpn: 以為PRO 5美元(T▽T) 61.228.210.194 06/09 08:22
推 piece1: 沒有便宜還想要普及的,都是腦袋裝屎 61.64.30.209 06/09 08:26
噓 lulululula: 被安全政策擋掉的任務沒啥好討論的吧 49.216.161.183 06/09 08:27
→ lulululula: 還是你各位都駭客? 49.216.161.183 06/09 08:27