Re: [討論] Claude開始水token

作者LDPC (Channel Coding)

看板Tech_Job

標題Re: [討論] Claude開始水token

時間Tue Apr 21 04:52:56 2026

應該會吃緊啊現在矽谷一堆PR都用claude審搭配人類我們算過一個複雜點PR claude大概花費5~20美金然後品質比較跟人類比只要正確搭配人類可以省下30min ~1hr 我們這邊工時一個人都是100美金/hr起跳現在都是用時間和token費用和品質在換算結論就是token狂燒幹死對家比誰的錢多和迭代速度快然後我們PM也捲起來跳下來開始幹實作和對接crossfun team 在模型設計上codex使用體感還是比claude 好這真是出乎意料（參照下方) 有傳言codex是MoE設計 claude是dense transformer 理論上後者的邏輯順序會比較好但缺點就是計算量和速度偏慢前者是一定會快的 https://reurl.cc/R2LaWD 但很吃Harness上下文管理設計不然邏輯順序會亂掉現在進行式就是 token費用 vs 人類價值 vs 速度產出 vs 系統品質搭建看到上一篇說LLM/Agent只就只是個語言系統....嗯嗯恩 QQ 我好羨慕那個世界線現在Agent就幹這幾件事拆解問題選擇工具組合工具解問題工具結果驗證已經不在是個當純語言模型的問題了這也是為啥Harness設計最近很夯尤其最近一篇ICLR paper已經驗證 SFT去訓練模型會打輸模型加個好的Context設計原因就是SFT會造成information collapse和失去reasoning ability -- 人類跟猴子差別就是會用工具好的Agent就是會用工具模型設計現在為啥RL會夯就是因為RL在訓練模型要跟現實工具環境做交互影響來解決問題已經不在是"語言"模型比方說claude前幾代當模型快用完context資源會開始把答案縮短來增加回合逼得人類學在context上在系統架構不斷要code來選曲重新釋放但現在最新模型已經會自己去管context長度控制了所以現在模型owner大概就是走向RL+ Context設計 SFT除了在少數落地場景需要速度使用範圍性越來越下降至於上篇說沒有新血補入實際上是有只是會走向像是精英運動系統一樣大學生被挑選上實習這些人通常可以畢業正職加入但這些名額是限量的 ※ 引述《yamakazi (大安吳彥祖)》之銘言： : 包含4.6 4.7 : https://youtu.be/J-fgEGfskaI?si=OXtbInZEST1ODp4_

: 跟影片前半段一樣 : 我要放棄claude轉gemini : 跟這個影片一樣 : 我今天幫一個同事安裝公司內部的wiki mcp : 我自己也裝過，很簡單一次提示詞就好 : 但幫我同事裝的時候 : 居然先問一堆問題，又寫了一個md : 然後開始寫python還一直寫錯 : 他媽的裝mcp為何要寫md和python : 有夠坑錢 : ----- : Sent from JPTT on my iPhone -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 98.37.67.135 (美國) ※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1776718380.A.23A.html ※ 編輯: LDPC (98.37.67.135 美國), 04/21/2026 05:29:23 ※ 編輯: LDPC (98.37.67.135 美國), 04/21/2026 05:54:17

推 bunjie: LPDC大前面那篇自刪很可惜其實這系列討 182.155.197.16 04/21 06:28

→ bunjie: 論串蠻有意義的不知為何要自刪呢畢竟回 182.155.197.16 04/21 06:28

→ bunjie: 文章也是要花時間的 182.155.197.16 04/21 06:28

推 GawrGura: 推推 101.8.142.73 04/21 08:37

→ Sam27: 現在還是有90%以上的人覺得AI很笨 36.232.75.42 04/21 09:47

→ Sam27: 真的是不同世界..... 36.232.75.42 04/21 09:47

推 dream1124: 你當然要羨慕了。你們堅信這能取代新人 36.227.240.234 04/21 10:02

→ dream1124: 堅信這等同於真正的智慧，然後配合AI 36.227.240.234 04/21 10:02

→ dream1124: 廠商的模型及其開發的輔助工具上面 36.227.240.234 04/21 10:03

→ dream1124: 搞各種嘗試，結果最後連自己的文章也 36.227.240.234 04/21 10:04

→ dream1124: 不敢把「只要正確搭配人類」前提拿掉？ 36.227.240.234 04/21 10:04

→ dream1124: 你本質上還是在一個滿不穩定的基礎上 36.227.240.234 04/21 10:04

→ dream1124: 跟模型難預測的行為對賭。你有可能賭贏 36.227.240.234 04/21 10:06

→ dream1124: 但也有可能賭輸，只要賭輸時有風度一點 36.227.240.234 04/21 10:06

→ dream1124: 不用顧著講別人不同時間線或落伍即可。 36.227.240.234 04/21 10:06

→ dream1124: 這也就是為什麼會說可能驚訝發現提升的 36.227.240.234 04/21 10:08

→ dream1124: 效率雖不能說沒有，但不如預期高。 36.227.240.234 04/21 10:08

→ dream1124: 賭贏的時候爽歪歪，賭輸的時候額外奉還 36.227.240.234 04/21 10:10

→ dream1124: 最後，這裡的成本是總持有成本嗎？ 36.227.240.234 04/21 10:12

→ dream1124: 若不是的話，記得把試探各種工具組合 36.227.240.234 04/21 10:12

→ dream1124: 以及設計各種測試情境及評估指標的時間 36.227.240.234 04/21 10:13

→ dream1124: 算進去。總持有成本算出來才能看綜效。 36.227.240.234 04/21 10:13

→ dream1124: 有綜效才能客觀評估是否真有省到人力 36.227.240.234 04/21 10:19

推 a1234567289: 推樓上會用AI不是什麼稀有技能 49.216.18.62 04/21 11:02

→ a1234567289: AI超神or撞牆大家都遇過 AI整體增 49.216.18.62 04/21 11:02

→ a1234567289: 加生產力大家都同意但計算成本的時 49.216.18.62 04/21 11:02

→ a1234567289: 候永遠只算省下多少時間卻不算為了 49.216.18.62 04/21 11:02

→ a1234567289: 用這套系統額外付出了什麼成本 49.216.18.62 04/21 11:02

→ VicLien: 覺得ai很笨的人大概率自己用不好ai 大 42.78.218.26 04/21 11:29

→ VicLien: 部分人當成進階的搜索引擎包括我但可 42.78.218.26 04/21 11:29

→ VicLien: 想見會用的會把效率上到什麼程度矽谷本 42.78.218.26 04/21 11:29

→ VicLien: 來就是一神帶數坑的競爭環境看過thinki 42.78.218.26 04/21 11:29

→ VicLien: ng game體會就很深個人認為可以不用 42.78.218.26 04/21 11:29

→ VicLien: 很會用ai 但資產一定要有ai 部位來hedg 42.78.218.26 04/21 11:29

→ VicLien: e ai impact 42.78.218.26 04/21 11:29

→ ku72: 坦白說 AI有幫助沒人不承認但現在的幫助都 49.214.9.172 04/21 12:51

→ ku72: 是只更快的開發代碼但很多人都忘了對一間 49.214.9.172 04/21 12:51

→ ku72: 軟體公司而言每一行代碼都是負債不過他們 49.214.9.172 04/21 12:51

→ ku72: 也不在意現在的風氣都是趕快做趕快上有問 49.214.9.172 04/21 12:51

→ ku72: 題能修就修不能修就放生市場比信譽重要 49.214.9.172 04/21 12:51

推 r40491101: Up 45.149.173.225 04/21 13:57

推 holebro: 反正不管你是ai吹還是ai黑最後都是一起 36.224.179.208 04/21 14:04

→ holebro: 踩腳踏車只是想到隔壁的車友當初在那邊 36.224.179.208 04/21 14:04

→ holebro: 說AI取代不了人類就很想叫他多踩個幾圈 36.224.179.208 04/21 14:04

→ Arashi0731: AI很強啊，只是現在困境是案子不夠寫 111.82.50.40 04/21 16:28

→ Arashi0731: ，驗證的人不夠多，台灣就這麼丁點大 111.82.50.40 04/21 16:28

→ Arashi0731: ，一堆人搶食，現在大都交給AI寫運算 111.82.50.40 04/21 16:28

→ Arashi0731: 寫邏輯，我只負責架構，所以好閒喔 111.82.50.40 04/21 16:28

→ labbat: 只負責架構的大概就是卸責到底的了 27.240.105.243 04/21 16:35

推 dream1124: 你們知道現今世道最有病的地方在哪嗎？ 36.227.240.234 04/21 17:06

→ dream1124: 就是一群人在一個本質難預測且不斷變動 36.227.240.234 04/21 17:06

→ dream1124: 的基礎上加蓋東西大談工程學還不覺得怪 36.227.240.234 04/21 17:07

→ dream1124: 然後賭贏的人不覺得是賭贏卻強調是技術 36.227.240.234 04/21 17:08

→ dream1124: 是工程，質疑的人都是落伍且要被取代， 36.227.240.234 04/21 17:09

→ dream1124: 這就是現在狂粉的做風。以前常調整的 36.227.240.234 04/21 17:10

→ dream1124: 工具我們會說它很討厭，現在卻想在這種 36.227.240.234 04/21 17:11

→ dream1124: 東西上面加蓋，賭贏還會嫌別人落伍咧~ 36.227.240.234 04/21 17:11

推 a1234567289: 甚至廠商還為了減少成本支出模型被 49.216.18.62 04/21 17:17

→ a1234567289: 調弱結果之前user的AI workflow又 49.216.18.62 04/21 17:17

→ a1234567289: 要重新調 49.216.18.62 04/21 17:17

推 yamakazi: 現在開始有人要處理固定輸入不同輸出的 49.216.252.222 04/21 17:21

→ yamakazi: 問題了，簡單來說這跟浮點運算，併發處 49.216.252.222 04/21 17:21

→ yamakazi: 理，顯卡調度有關 49.216.252.222 04/21 17:21

推 dream1124: 另外沒AI前程式實作花50%時間就很多了 36.227.240.234 04/21 17:22

→ dream1124: 多的是只花20~30%的單位，因此卡在測試 36.227.240.234 04/21 17:22

→ dream1124: 或者是一些要人介入的地方有何奇怪？ 36.227.240.234 04/21 17:23

→ dream1124: 這也是為啥說效率提升程度可能不如預期 36.227.240.234 04/21 17:25

→ dream1124: 即便讓那30%直接歸零，效率也不是300% 36.227.240.234 04/21 17:26

→ dream1124: 別等到現在看軟工才如夢初醒吧~ 36.227.240.234 04/21 17:32

→ aaron2034b: 用過Agentic AI就知道 …SW被取代遲 36.231.133.177 04/21 17:48

→ aaron2034b: 早的事…. 36.231.133.177 04/21 17:48

推 gogogogo3333: 給推是現代人 119.56.17.210 04/21 18:09

推 yamakazi: 這個社會本身就充滿不確定性，我們是做 49.216.252.222 04/21 18:11

→ yamakazi: 工程和產品，不是做科學 49.216.252.222 04/21 18:11

→ Sam27: 你講愈多只是顯露你沒再用現在的Agent 36.232.75.42 04/21 19:15

→ Sam27: 上班工程師誰會只開一個agent? 36.232.75.42 04/21 19:15

→ Sam27: 現在都好幾個在開，其實沒比較輕鬆 36.232.75.42 04/21 19:16

推 yamakazi: 就連科學也不是每個科學都有確定性，醫 114.37.95.31 04/21 19:54

→ yamakazi: 學生科就不是百分百確定性 114.37.95.31 04/21 19:54

推 tswu8: 什麼自刪？有人備份嗎？L大一向是好文必讀223.139.223.218 04/21 20:17

推 dream1124: 噗,搞工程非科學?沒科學哪來電腦世界？ 36.227.240.234 04/21 20:24

→ dream1124: 若搞研發不重第一性原理，那稍早又何必 36.227.240.234 04/21 20:24

→ dream1124: 補充說廠商要解決同輸入不同輸出問題？ 36.227.240.234 04/21 20:24

→ dream1124: 還是你工程是反正試出的堆疊有用即可？ 36.227.240.234 04/21 20:25

→ dream1124: 那跟中世紀鍊金有何不同？再說，如果是 36.227.240.234 04/21 20:25

→ dream1124: 這樣做還容不得別人有疑問或潑冷水啊？ 36.227.240.234 04/21 20:26

推 dream1124: 扯醫學又更有趣了，人家不但研究機轉， 36.227.240.234 04/21 20:31

→ dream1124: 而且生醫實驗有夠複雜不會不知道吧？ 36.227.240.234 04/21 20:32

→ dream1124: 現在調試代理工程的人有測得這麼嚴謹？ 36.227.240.234 04/21 20:32

→ dream1124: 真有這麼嚴謹，那總持有成本會低嗎？ 36.227.240.234 04/21 20:32

推 yamakazi: 嗯嗯你都對XD 114.37.95.31 04/21 20:38

→ yamakazi: 你知道有一堆化學生科的論文，同行根本 114.37.95.31 04/21 20:41

→ yamakazi: 很難復現嗎？你知道為何諾貝爾科學類獎 114.37.95.31 04/21 20:41

→ yamakazi: 項通常都是二三十年後才頒發，因為要等 114.37.95.31 04/21 20:41

→ yamakazi: 到大家都review復現沒問題了。就連量子 114.37.95.31 04/21 20:41

→ yamakazi: 物理也是機率性沒有百分百的。 114.37.95.31 04/21 20:41

推 yamakazi: 就連電腦科學中的記憶體，也沒有辦法保 114.37.95.31 04/21 20:46

→ yamakazi: 證百分百每個電子都乖乖待在那個位子， 114.37.95.31 04/21 20:46

→ yamakazi: 所以才需要錯誤更正碼。併發處理在沒有 114.37.95.31 04/21 20:46

→ yamakazi: 原子操作下你也沒辦法保證那個執行順序 114.37.95.31 04/21 20:46

→ yamakazi: ，浮點數操作更是你只要操作順序換了， 114.37.95.31 04/21 20:46

→ yamakazi: 同樣的數字加起來就不一樣了 114.37.95.31 04/21 20:46

→ Sam27: 大家都知道2024年AI已經拿諾貝爾獎了 36.232.75.42 04/21 20:46

→ Sam27: 2021年藥廠就大量在用AI了...所以有數據 36.232.75.42 04/21 20:46

推 yamakazi: 確實是中世紀煉金，很多發明發現都是不 114.37.95.31 04/21 20:50

→ yamakazi: 小心或是無數次試錯得到的，比如青黴素 114.37.95.31 04/21 20:50

→ yamakazi: 和電燈泡 114.37.95.31 04/21 20:50

→ Sam27: 目前第二期有AI的成功率78%，沒用AI是38% 36.232.75.42 04/21 20:51

→ yamakazi: 青黴素就是不小心發現黴菌旁邊不長細菌 114.37.95.31 04/21 20:52

→ yamakazi: ，電燈泡試了幾千種材料 114.37.95.31 04/21 20:52

→ Sam27: 有用AI的降低成本40% 36.232.75.42 04/21 20:54

推 k7ji91ab5m: 以AI成長進步的幅度如果還在認為他是 114.24.87.190 04/21 21:48

→ k7ji91ab5m: 垃圾也是一種難以理解的思維除非你 114.24.87.190 04/21 21:48

→ k7ji91ab5m: 認為他有一天終會停滯或是不會再進步 114.24.87.190 04/21 21:49

→ kaltu: VC的錢燒完AI provider要盈利的時候，一個t 100.8.239.31 04/21 22:40

→ kaltu: oken如實反映data center的價格才會是泡沫 100.8.239.31 04/21 22:40

→ kaltu: 的第一個真正的引爆點 100.8.239.31 04/21 22:40

→ kaltu: 一直看不懂這麼貴的東西拿來聊天，自動完成 100.8.239.31 04/21 22:40

→ kaltu: 或者做PR審核這種工作有什麼可持續性 100.8.239.31 04/21 22:40

→ physicsdk: token的成本會降啊 218.161.13.66 04/21 23:28

→ VicLien: 用真空管的當然無法理解電晶體的坪效 XD 122.121.147.60 04/21 23:55

推 Litfal: 然而token的價格只能替代超高薪的時間對123.110.167.165 04/22 02:17

→ Litfal: 手是工人智慧123.110.167.165 04/22 02:17

推 shter: 化療來自不小心的毒氣外洩發現細胞殺法 1.163.235.14 04/22 02:50

→ shter: 最近流行的瘦瘦針也是治療糖尿病的意外發現 1.163.235.14 04/22 02:51

→ shter: 現代AI自己都是GPU不務正業的意外想法 1.163.235.14 04/22 02:53

推 goodfuture: (偷偷說-網路上找得到前面自刪的文) 118.161.210.72 04/22 09:44

推 kkrichard: 推 114.140.83.93 04/22 12:00

推 jack529: 這麼卷那你們有賺爛嗎 115.186.228.9 04/22 13:07

→ jack529: 最近Copilot, Anthropic 開始調高模型入 115.186.228.9 04/22 13:09

→ jack529: 門門檻了，錢還是有一天會燒完，再捲捲不 115.186.228.9 04/22 13:09

→ jack529: 出新的商業模式，只能跟中國一樣無限內卷 115.186.228.9 04/22 13:09

→ jack529: 卷走人力成本 115.186.228.9 04/22 13:09

現在AI落地2026很明顯就是toB 這塊就是垂直領域AI 我股版已經說過了以法律為例代表公司Harvey 今年ARR已經飆到200Million（年度經常性收入) 從去年低於100 Million 今年營收為指數成長它所造成的影響就是初階律師失業率提高開缺數量下降其他各自垂直領域龍頭其他還有IT 會計財務廣告金融都開始在影響就業 https://money.udn.com/money/story/5599/9426489 這也是為何Andrej Karpathy 職位評分工具有計算過哪些職缺會被影響到現在紅衫資本top30公司全部都是SAAS相關所有的營收都在瘋狂成長 PM職缺現在都可以被otter AI給影響到更別說有的是電影產業我在股板也講過 (阿凡達火與燼) 音樂部分有spotfiy AI創作音樂如果這些認知跟你不一樣你只是還沒看到中國已經在用skills 練化人類技能這也是為何所有公司都開始走coding agent 因為他是垂直AI產業線最重要因此xAI重組合作cursor 而google創辦人成立了一個突擊隊在改善coding agent 而openAI 放棄sora 而著重在 codex 原因就是2026 2月所有的風向都指向 toB的營收是最好賺的麥當勞客服引入cladue, Walmart販賣服務也引入openAI 繳稅軟體傳統SAAS 現在都馬上去跟openAI合作垂直AI -> coding agent -> 傳統SAAS市場被分割 ->辦公室產業縮減這也是為何上文提到Harness很重要他就是垂直AI工作重要的一環基於此所有一線公司都開始coding tool agent大競賽至於速度跟品質現在大家都用新的思維去看打個比方在c語言出來前你會去看組語但c語言後你根本不會去管組語你注重的是c語言架構的維護性同樣的現在的coding agent 就是"自然語言"編成換言之你寫程式已經邁向更高階的語言 ->人類語言而且這溝通是雙向的不是像以前人類寫c單方向比方說你在清掃屎山你第一步會叫ai把系統state machine先畫出來這光是針對傳統人類去讀屎山就加速對系統的理解程度接者拆解系統去設計你系統設計就變得很重要而你跟AI協作就是一種雙向的用人類語言寫程式你過去的手寫code 就類似於手寫組語一樣你會在效率上大幅改善你會去用更大的思維去看這系統去設計包含測試邊界 corner case 反過來說如果矽谷這邊都如同你們說就是砸錢拼速度不顧品質那為何在2026 token數量燒的程度已經指數上漲程度(詳情看股版) 以及為何原本持懷疑態度的果家都開始送人去AI coding訓練營直接拿claude code強迫員工用AI寫程式？甚至矽谷有許多公司在印度開始裁員嘗試用AI更多自動化這意味者隨者token 費用越低人類效能低成本國家和自動化系統的競賽也會開始有一件很殘酷事情是這兩年是窗口期它允許所有不是從事AI的人轉進這領域允許你使用AI tool 狂燒token 用AI tool視角去搭建系統打磨產品因為這市場才開始畢竟沒有這樣的人才所有的環境都是給第一代人去嘗試打磨系統兩年後等到市場有足夠的經驗人士 token花費就不會讓你邊試錯邊去學習怎樣用ai外掛而是會傾向雇用有用AI設計產品經驗的人因此大家都知道瘋狂的在累積經驗打磨產品直到大門關上那日這類型工作就叫做GenAI Engieer 任務包含如何用產品思維對接橫向整合現在面試風格已經轉成給你個產品系統大概會是你平常手寫需要兩到三天才能完成任務這產品就是有一半的code 你在一個小時就是拿AI tool 去先拆解架構叫AI把系統畫圖給你跟AI協作然後從這裡去完成剩下任務包含怎樣寫test 以及以後如何擴展系統當你在懷疑這件事情時候你就在變相的在這陣痛期轉換選擇不進入這扇門僅此罷了

推 v86861062: 推推 49.215.242.10 04/22 14:32

※ 編輯: LDPC (67.194.225.207 美國), 04/22/2026 14:54:19 ※ 編輯: LDPC (67.194.225.207 美國), 04/22/2026 14:56:39

推 jack529: 感謝分享，我很認同coding Agent已經確實 115.186.228.9 04/22 15:04

→ jack529: 改變整個生態，不管是不是軟體相關的，也 115.186.228.9 04/22 15:04

→ jack529: 不可能回到以前手打程式的時代。只是很好 115.186.228.9 04/22 15:04

→ jack529: 奇像你們走在前緣是否真的有賺，還是大家 115.186.228.9 04/22 15:04

→ jack529: 只是狂推生產力、狂堆算力，把可以自動化 115.186.228.9 04/22 15:04

→ jack529: 的自動化然後就沒然後了 115.186.228.9 04/22 15:04

→ jack529: 認同Andrej Karpathy 說的embrace expone 115.186.228.9 04/22 15:06

→ jack529: ntials 115.186.228.9 04/22 15:06

推 sunday0913: LDAI大救我我快失業了QQ 101.10.78.55 04/22 20:28

→ VicLien: 軟工變要走PLTR模式直接對接系統問題 1.172.73.36 04/22 20:41

推 goodfuture: AI正在以非常快的速度取代低階重複性 223.136.89.26 04/23 09:04

→ goodfuture: 數位工作，矽谷環境很樂意擁抱並測試 223.136.89.26 04/23 09:04

→ goodfuture: 新生產工具，這五年的變化非常劇烈 223.136.89.26 04/23 09:04

推 siyaoran: 測試也是ai在寫在弄啊 42.70.82.10 04/23 17:39

推 meRscliche: 推 101.12.146.241 04/25 14:36

推 create8: 謝謝大大無私分享，我感覺錢途茫茫QQ 130.62.83.54 04/27 17:19