[新聞] 分析：「Token」帳單失控 AI商業化遭重擊

作者createlight (創輝)

看板Gossiping

標題[新聞] 分析：「Token」帳單失控 AI商業化遭重擊

時間Sat Jun 13 17:30:04 2026

1.媒體來源:大紀元 2.記者署名:程木蘭 3.完整新聞標題: 分析：「Token」帳單失控 AI商業化遭重擊 4.完整新聞內文: 【大紀元2026年06月12日訊】（大紀元記者程木蘭綜合報導）2026年，曾經狂飆突進的人工智能（AI）產業，正遭遇一記沉重的財務重拳。隨著各大AI模型開發商悄然終結對「Token」（中國稱詞元）調用成本的大幅補貼，一場由成本激增引發的連鎖反應，正從硅谷科技巨頭蔓延至華爾街的交易大廳，企業與投資者被迫直面高昂算力成本與實際投資報酬率之間的巨大鴻溝。據報導，從微軟緊急叫停內部激勵專案，到優步（Uber）的數十億美元預算在短短幾月內灰飛煙滅，AI的商業化進程正經歷一場嚴峻的「壓力測試」，Token消耗的野蠻增長時代正宣告終結。「Token」帳單失控科技巨頭的財務災難這輪成本危機的直接導火索，是衡量AI 輸入與輸出的基本單位「Token」價格的急劇攀升。今年2月至6月間，OpenAI、Anthropic 和 GitHub各自調整了定價模式，相繼依據Token使用量向客戶收費，而非沿用固定費率計費。智通財經6月10日報導指出，過去六個月裡，針對前沿模型的高質量推理服務Token定價已累計上漲約40%。這背後是高性能GPU的持續受限、數據中心能耗成本15%至20%的上漲，以及需求端爆炸式增長的共同作用。以OpenAI為例，近期發布的GPT-5.5直接將Token價格翻倍，達到每百萬輸入Token收費5美元、輸出收費30美元；Google新推出的Gemini Flash 3.5模型價格也是前代的3至6倍。儘管模型提供商在一年內實現了約2倍的效率提升，但同期Token的溢價幅度高達40%至50% ，導致依賴外部API的應用型企業淨成本實際暴增了20%至30%。不期而至的成本高峰率先沖垮了科技巨頭們的內部預算防線。據科技媒體The Verge報導，微軟在今年5月下旬做出了一項罕見決定：宣布將於6月30日終止其內部「體驗與設備」部門對Claude Code的集體許可。該試點項目於2025年12月高調推出，卻因Token消耗量帶來的帳單完全超出預期而迅速崩盤，微軟不得不強令工程師撤回至使用自家成本更可控的GitHub Copilot CLI。 Uber的遭遇更是一場AI財政災難。其首席技術官Praveen Neppalli Naga近期坦承，公司在2026年為AI撥備的34億美元年度預算，竟在今年4月便已全部耗盡。在向公司5000名工程師推出Claude Code後，月度活躍使用率飆升至85%至95%，每名工程師的月均API調用成本高達500至2000美元。華爾街拉響警報運算成本遠超人員成本華爾街對此迅速拉響警報。富國銀行首席股票策略師Ohsung Kwon指出，這顆雷的核心正終結硅谷工程師興起的「Tokenmaxxing（Token消耗最大化）」風潮。此前許多企業將AI工具的使用量納入內部考核體系，甚至建立排行榜，鼓勵員工儘可能多地消耗AI Token，以此作為衡量創新能力的指標。然而，這種盲目追求使用率的策略已演變為嚴重的資源浪費。 Kwon警告，如果AI需求開始趨於平穩，對AI交易而言將是重大的利空。基於此判斷，富國銀行已將其整體立場從今年4月的「看多」轉向「堅定中性」。英偉達（Nvidia, 又稱輝達）應用深度學習副總裁Bryan Catanzaro在接受採訪時也承認了行業的普遍焦慮：「在我帶領的團隊中，運算成本已經遠遠超過了人員成本。」「吃到飽」退場：企業急拉預算手煞車如果說2026年初冬天各公司還在大啖「AI吃到飽」，那麼夏天就是開始計算卡路里的時候。 Business Insider報導指出，今年二月至六月間，OpenAI、Anthropic和GitHub各自調整了定價模式，相繼從固定費率轉向依據Token使用量向客戶收費。「廉價的『AI吃到飽』時代已經結束，」德勤（Deloitte）的一位資深軟件工程師表示， GitHub定價模式的變更讓工作預期大亂。他估計，在按量計費制下，一個可能讓模型工作數小時的高度詳細提示，單次費用將超過100美元。 GitHub首席產品官Mario Rodriguez解釋，在舊模式下，一個閒聊問題與長達數小時的自主程序碼工作費用相同，這種補貼「已不再可持續」。面對計費規則的突變，企業界迅速改變方向。沃爾瑪對內部程序設計工具設定了使用上限；亞馬遜在5月關閉了內部的「Tokenmaxxing」排行榜，因為他們發現員工為了不必要的操作人為提高得分，導致算力成本無謂上升。部分企業甚至被迫設定了嚴格的配額制度。加密貨幣交易所Coinbase高管指出，自今年二月Claude Opus 4.6推出後，內部使用量呈拋物線式暴增。如今，交易所建立了一套精密的每週費用上限系統，依據員工職級設定從500美元到5000美元不等的上限。他舉了一個極端的例子：若用最先進的模型掃描公司所有程序碼找漏洞，每次可能要花5 萬到10萬美元，「如果有一百人各自獨立這樣做，你就要花上1000萬美元。」科技界的這股焦慮被Priceline IT財務資深總監Chris Reed形容為一場「快克古柯鹼（ crack-cocaine）的成癮疫情」。他直言：「他們讓你先試，讓你上癮，然後你就被綁住了。」投資報酬率的殘酷拷問：高昂消耗「無效燒錢」企業大規模投入AI，為何換不來預期中的產出？《第一財經》的深度調查揭開了企業爭相擁抱AI的另一面。一位科技大廠員工王昊（化名）吐槽：「一個部門二十來人，一個月消耗5萬元Token，什麼也沒搞出來。」這5萬元化作無形的消耗，卻因團隊各自選用不同工具（如開源Hermes Agent或第三方工具），形成了一個個無法串聯的「AI孤島」，最終只能推倒重來。工程營運平台Faros AI執行長Vitaly Gordon分享了一個極端案例：一位技術長發現手下一名工程師在一個月內燒掉了4萬美元的Token，卻不知該制止還是該鼓勵。工程管理平台Jellyfish的研究數據進一步量化了這種矛盾：受代理功能（Agent）的驅動，每位開發者的Token消耗量在九個月內上升了約18.6倍；使用最多Token的工程師生產力大約是低度使用者的兩倍，但他們為此消耗的Token數量卻是後者的10倍。諮詢機構貝恩（Bain）6月發布的報告揭示了殘酷的商業現實：在能夠量化AI降本效果的企業中，高達40%的企業實際成本降幅在10%及以下。原本有37%的企業將降本目標設定在 11%至20%區間，但最終達標的僅有31%。艾媒諮詢CEO張毅分析，許多企業陷入了基於「錯失恐懼（FOMO）」的豪賭，只計算了顯性的API（應用程序編程接口）調用費，卻完全忽視了提示詞工程、輸出校驗、數據治理等龐大的隱性工程成本。算帳時代：精細化管理與「平替模型」的崛起當「魔法思維的時代結束」，務實的功利主義開始主導2026年的夏天，企業高管已開始將 Token浪費視為財務上的不負責任。一場針對AI成本的重新審視正在企業內部悄然展開。《第一財經》獲悉，騰訊近期已調整了員工的Token分配機制，不再「吃大鍋飯」，而是由部門管理者按崗位職能動態分配。騰訊內部表態，衡量AI成效看的是提效與價值，絕不單純看Token消耗量。 Salesforce技術長Parker Harris也指出，由於2026財年的Token支出「遠超」計劃，公司正推出名為「有效產出分數（Effective Output score）」的指標，以預測回報並控制支出。與此同時，尋求更便宜的「平替模型」成為新趨勢。Coinbase在內的企業已開始將基礎工作轉移給中國的輕量級模型。程序碼代理新創公司Command Code透露，因市場對廉價模型的需求激增，其公司在30天內新增了1萬名客戶。軟件新創Harness的資深副總裁Trevor Stuart將這種轉變比喻得十分貼切：「若使用頂尖 AI模型來做基本的文字摘要工作，就像是開法拉利（Ferrari）去買菜。」為了在宏觀層面建立標準，一個全新的市場與規範組織應運而生。Linux基金會宣布於今年7月正式成立「Token經濟（Tokenomics）」基金會，獲得IBM、甲骨文和摩根大通等巨頭支持。 FinOps基金會執行董事J.R. Storment指出，追蹤雲端成本是每月數億行的數據，而追蹤 Token成本則是「每月數兆行數據的問題」。該基金會旨在建立「每單位智能成本」與「每瓦Token數」等新指標，將粗放的AI支出納入如同雲端運算般的財務紀律中。泡沫還是陣痛？算力硬件與代理化未來的博弈面對成本烈火，行業的目光自然投向了下一代硬件。然而，智通財經指出，儘管英偉達收購了芯片新創公司Groq，且AMD、英特爾等均在重新設計AI加速器以降低單次Token成本，但絕大多數硬件要到今年下半年才會發佈，大規模部署緩解供需至少要等到2027年初至中期。遠水難救近火。即使硬件成本最終下降，AI代理的爆發式增長仍可能抵消這些紅利。英偉達執行長黃仁勳曾描繪過「每位員工身旁有100個AI代理協同工作」的宏大願景。高盛（Goldman Sachs）更預測，到2030年，全球Token使用量將暴增24倍，達到每月120千兆（quadrillion）個。然而，研究機構顧能（Gartner）總監分析師Will Sommer警告，雖然到2030年大型語言模型的推論成本將比2025年便宜近90%，但「首席產品官們不應將商品Token的通貨緊縮，與前沿推理的普及化混為一談。」因為代理式模型完成任務所需的Token量遠大於標準模型，消耗量的增速極可能超過單位成本的降速。 2026年的這場Token成本危機是AI泡沫化，還是其商業模式走向成熟的必經陣痛？一位AI公司高管說，當成本攀升的速度壓倒了一切效率提升，擺在產業面前的問題已不再是AI能否改變世界，而是企業如何在技術狂熱與商業現實之間找到平衡。這場「去偽存真」的壓力測試，將決定誰能真正在未來的AI浪潮中生存並獲利。責任編輯：孫芸# 5.完整新聞連結 (或短網址)不可用YAHOO、LINE、MSN等轉載媒體: https://www.epochtimes.com/b5/26/6/11/n14786728.htm 6.備註: -- 現代政治學一般認為，社會權力有三個來源，即暴力、財富和知識。共產黨以壟斷和肆意使用暴力，剝奪人民財產，以及最重要的，剝奪言論和新聞自由，剝奪人民的自由精神和意志，來達到其絕對控制社會權力的目標。 ——《九評共產黨》九評之ㄧ：評共產黨是什麼？ https://www.youtube.com/watch?v=F_s7yi7d6Mk

-- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 59.127.88.134 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1781343014.A.683.html

→ dslite: 員工都在跟AI聊股票 111.243.0.6 06/13 17:31

推 karkkunt: 養套殺106.107.251.135 06/13 17:33

→ cvnn: 軍備競賽你不燒別燒啊 218.172.25.160 06/13 17:33

→ appledick: 養套燒 118.150.75.167 06/13 17:33

推 bradyhau106: 樓下軟體界的 cheap 不怕被取代 114.32.3.97 06/13 17:41

噓 lamborghini: 傻子用最頂deepseek 不就好了？ 60.251.178.235 06/13 17:45

推 hw1: 泡沫要來了 114.136.157.8 06/13 18:00

→ kerokrq: AI胡說八道也能賺大錢 111.71.124.118 06/13 18:30

→ KudanAkito: 要回去用人類了嗎 223.137.74.181 06/13 18:40

→ jaseman: 雲端要怎麼收費還在磨合，使用方最終還是 27.53.42.125 06/13 19:14

→ jaseman: 會追求CP值，要寫軟體的自己架地端比較合 27.53.42.125 06/13 19:14

→ jaseman: 適 27.53.42.125 06/13 19:14

推 sellgd: 台灣維基也是用「詞元」單詞最小分割單位 113.61.227.216 06/14 01:20

→ bndan: AI胡說八道還能過篩去解但token不夠垃圾 39.12.85.139 06/14 09:30

→ bndan: 價基本上整個AI就沒救了跟當初網路一樣 39.12.85.139 06/14 09:30

→ bndan: 不夠便宜手機線上看劇？下載都要1-2小 39.12.85.139 06/14 09:30

→ bndan: 時的年代有人敢夢這種服務？甚至在adsl 39.12.85.139 06/14 09:31

→ bndan: 前有人敢夢「常態」視訊這種服務？ 39.12.85.139 06/14 09:31