作者createlight (創輝)
看板Gossiping
標題[新聞] 分析:「Token」帳單失控 AI商業化遭重擊
時間Sat Jun 13 17:30:04 2026
1.媒體來源:大紀元
2.記者署名:程木蘭
3.完整新聞標題:
分析:「Token」帳單失控 AI商業化遭重擊
4.完整新聞內文:
【大紀元2026年06月12日訊】(大紀元記者程木蘭綜合報導)2026年,曾經狂飆突進的人
工智能(AI)產業,正遭遇一記沉重的財務重拳。
隨著各大AI模型開發商悄然終結對「Token」(中國稱詞元)調用成本的大幅補貼,一場
由成本激增引發的連鎖反應,正從硅谷科技巨頭蔓延至華爾街的交易大廳,企業與投資者
被迫直面高昂算力成本與實際投資報酬率之間的巨大鴻溝。
據報導,從微軟緊急叫停內部激勵專案,到優步(Uber)的數十億美元預算在短短幾月內
灰飛煙滅,AI的商業化進程正經歷一場嚴峻的「壓力測試」,Token消耗的野蠻增長時代
正宣告終結。
「Token」帳單失控 科技巨頭的財務災難
這輪成本危機的直接導火索,是衡量AI 輸入與輸出的基本單位「Token」價格的急劇攀升
。
今年2月至6月間,OpenAI、Anthropic 和 GitHub各自調整了定價模式,相繼依據Token使
用量向客戶收費,而非沿用固定費率計費。
智通財經6月10日報導指出,過去六個月裡,針對前沿模型的高質量推理服務Token定價已
累計上漲約40%。這背後是高性能GPU的持續受限、數據中心能耗成本15%至20%的上漲,以
及需求端爆炸式增長的共同作用。
以OpenAI為例,近期發布的GPT-5.5直接將Token價格翻倍,達到每百萬輸入Token收費5美
元、輸出收費30美元;Google新推出的Gemini Flash 3.5模型價格也是前代的3至6倍。
儘管模型提供商在一年內實現了約2倍的效率提升,但同期Token的溢價幅度高達40%至50%
,導致依賴外部API的應用型企業淨成本實際暴增了20%至30%。
不期而至的成本高峰率先沖垮了科技巨頭們的內部預算防線。據科技媒體The Verge報導
,微軟在今年5月下旬做出了一項罕見決定:宣布將於6月30日終止其內部「體驗與設備」
部門對Claude Code的集體許可。
該試點項目於2025年12月高調推出,卻因Token消耗量帶來的帳單完全超出預期而迅速崩
盤,微軟不得不強令工程師撤回至使用自家成本更可控的GitHub Copilot CLI。
Uber的遭遇更是一場AI財政災難。其首席技術官Praveen Neppalli Naga近期坦承,
公司
在2026年為AI撥備的34億美元年度預算,竟在今年4月便已全部耗盡。
在向公司5000名工程師推出Claude Code後,月度活躍使用率飆升至85%至95%,每名工程
師的月均API調用成本高達500至2000美元。
華爾街拉響警報 運算成本遠超人員成本
華爾街對此迅速拉響警報。富國銀行首席股票策略師Ohsung Kwon指出,這顆雷的核心正
終結硅谷工程師興起的「Tokenmaxxing(Token消耗最大化)」風潮。
此前許多企業將AI工具的使用量納入內部考核體系,甚至建立排行榜,鼓勵員工儘可能多
地消耗AI Token,以此作為衡量創新能力的指標。然而,這種盲目追求使用率的策略已演
變為嚴重的資源浪費。
Kwon警告,如果AI需求開始趨於平穩,對AI交易而言將是重大的利空。基於此判斷,富國
銀行已將其整體立場從今年4月的「看多」轉向「堅定中性」。
英偉達(Nvidia, 又稱輝達)應用深度學習副總裁Bryan Catanzaro在接受採訪時也承認
了行業的普遍焦慮:「在我帶領的團隊中,
運算成本已經遠遠超過了人員成本。」
「吃到飽」退場:企業急拉預算手煞車
如果說2026年初冬天各公司還在大啖「AI吃到飽」,那麼夏天就是開始計算卡路里的時候
。
Business Insider報導指出,今年二月至六月間,OpenAI、Anthropic和GitHub各自調整
了定價模式,相繼從固定費率轉向依據Token使用量向客戶收費。
「廉價的『AI吃到飽』時代已經結束,」德勤(Deloitte)的一位資深軟件工程師表示,
GitHub定價模式的變更讓工作預期大亂。
他估計,在按量計費制下,一個可能讓模型工作
數小時的高度詳細提示,單次費用將超過100美元。
GitHub首席產品官Mario Rodriguez解釋,在舊模式下,一個閒聊問題與長達數小時的自
主程序碼工作費用相同,這種補貼「已不再可持續」。
面對計費規則的突變,企業界迅速改變方向。沃爾瑪對內部程序設計工具設定了使用上限
;亞馬遜在5月關閉了內部的「Tokenmaxxing」排行榜,因為他們發現員工為了不必要的
操作人為提高得分,導致算力成本無謂上升。
部分企業甚至被迫設定了嚴格的配額制度。加密貨幣交易所Coinbase高管指出,自今年二
月Claude Opus 4.6推出後,內部使用量呈拋物線式暴增。如今,交易所建立了一套精密
的每週費用上限系統,依據員工職級設定從500美元到5000美元不等的上限。
他舉了一個極端的例子:若用最先進的模型掃描公司所有程序碼找漏洞,每次可能要花5
萬到10萬美元,「如果有一百人各自獨立這樣做,你就要花上1000萬美元。」
科技界的這股焦慮被Priceline IT財務資深總監Chris Reed形容為一場「快克古柯鹼(
crack-cocaine)的成癮疫情」。他直言:「他們讓你先試,讓你上癮,然後你就被綁住
了。」
投資報酬率的殘酷拷問:高昂消耗「無效燒錢」
企業大規模投入AI,為何換不來預期中的產出?《第一財經》的深度調查揭開了企業爭相
擁抱AI的另一面。
一位科技大廠員工王昊(化名)吐槽:「一個部門二十來人,一個月消耗5萬元Token,什
麼也沒搞出來。」這5萬元化作無形的消耗,卻因團隊各自選用不同工具(如開源Hermes
Agent或第三方工具),形成了一個個無法串聯的「AI孤島」,最終只能推倒重來。
工程營運平台Faros AI執行長Vitaly Gordon分享了一個極端案例:
一位技術長發現手下
一名工程師在一個月內燒掉了4萬美元的Token,卻不知該制止還是該鼓勵。
工程管理平台Jellyfish的研究數據進一步量化了這種矛盾:受代理功能(Agent)的驅動
,每位開發者的Token消耗量在九個月內上升了約18.6倍;使用最多Token的工程師生產力
大約是低度使用者的兩倍,但他們為此消耗的Token數量卻是後者的10倍。
諮詢機構貝恩(Bain)6月發布的報告揭示了殘酷的商業現實:在能夠量化AI降本效果的
企業中,高達40%的企業實際成本降幅在10%及以下。原本有37%的企業將降本目標設定在
11%至20%區間,但最終達標的僅有31%。
艾媒諮詢CEO張毅分析,許多企業陷入了基於「錯失恐懼(FOMO)」的豪賭,只計算了顯
性的API(應用程序編程接口)調用費,卻完全忽視了提示詞工程、輸出校驗、數據治理
等龐大的隱性工程成本。
算帳時代:精細化管理與「平替模型」的崛起
當「魔法思維的時代結束」,務實的功利主義開始主導2026年的夏天,企業高管已開始將
Token浪費視為財務上的不負責任。
一場針對AI成本的重新審視正在企業內部悄然展開。
《第一財經》獲悉,騰訊近期已調整了員工的Token分配機制,不再「吃大鍋飯」,而是
由部門管理者按崗位職能動態分配。騰訊內部表態,衡量AI成效看的是提效與價值,絕不
單純看Token消耗量。
Salesforce技術長Parker Harris也指出,由於2026財年的Token支出「遠超」計劃,公司
正推出名為「有效產出分數(Effective Output score)」的指標,以預測回報並控制支
出。
與此同時,尋求更便宜的「平替模型」成為新趨勢。Coinbase在內的企業已開始將基礎工
作轉移給中國的輕量級模型。程序碼代理新創公司Command Code透露,因市場對廉價模型
的需求激增,其公司在30天內新增了1萬名客戶。
軟件新創Harness的資深副總裁Trevor Stuart將這種轉變比喻得十分貼切:「若使用頂尖
AI模型來做基本的文字摘要工作,就像是開法拉利(Ferrari)去買菜。」
為了在宏觀層面建立標準,一個全新的市場與規範組織應運而生。Linux基金會宣布於今
年7月正式成立「Token經濟(Tokenomics)」基金會,獲得IBM、甲骨文和摩根大通等巨
頭支持。
FinOps基金會執行董事J.R. Storment指出,追蹤雲端成本是每月數億行的數據,而追蹤
Token成本則是「每月數兆行數據的問題」。該基金會旨在建立「每單位智能成本」與「
每瓦Token數」等新指標,將粗放的AI支出納入如同雲端運算般的財務紀律中。
泡沫還是陣痛?算力硬件與代理化未來的博弈
面對成本烈火,行業的目光自然投向了下一代硬件。然而,智通財經指出,儘管英偉達收
購了芯片新創公司Groq,且AMD、英特爾等均在重新設計AI加速器以降低單次Token成本,
但絕大多數硬件要到今年下半年才會發佈,大規模部署緩解供需至少要等到2027年初至中
期。遠水難救近火。
即使硬件成本最終下降,AI代理的爆發式增長仍可能抵消這些紅利。英偉達執行長黃仁勳
曾描繪過「每位員工身旁有100個AI代理協同工作」的宏大願景。高盛(Goldman Sachs)
更預測,到2030年,全球Token使用量將暴增24倍,達到每月120千兆(quadrillion)個
。
然而,研究機構顧能(Gartner)總監分析師Will Sommer警告,雖然到2030年大型語言模
型的推論成本將比2025年便宜近90%,但「首席產品官們不應將商品Token的通貨緊縮,與
前沿推理的普及化混為一談。」因為代理式模型完成任務所需的Token量遠大於標準模型
,消耗量的增速極可能超過單位成本的降速。
2026年的這場Token成本危機是AI泡沫化,還是其商業模式走向成熟的必經陣痛?
一位AI公司高管說,當成本攀升的速度壓倒了一切效率提升,擺在產業面前的問題已不再
是AI能否改變世界,而是企業如何在技術狂熱與商業現實之間找到平衡。
這場「去偽存真」的壓力測試,將決定誰能真正在未來的AI浪潮中生存並獲利。
責任編輯:孫芸#
5.完整新聞連結 (或短網址)不可用YAHOO、LINE、MSN等轉載媒體:
https://www.epochtimes.com/b5/26/6/11/n14786728.htm
6.備註:
--
現代政治學一般認為,社會權力有三個來源,即暴力、財富和知識。
共產黨以壟斷和肆意使用暴力,剝奪人民財產,以及最重要的,剝奪言論和新聞自由,
剝奪人民的自由精神和意志,來達到其絕對控制社會權力的目標。
——《九評共產黨》九評之ㄧ:評共產黨是什麼?
https://www.youtube.com/watch?v=F_s7yi7d6Mk
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 59.127.88.134 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1781343014.A.683.html
→ dslite: 員工都在跟AI聊股票 111.243.0.6 06/13 17:31
推 karkkunt: 養套殺106.107.251.135 06/13 17:33
→ cvnn: 軍備競賽 你不燒 別燒啊 218.172.25.160 06/13 17:33
→ appledick: 養套燒 118.150.75.167 06/13 17:33
推 bradyhau106: 樓下軟體界的 cheap 不怕被取代 114.32.3.97 06/13 17:41
噓 lamborghini: 傻子 用最頂deepseek 不就好了? 60.251.178.235 06/13 17:45
推 hw1: 泡沫要來了 114.136.157.8 06/13 18:00
→ kerokrq: AI胡說八道也能賺大錢 111.71.124.118 06/13 18:30
→ KudanAkito: 要回去用人類了嗎 223.137.74.181 06/13 18:40
→ jaseman: 雲端要怎麼收費還在磨合,使用方最終還是 27.53.42.125 06/13 19:14
→ jaseman: 會追求CP值,要寫軟體的自己架地端比較合 27.53.42.125 06/13 19:14
→ jaseman: 適 27.53.42.125 06/13 19:14
推 sellgd: 台灣維基也是用「詞元」 單詞最小分割單位 113.61.227.216 06/14 01:20
→ bndan: AI胡說八道還能過篩去解 但token不夠垃圾 39.12.85.139 06/14 09:30
→ bndan: 價 基本上整個AI就沒救了 跟當初網路一樣 39.12.85.139 06/14 09:30
→ bndan: 不夠便宜 手機線上看劇? 下載都要1-2小 39.12.85.139 06/14 09:30
→ bndan: 時的年代 有人敢夢這種服務? 甚至在adsl 39.12.85.139 06/14 09:31
→ bndan: 前有人敢夢「常態」視訊這種服務? 39.12.85.139 06/14 09:31