跨行業企業正開始對 AI 成本感到擔憂。Uber 在 2026 年 4 月前便耗盡其 AI 編碼預算,Microsoft 在啟用開發者 Claude Code 授權數月後予以撤銷,Priceline 員工表示 Cursor 合約續簽費用上漲 4 至 5 倍。儘管單 token 價格下降,但對 AI 採用率的推動及自主代理的普及導致 token 消耗量持續攀升。許多在 2025 年初大量訂閱服務的公司,現在正努力追蹤支出、削減開銷並評估預算殘骸中的投資回報率。
在此背景下,市場正在形成以滿足企業需求。OpenAI 企業部主管 Alexander Embiricos 指出,對話焦點已從「功能如何」轉變為「支出透明度、審計能力及 token 控制」。Linux Foundation 於本週宣佈成立 Tokenomics Foundation,旨在為 AI token 支出建立與 FinOps 對雲端支出相同的成本紀律。FinOps Foundation 執行董事 J.R. Storment 提到,許多公司在 4 月和 5 月發現 token 預算已超支 3 倍,引發生存危機。
新模型如 Anthropic 的 Claude Opus 4.5、OpenAI 的 GPT-5.1 及 Google 的 Gemini 3 Pro 提升了代理工具效能,但也大幅增加了消耗。有公司因未設定員工使用限制,收到高達 5 億美元的 Claude 帳單。Priceline 的 Chris Reed 形容此情況類似鴉片海洛因流行病,開始對特定群體實施 token 限制。Faros AI 的 Vitaly Gordon 提到,一名工程師單月 token 支出達 4 萬美元,導致管理層難以決定是否應制止。Jellyfish 的研究顯示,使用 token 最多的工程師產出較多,但 token 消耗量是少使用者的 10 倍,且九個月內每人 token 消耗上升 18.6 倍。
追蹤 token 成本被形容為每月數十億行資料的問題,遠超雲端成本追蹤的規模。Pay-i、Paid、Jellyfish、Waydev 及 Faros AI 等公司正提供成本追蹤與 ROI 證明服務。Ramp、Datadog 及 New Relic 也新增相關功能。AWS 預計在 FinOps X 會議上推出