PC加拿大(中国) 老黄的Token经济学翻车了!微软亚马逊通通跳车

henry 发自 凹非寺量子位 | 公众号 QbitAI
Token经济学,可能并不经济。
(除了AAAAA显卡黄总)
最近,Axios爆出一个挺逆天的事儿:一家企业,一个月就烧掉了5亿好意思元的Claude账单,合东谈主民币34亿元。

原因嘛,即是雇主给职工通畅了Anthropic的企业授权之后,忘了竖立用量上限,然后token就一直烧烧烧……
烧了一个月,34个小方向就这样水汪汪地出去了。
咱先不说烧得值不值,要是按Anthropic目下约470亿好意思元的年化收入(ARR)谋划,荒谬于这一家公司,一个月就孝顺了Anthropic接近八分之一的月收入
换句话说,Anthropic每赚8块钱,其中就有1块来自这家公司。
更夸张的是,这家公司于今莫得公开身份。
但Axios在报谈里提到,好像“无痛”吞下5亿好意思元AI账单的企业,全球其实也没几许家。
很快,X上驱动出现各式预计,其中被点名最多的是。

巧的是,就在险些归拢时期,《金融时报》败露,亚马逊照旧取消里面AI使用名次榜,因为职工驱动为了冲榜而跋扈刷Token,甚而引申多量莫得执行价值的任务。
开云2026世界杯官方授权平台这一前一后两条新闻放在一齐看,滋味就有点不一样了。
以前两年,企业最惦念的是职工无谓AI。而当今,越来越多企业驱动惦念另一件事:
AI是不是用得太多了。
好意思国大厂,驱动算账了
这种变化,最近正在越来越时常地出现。
微软即是一个典型例子。
最近,微软晓喻将在6月30日之前取消Experiences + Devices部门(负责Windows、Microsoft 365、Outlook、Teams、Surface)的大部分Claude Code授权,工程师们被条目搬动到自家的GitHub Copilot CLI。

而Claude Code参加微软里面,距离当今不外6个月。
微软给出的根由很适应硅谷传统——
Claude Code照旧完成了匡助团队学习和探索的阶段,是时候回到“Eat Your Own Dog Food”,使用我方的居品了。
但无论怎样,Token账单皆是绕不开的话题。
访佛的变化,也出当今DeepSeek身上。
本年4月发布V4时,DeepSeek在时间讲述里提到,V4照旧成为公司里面职工通常使用的Agentic Coding模子,体验优于Claude Sonnet 4.5,委用质地接近Opus 4.6。
固然官方莫得明确说起资本要素,但对于领有自研模子的公司来说,用我方的模子完成通常的责任,剖析是一个更经济的聘用。
要是说微软和DeepSeek还算委婉客气,那么Uber则说得愈加径直。
Uber CTO Praveen Neppalli Naga本年早些时候表现,公司工程师仅用4个月就烧完毕全年Claude Code预算。

随后,Uber首席运营官Andrew Macdonald公开默示:AI Token构陷与最终发布的有价值居品之间,似乎并不存在显然的线性磋磨。
换句话说,PC加拿大(中国)花掉更多Token,并不一定意味着创造出更多价值。

访佛的反念念,也驱动出当今更多公司里面。
此前,多邻国曾规划将AI使用情况纳入职工绩效阅览。但在职工质疑“是否必须为了使用AI而使用AI”之后,公司最终撤离了这一决定。
“嗅觉咱们不是在为执行末端负责,而是在试图强推一些并不老是适应的东西。”
本年4月的一档播客中,多邻国CEO路易斯·冯·安如斯回来。
Meta的变化则更具代表性。
在被曝出里面确立Claude使用名次榜、单月构陷数十亿Token后,Meta也冉冉驱动收紧磋磨激勉,从饱读舞“多用、多刷”,转向更饶恕执行产出。
与此同期,国内也出现了访佛声息。
米哈游郑星河曾共享过一次阅历:某个Agent名目上线后,一晚上烧掉了200万元Token用度。
这笔膏火不算低廉。但它也让越来越多企业意志到一个问题:Token自身并不是价值,完成任务、委用居品、创造收入,才是价值。
不错说,企业依然信服AI,仅仅比拟前年,它们驱动不再单纯追求构陷更多Token,而是驱动精良谋划每一个Token背后的ROI。
AI第一次酿成了财务问题
毫无疑问,在阅历了泰半年的“黄氏Token经济学”之后,好意思国大厂驱动精良反念念:
这些Token,到底花得值不值?
本年3月,在《All-In Podcast》中曾为这套逻辑公开背书。
要是一个年薪50万好意思元的工程师每年构陷的token不到25万好意思元,他会深感担忧。
在那时,这句话被许多企业奉为门径。
毕竟,要是AI真实能种植工程师成果,那么多烧一些Token,实质上是在购买分娩力。
用的越多,省得越多即是这样来的。
但问题在于:当一张张着实账单驱动寄到企业手里时,事情驱动变得没那么浮浅。
无论是Amazon取消名次榜,微软放松Claude Code授权,如故Uber发现工程师4个月烧光全年预算。
雇主们最终如故聘用了用脚投票。
最近,对于这件事的盘问也驱动在Hacker News上发酵。
有东谈主以为,这是一个进攻转机点。
以前那种把Token构陷量等同于AI继承率、甚而等同于分娩力的狂热阶段,正在达成。

也有东谈主把锋芒径直指向了以前半年流行的“Tokenmaxxing”文化。
(注:Token是大说话模子处理文本的基本单元,亦然计费单元。Tokenmaxxing指的是企业和职工跋扈追求token构陷量,把“烧了几许token”当成AI继承率和分娩力的预计狡计。)
在他们看来,问题并不在于AI,而在于企业把“烧更多Token”误当成了方向自身。
要是使用更高效的模子、合理范围Agent责任流,或者让东谈主类参与关键决议,资本本不错低得多。

天然,也有东谈主开打趣说:
这场通顺最大的赢家,重新到尾可能只好黄仁勋。

不外,另一种不雅点通常值得饶恕。
不少诱骗者以为,这并不是AI抖擞退去的信号。
刚巧相背。
这意味着企业终于驱动从“先用再说”,参加“密致运营”的阶段。

明天全球饶恕的重心,可能不再是谁烧掉更多Token,而是谁能用更少的Token完成更多任务。
比如:更高效的Agent责任流;低价模子处理浮浅任务;不菲模子只负责关键决议;更严格的预算和权限解决。

[1]https://www.tomshardware.com/tech-industry/artificial-intelligence/mystery-company-accidentally-blew-usd500-million-on-claude-in-a-single-month-failed-to-put-usage-limit-on-licenses-for-employees
[2]https://www.axios.com/2026/05/28/ai-spending-roi-enterprise-costs
[3]https://news.ycombinator.com/item?id=48307098