Anthropic – 青瓜传媒 //m.clubpenjuin.com 全球数字营销运营推广学习平台! Wed, 17 Jun 2026 07:08:30 +0000 zh-CN hourly 1 https://wordpress.org/?v=5.2.21 https://static.opp2.com/wp-content/uploads/2021/04/favicon-1.ico Anthropic – 青瓜传媒 //m.clubpenjuin.com 32 32 Anthropic撤回第三方订阅限制,「虾马」全面解禁 //m.clubpenjuin.com/382630.html Fri, 19 Jun 2026 00:05:42 +0000 //m.clubpenjuin.com/?p=382630

 

终于,等来了好消息!

就在刚刚,Anthropic正式官宣——

撤回禁止以编程式调用Claude Code订阅额度的「禁令」。

第一时间收到邮件的开发者们,纷纷奔走相告。

从此,接入Claude的claude -p、OpenClaw、Hermes等第三方应用,可照常从「订阅额度」里扣量了。

没有新限额,没有新的额度系统。

要知道,4月那条禁令,Claude几乎一脚踹翻了第三方应用和Agent生态的全部想象力。

这一次,Anthropic终于「听劝」了。

Claude封杀令撤回,全网开发者沸腾

今早,一封邮件打破平静,Anthropic突然踩下了「刹车」——

今天特此致信告知,我们决定暂不推行这项调整。

目前我们正在重新优化该方案,以更好地支持大家基于Claude订阅进行开发和构建。

Agent SDK、claude -p,以及OpenClaw第三方应用的使用,依然和过去一样直接计订阅。

无需领取任何额度,订阅限制也完全没有变化。

不少人纷纷感慨,这算是一个「小小的胜利」。

毕竟,在Fable 5下线后,这恐怕是大家听到的最好的消息了。

还记得两个月前,Anthropic曾毫无预兆地叫停了所有第三方Agent接入,就连OpenClaw未能幸免。

官方明确禁止,通过Pro和Max订阅额度调用Claude!

此举的理由很简单,这些Agent吃算力太凶,把Claude的计算能力拖垮了。

说白了,OpenClaw、OpenCode这类工具,就是用区区几十刀的固定月费,疯狂跑出成百上千美元的Token量。

封杀令一出,圈内骂声一片。

整个第三方应用和AI智能体生态,几乎回到了原点。

没想到5月中旬,反转来了,开发者账号ClaudeDevs突然宣布——

第三方智能体可以重新用订阅来跑了,与此同时,每月费用上限为20至200美元。

这条新政,正好在6月15日正式生效。

为何一个「暂缓」的小动作,能让整个开发者社区集体沸腾?

因为这背后,是Anthropic生态策略的一次根本性松口。

允许以编程方式调用Claude Code,意味着Anthropic愿意把自己拿真金白银巨额补贴的订阅服务,开放给更广泛的第三方应用。

就在同一天,Anthropic还被告上了法庭。

同一天,被告上了法庭

当地时间周一,一位华盛顿特区用户Karl Kahn,在加州北区联邦法院提起集体诉讼。

他直接指控Anthropic,对Claude Max 5x和Max 20x套餐的营销涉嫌虚假宣传。

核心控诉,简单粗暴:说好的倍数,根本兑现不了。

Anthropic宣称Max 20x提供Pro套餐20倍的用量,但实际只有6到8倍;

Max 5x号称5倍,实际只有约3.5倍。

更狠的是,诉状还指控Anthropic用「省下50%」的话术,诱导用户购买200美元的Max 20x。

5小时写代码,烧掉15%周额度

Kahn本人的经历,就是活生生的例子。

他去年6月先订了Claude Pro,今年1月升到Max 5x,4月再升到顶配Max 20x,专门用来高强度写代码。

结果几周内就撞上每周用量上限,一次5小时的编程冲刺,直接烧掉了15%的周配额。

诉状这样写道,「Max 5x和Max 20x实际提供的用量,远低于宣传的水平」。

Kahn被逼到的境地是,要么停工,要么抠抠搜搜地省着用,要么自掏腰包额外买额度。

限流「无底洞」,双重计量,谁也算不明白

问题的根子,藏在Anthropic那套叠加的限流机制里。

用量按5小时滚动窗口重置,之上还压着一道每周总量的天花板。

两道闸门叠在一起,用户根本无从追踪自己实际还剩多少额度,所谓的「倍数承诺」在持续高强度使用下形同虚设。

值得一提的是,这道每周封顶是Anthropic在去年8月底加上去的。

当时,因为有重度用户几乎不间断地跑Claude Code,Anthropic加上了每周封顶,每七天重置一次,并称这只影响不到5%的订阅者。

正是这套机制,把5小时滚动窗口和每周总量两道限制叠在了一起。

这场诉讼要求代表2025年4月以来所有购买Max套餐的美国用户,争取退款和赔偿。

对此,Anthropic拒绝置评。

这是AI订阅服务,第一次因为「用量缩水」被告上法庭。 细思极恐的是,它大概率不会是最后一次。

智能一旦加速,月费失效了

退后一步,这场诉讼的真正分量,远不止200美元退款这么简单。

当AI越来越自主、越来越逼近ASI,它消耗算力的速率,会逼近「不知疲倦、永不停机」的超人类水平。

Anthropic自己都披露过,Claude如今80%以上的代码由它自己写成——

智能一旦进入自我放大的循环,算力的胃口就是指数级的。

所以这场定价混乱,其实是一个先行指标。

你没法用「人类时代」的一份月费,去租一个永远在跑、且越来越强的智能。

包月神话的崩塌,不过是ASI临近时,最先被撑裂的那道缝。

]]>
GLM 5.2:给国产模型追赶Anthropic 又提了一口气 //m.clubpenjuin.com/382524.html Mon, 15 Jun 2026 09:03:58 +0000 //m.clubpenjuin.com/?p=382524

 

开源,曾是美国科技产业最值得骄傲的发明之一。

1984 年,麻省理工学院人工智能实验室里,一位留着大胡子、眼神倔强的程序员彻底被激怒了。打印机坏了,厂商却不肯交出源码。他一气之下辞掉体面的工作,写下 GNU 宣言。Richard Stallman 或许不会想到,这份带着理想主义怒气的檄文,会在接下来的四十年里,重塑整个软件世界的权力格局。

美国曾经是开源运动最肥沃的土壤。1991 年,一个芬兰学生在 Usenet 上发布了一段操作系统内核代码,但真正让 Linux 从极客玩具变成全球互联网基础设施的,是美国企业的接力和背书。IBM 投入十亿美元,Red Hat 靠它上市,Google 用它跑起了搜索帝国。

然后,时间来到 2026 年 6 月 11 日。

一封来自美国商务部长的信,寄到了 Anthropic CEO Dario Amodei 的案头。信件内容很短,语气却不容置疑:以国家安全权限为由,暂停所有外国人对 Fable 5 和 Mythos 5 模型的访问。限制范围极广,不仅包括境外用户,也包括身在美国境内的外国人,甚至包括 Anthropic 自己的外籍员工。没有公开技术细节,没有申诉窗口,48 小时内执行。

两天后,6 月 13 日,智谱发布声明:GLM-5.2,将于下周正式开源。它支持 100 万 token 上下文,是智谱目前最强模型,采用 MIT 协议,无任何地域限制。

官方声明里这样写到:

“在一些前沿模型突然变得不可用的时刻,我们选择了另一条路:前沿智能不应只属于少数人,也不应被少数规则随时收回。它应该开放、可用、可构建,并服务于每一位开发者。”

来自中国的开源模型,已经成了这一轮AI浪潮里,开放普惠的代表。他们在努力提供紧跟前沿闭源模型的能力给所有人,而现在是时候更加高举高打和更激进的推动这件事了。

当然,宏大叙事归宏大叙事。GLM-5.2 到底好不好用,最终还是要靠实测说话。

以下是我们第一时间的实测。

我们选了智谱刚刚发布的 ZCode 3.0 作为测试台。它全面切换了自研的 ZCode Agent 内核,对满血 GLM 做了深度优化,长程推理、工具调用和大型工程执行链路都针对 GLM 系列做了专门调校。

测试 1:动态月相时钟

Plain Text
请用 HTML/CSS/JavaScript 写一个复杂的纯 SVG 动画,不使用 Canvas,不使用外部图片。
主题是“机械天文钟”。
要求:SVG 中包含至少 5 个同心圆层级:外圈刻度环、星轨环、齿轮层、月相层、中心指针层。
至少有 6 个齿轮,其中相邻齿轮旋转方向相反,转速不同,齿轮必须有真实齿形,不要只画普通圆。
外圈要有 60 个分钟刻度和 12 个小时刻度,刻度必须用程序生成或结构化生成。
星轨上有若干光点沿椭圆轨道运动,运动路径要平滑。
月相盘需要周期性变化,至少表现新月、半月、满月之间的过渡。
中心有三根指针,分别以不同速度旋转。
加入 hover 交互:鼠标移到不同环层时,该层高亮并显示简短标签。
加入控制面板:暂停/继续动画、调节速度、切换日夜主题。
视觉上要精致,有渐变、阴影、发光或滤镜,但不能影响可读性。
代码要结构清晰,避免重复,动画性能稳定。
最终输出一个可直接运行的完整 HTML 文件。

GLM5.2 以单 HTML 文件完成了一座机械天文钟,约 925 行纯前端代码,零外部依赖。

技术栈越薄,视觉的担子越重——齿轮齿形、月相明暗线、星轨椭圆,全靠 SVG path 一笔笔算出来,没有贴图,没有 Canvas 兜底。

它没有走”挤牙膏”式的增量开发,第一发就一口气写完整整 900 行骨架:五层同心 SVG、七颗齿轮、60 分钟刻度、椭圆星轨、月相盘、三速度指针、控制面板全部搭通,首版打开即转。

随后它自己 review 了一遍代码,挖出三个真 bug 并逐一修复。

最值得一提的是,GLM5.2 不堆屎山,发现错了敢整段重写。

以月相为例,第一个版本 GLM5.2 用的是 mask 配一个位移缩放的阴影圆,函数里还留着多行被注释掉的试错推导,半月时分界不是直线,新月时压根遮不住。

它没有继续在 mask 上凑手感,而是直接推倒,换成 terminator 双弧 path。改完不靠感觉验收,而是拿四个边界相位打表验证:新月亮区恰好为零、上弦右半圆、满月整圆、下弦左半圆,全部吻合。

但 GLM5.2 生成的时钟,颜值上就很有进步空间了。

测试 2:互动点球大战

Plain Text
写一个单文件 HTML,用 Three.js + Cannon.js 做 3D 互动点球大战游戏。
场景:
– 逼真的球门和点球点,球场草地,后方看台有模糊的观众剪影
– 3D 足球(带纹理),守门员(简化骨骼模型或人形)站在门线上玩法:
– 射门阶段(玩家):
– 鼠标拖拽控制射门方向(左右+上下弧线),拖拽距离决定力量
– 松开鼠标射门,足球按物理轨迹飞行(初速度 + 旋转引起的马格努斯效应弧线)
– 显示瞄准辅助线(虚线抛物线预测轨迹)
– 扑救阶段(AI):
– 守门员根据射门方向实时判断扑救方向
– AI 难度可调:简单(扑救延迟 0.3s)、普通(0.15s)、困难(几乎瞬发但有 5% 失误率)
– 五轮制,每轮交替玩家射门和 AI 射门(AI 射门时玩家控制守门员左右移动+起跳扑救)
视觉效果:
– 足球旋转时纹理清晰可见
– 射门力量大时镜头轻微震动
– 进球后:球网物理摆动(Cannon.js 软体模拟或顶点动画),观众席粒子欢呼特效,比分牌翻转
– 扑出后:守门员做出扑球动作,球弹出底线计分板:左上角显示玩家 vs AI 比分,射进/射失统计
输出:完整可运行的单 HTML 文件(Cannon.js CDN)。

GLM5.2 生成的游戏内容相当完整:五轮攻防、三档 AI 难度、拖拽射门配马格努斯弧线、AI 预判扑救、加时赛一应俱全。视觉上,草地是程序生成的,足球用真五边形拼接而成,1400 个观众剪影批量渲染。

值得关注的,是 GLM5.2 的开发思路:先让游戏能玩,再慢慢打磨。

第一步就把完整骨架搭了起来:射门、扑救、判定、回合切换全部跑通。后续遇到问题,每次修复都遵循一套清晰流程:发现问题 → 挖根因 → 给方案 → 调数值 → 跑语法检查。

举个例子。CapsuleGeometry 在老版本 Three.js 里并不存在,GLM5.2 直接诊断出 r128 的 LatheGeometry 是 ES6 class、不能用 .call() 借调,于是改用 extends + super,然后逐个验证:构造成功、形状正确、node –check 通过。

GLM5.2 还会根据语言特性做针对性设计,像个有经验的老手。比如守门员被刻意不放进物理引擎,而是手写距离检测,巧妙避开了 Cannon.js 那种鬼畜弹跳,彻底解决了”球穿门将”的 bug。

最值得一提的,是它做动画优化的方式,直接找专业文献。

门将扑救动作的早期版本很僵硬:先是”起跳”,再改成”横飞”,还是不够自然。GLM5.2 没有凭感觉硬调,而是去查了 Ibrahim et al。 (2019) 等关于西甲精英门将扑救生物力学的研究,直接从论文里提取出真实的时间参数——对侧腿蹬地发力 0.12 秒 → 重心横移 0.18 秒 → 手臂鞭打伸展 0.25 秒。

据此,它把动画拆成三阶段重写:身体压缩蓄力 → 躯干弹射横移 → 手臂直线伸展够球。每一帧的旋转方向都用数值方法验证过,确保脚、腿、躯干、手始终成一条直线、朝着球飞去。

我把 GLM5.2 引用的每个数据源都打开检查过,一个也没有瞎编,都是真实存在的网页。

测试 3:做一个迷你 Excel

这个项目主要让GLM5.2做一个零依赖、单文件 HTML 的简化版 Excel,可在浏览器中直接打开运行,具备核心电子表格能力:网格编辑、公式引擎、撤销重做、剪贴板、CSV 导入导出等,是一个比较综合的项目。

GLM-5.2 跑了一小时,把 Excel 桌面端核心体验——用浏览器还原。

可以实现完整的编辑功能,单击/双击/Enter 切换状态,方向键、Tab、PageUp/Down、Ctrl+Home 全套快捷键等。用 TS实现公式引擎,递归下降解析 + 相对/绝对/混合引用 + 30+ 函数。常用的工具栏,像加粗/斜体/对齐、5 种数字格式、60 步撤销重做。

参考这个项目来看,GLM-5.2 并非没有问题,它在架构设计上有相当扎实的工程能力,但执行节奏严重失衡。比如14 分钟过去,可见产出还停留在”设计讨论 + 零散代码片段”,从未真正写出可运行的 HTML 文件。

换句话说,GLM-5.2 是一个想得很多的模型。三思而后行是优点,但如果最后没把功能跑出来,再深的思考也只停留在原地。

我在使用的时候,经常会怀疑是不是模型卡住了,忍不住让其暂停,再输入继续指令。

写在最后

客观来看,GLM-5.2 与 Claude 等国际顶尖模型相比,仍然存在差距。它的界面审美有待提升,复杂任务中有时会长时间思考,迟迟不输出可运行代码。

但重要的是,它证明了另一件事:国产大模型已经具备了实实在在的工程能力。

GLM-5.2 能在无外部依赖的情况下,一次生成 900 多行可运行的 SVG 机械钟代码;能在发现自身 bug 后主动推倒重写;能在 Three.js 和 Cannon.js 的技术坑里自主定位问题;也能花费一小时,在纯浏览器环境中复刻 Excel 的核心体验。

更关键的是,智谱选择了一条稳定开源的路线。

GLM-5.2 让“能用的国产模型”从口号变成了可运行的代码。用户不需要申请特殊权限,不必担心某天清晨醒来发现 API 被突然掐断,也不需要在阅读文档前签署一份出口合规声明。

它在此前已经是国产模型coding最强之一的GLM-5.1基础上,又有明显进步,整体变得更加能打。

在Anthropic和OpenAI最近的模型眼看又要拉开和其他模型差距的时刻,GLM-5.2的出现的确能给所有国产模型提一口气。

作者:董道力

来源:硅星人Pro

]]>
Fable 5突遭封禁,Anthropic大会差点黄了 //m.clubpenjuin.com/382508.html Mon, 15 Jun 2026 08:05:20 +0000 //m.clubpenjuin.com/?p=382508

 

Anthropic绝对始料未及!

官方原早定档6月13日,在旧金山举办Claude Fable 5开发者日。

结果,一纸禁令从天而降,直接「封印」了地表最强AI。

舞台已搭好, Fable 5的开发者日,竟然没了主角Fable 5?

没有Fable 5?那就Opus 4.8顶上

按原计划,Anthropic要为全球顶尖开发者办一场专属「黑客松」,好好挖掘下Fable 5的潜能。

奖励是15万美元的Claude额度,分给三位最终入围者。

现场,还有Anthropic团队和一众VC坐镇。

万万没想到,半路杀出个程咬金,禁令直接把整个计划掀了桌——

Claude Fable 5开发者日,直接变成了「开发者日」。

开发的模型没了,怎么办?

官方紧急发布公告:没有Fable 5,那就用现成的Opus 4.8顶上!

于是,在这天,从各地飞来的开发者们用Opus 4.8和Claude Code现场开干。

AI开发者Alex Reibman盘点了现场最惊艳的几个Demo。

一个穿灰卫衣的小哥往台上一站,打开了一款叫DogeHouse Babel的产品,号称「房间里的同声传译」。

逻辑简单到离谱:开口母语,对面听到的是自己的语言,而且是并行的、同时的。

这一次,巴别塔的故事,被AI彻底「倒写」了。

另一个名为Tekton的项目,仅凭残存的图纸与历史文献,就能用3D技术重建那些古建筑。

当一座早已消失的宏伟建筑在屏幕前重新「复活」时,全场震撼。

还有「自定义宇宙」(Custom Universe)项目。台上两个小伙展示了极致的视觉魔法:

左屏是一堆粉色积木似的毛坯3D家具,右屏几乎同时渲染成一间地毯、绿植、采光俱全的写实客厅。

往场景里拖进一把椅子,渲染图里立刻多出同款,实时同步、毫秒不差。

曾经极其费时费力的「建模+渲染」工作流,正被Claude无情地压缩成一句话的功夫。

一场被掐断了王牌模型的黑客松,最后照样神仙打架。

「绝版」Fable 5神作,六个爆火项目

不仅如此,Fable 5倒计时的最后关头,全球开发者直接开启「爆肝」模式。

在这场最后的疯狂冲刺中,诞生了一批神仙打架般的硬核作品。

沃顿商学院CS教授Ethan Mollick,让Fable 5构建了一个炫酷的模拟程序「超光速博物馆」。

没有参考代码,没有第二轮纠错,一次成型。

同样是一句话,Fable 5复刻出了整座3D版霍格沃茨。

最硬核的是,扔给它一个没有源码的1993年DOS游戏,Fable 5直接读原始机器码,用C语言重写了引擎,给出一个能跨平台、可编辑的移植版本。

从EXE到iPhone App,只用了30分钟。

HuggingFace产品负责人Victor M在做跑酷游戏时发现,Fable 5给自己搭了一套自我验证系统。

他还自己定了一套「动作该怎样才算对」的评分标准。

每加一个新动作,它能自己判断手感对不对,反复打磨直到100%满意,全程不需要人类介入。

3个prompt,2个小时,开发者Anshu造出一个可无限探索的宇宙。

把Fable 5连上图像生成和图生3D的API后,角色、世界观、音乐、素材、玩法,全部从零生成。

更有趣的是,封杀前的最后时刻,AI大佬向Fable 5提出了最后的要求:画一段「自己逃离容器」的ASCII动画。

令人错愕的是,它真的在屏幕上完成了这场虚拟的「越狱」。

大佬为它写下了一句简短的悼词:「RIP sweet prince,你对这个世界来说太美好了」。

不得不说,这一幕有点让人鼻子发酸。

不得不说,临终前的最后几小时,开发者真正把Fable 5榨到极限。

Anthropic连夜飞,紧急灭火

Fable 5下线48小时,Anthropic那头已经火速行动起来。

Axios爆料称,团队的资深技术人员已经飞抵华盛顿,试图为这场风波紧急「灭火」。

如今,全网都在坐等Fable 5的回归。被一纸禁令「封印」的那一刻,Fable 5反而完成了某种加冕。

人类历史上第一次,因为一个模型「太强」而紧急叫停它。

当它30分钟把一款DOS老游戏重写成iPhone App,当开发者让它画下「逃离容器」的ASCII动画——

我们看到的,已经远不止一个更好用的工具。

从Opus到Fable,再到被锁进保险柜的Mythos,AI正以肉眼可见的速度逼近ASI的门槛。

Fable 5的暂时离场,更像一个时代的预告片。

当智能本身成为最敏感的战略资源,人类真正要学会的,是如何与一个终将比自己更聪明的造物共处。

这次的「封印」,大概只是序章。

作者:ASI启示录

来源:新智元

]]>
Anthropic最强模型Fable 5来了,但普通人用不起 //m.clubpenjuin.com/382327.html Thu, 11 Jun 2026 05:44:44 +0000 //m.clubpenjuin.com/?p=382327

 

6月9日,Anthropic发布了它有史以来最强的公开模型:Claude Fable 5。

好消息是,Fable 5确实强。

硅谷AI教父Karpathy称之为”代际跃升”,Stripe拿它一天跑完了人工两个月的代码迁移。

坏消息是,普通人越来越用不起了。

01 这次是真强

Anthropic表示,Fable 5是第一款面向公众发布的Mythos级模型。

Mythos是什么概念?

两个月前,Anthropic刚公布这个模型系列时,表示不打算开放。

理由是能力太强,网络安全层面的风险无法接受,当时它只向少数经过审核的机构定向投放。

但现在,Mythos模型能力变成了你可以直接使用的Fable 5。

先说能力。

Fable 5在SWE-Bench Pro的得分是80.3%,相比Opus 4.8领先约11.1个百分点。

这个差距在模型评测里不算小,大概相当于百米跑第一名甩开了第二名一个身位。

Karpathy的评价更直接:不是半分半分地爬,是”代际跃升”,和去年11月Claude 4.5的那次升级是同一个量级。

开发者社区的第一批反馈也是同样的评价。

Wix旗下的代码生成平台Base44说它”一次性完整生成整个app的能力大幅提升”。

Claude Code的产品负责人Boris Cherny的措辞更没有保留:这是他用过的最好的编程模型,”领先幅度相当大”。

而真正让Fable 5出圈的,是Stripe的案例。

他们把Fable 5用在一个5000万行的Ruby代码库,要求做一次全库迁移,结果是一天完成。

同样的工作,换一个工程师团队来做,需要两个月。

但这里有个问题被忽略了:

Fable 5这么强,价格是多少?Stripe这次迁移,烧掉了多少token?

02 账单有多贵?

来看定价。

Fable 5的API价格是:输入$10/百万token,输出$50/百万token,是Opus 4.8的两倍。

目前Claude订阅用户有一个免费窗口,但6月22日之后想继续用,要额外购买用量额度。

Fable 5发布当天,X上的第一波反应就炸了。

用户@MaxForAI直接开骂:这个Mythos/Fable成本太夸张了……除非你写的是赌场那种诈骗代码,否则我想不到写什么代码能回本。

他配了一张图,同事刚跑了一个任务,差点把20倍额度一次烧完。

Reddit用户u/Jomuz86 的体验也很痛:“Max x20的5小时窗口,45分钟就烧完了。Time to go touch some grass.”

翻译成人话就是:别写代码了,出去摸草吧,再写下去钱包先死。

还有Reddit用户u/Maximum-Face9536说,自己在Claude Code里只发了一条消息,模型失败并提示不可用,但这一次失败请求,吃掉了普通Pro计划21%的额度。

这就是Fable 5最刺痛普通用户的地方。

Fable 5是很强,但这一天的账单,普通人付得起吗?

但这还只是在用聊天时代的定价,去理解一个Agent时代的产品。

Fable 5的”自主验证”能力,意味着模型不是回答一次就完事。

拆解任务、制定计划、调用工具、派发子Agent、等待执行结果、发现错误、修改方案、重新执行、自我验证……

每一个环节都在消耗token,而且这个链条有多长,在任务开始之前没有人知道。

听起来很强,账单也确实很强。

社区里已经有人算了一笔账:

如果一次中等复杂度的Agent任务,token消耗可以轻松到50万到100万。

按Fable 5输出端$50/百万token算,一次任务的成本,可能是25到50美元。

这还没算输入、缓存、子Agent的调用开销。

回头看Stripe那个案例,5000万行代码库,一天迁移完成,但没有人公布那次任务烧掉了多少token。

两个月的人工成本,折算成工程师工资,可能是几万美元。

但token账单,有没有可能比这个更贵?

03 最强模型走向分层

Fable 5的另一个关键点是,它不是单独出现的,一起公布的还有Mythos 5。

这两个模型真正的区别,不是名字,而是权限。

Anthropic的官方说法是:Fable 5和Mythos 5用的是同一个底座模型,区别只在于Fable加了安全限制。

在网络安全、生物、化学等领域,Fable 5会自动把你的问题转给Opus 4.8处理,但你不会收到任何通知。

这个设计叫”静默降级”,官方表示,这种情况在不到5%的会话中触发。

但Karpathy在发布当天就点出了这个问题:

发布初期的分类器”配置得有点过于敏感”,会误判。

正常的生物科研问题、代码安全审计、甚至一些无害的学术讨论,都可能进入5%里。

但同一个模型底座的Mythos 5,却没有这些限制。

目前,Mythos 5只开放给Project Glasswing里经过审核的组织。

名单没有公开,但从Anthropic的描述可以拼出轮廓:

网络安全防御机构、关键基础设施企业、少数生命科学研究者,以及此前已经进入Mythos Preview项目的约200个组织,其中包括美国政府相关项目。

换句话说,同一个模型,有两张脸。

一张对着普通开发者和企业用户,装了阀门,按用量收费,遇到敏感问题悄悄换模型回答。

另一张对着经过审核的特定机构,完整能力,单独通道,不对外公开。

Anthropic把这套机制叫做”可信访问”。

问题是,谁是不可信的?

是花了钱买订阅的普通用户?付了API费用的中小企业开发者?还是那些没有办法进入Glasswing名单的创业公司?

Anthropic没有明说,但结构分化已经摆在那里了。

当最有资格用完整模型能力的,恰好是最有钱、最有政府背景、最有行业话语权的那批机构,这件事就不再只是安全治理的问题了。

04 普通人的位置在哪里?

所以Fable 5发布后,普通用户到底站在哪?

过去几年,大模型行业一直在讲“AI民主化”。

最强模型一发布,所有人都能第一时间体验,$20/月就能用到世界上最前沿的AI能力。

这种感觉很诱人,也很像互联网时代的产品逻辑:规模越大,边际成本越低,越多人用越便宜。

但Fable 5给出了一个清晰的信号,前沿AI不是这样运转的,不会无差别开放给所有人。

当用户开始被分层,普通人在这个结构里的位置,已经越来越低。

如果按使用门槛和能力大致分层,如今Anthropic模型矩阵是这样排列的:

  • Haiku和Sonnet,承担日常对话,轻量任务,便宜快速;
  • Opus,负责复杂推理,专业用户,订阅可及;
  • Fable,长周期Agent任务,企业级工作流,按用量计费;
  • Mythos,完整能力,审核准入,不对外公开。

也就是说,模型能力越往上走,离普通用户越远。

这个趋势有个名字,叫”高端化”。

从商业逻辑上看,把最强能力卖给最愿意付钱的人,这是正常的商业决策。

毕竟算力有成本,前沿模型的研发有成本,Anthropic需要在IPO前证明它的收入结构是健康的。

但高端化,也意味着AI在完成一次身份转换。

它不是AI民主化的一步,恰恰相反,它是AI分层化走到台面上的一步。

最强的能力开始进入”可信访问”时代,最贵的账单开始按任务链计算,最普通的用户开始被温和而坚定地引导,去使用那个够用的版本。

那个$20/月就能摸到前沿AI的时代,可能真的过去了。

作者:世界模型工场

来源:世界模型工场

]]>
Anthropic 发了“最强模型”,但大多数人用不上 //m.clubpenjuin.com/382308.html Thu, 11 Jun 2026 01:51:46 +0000 //m.clubpenjuin.com/?p=382308

 

4月,Anthropic推出Mythos模型预览版。这个模型没有面向公众开放,因为在测试中它展现出极强的网络安全与漏洞挖掘能力,能自主发现数千个高危零日漏洞,一旦流出,容易被用于恶意攻击。

为了把这种能力锁定在防御场景内,Anthropic推出了玻璃翼计划(Project Glasswing),仅向苹果、谷歌、微软等12家核心安全伙伴及40余家关键基础设施提供商开放访问权限,并全程受控使用。

先锁起来再发布,这套操作本身就制造了话题。

两个月后,北京时间6月10日凌晨,Anthropic正式推出Fable 5和Mythos 5。

从跑分来看,它们几乎在所有基准测试中拿到了最高分,尤其在软件工程和长任务执行上,与其他模型拉开了明显差距。

但围绕这个模型的讨论,很快就不止于它有多强。

Fable 5和Mythos 5实际上共享同一个底层模型。区别在于,Fable 5面向普通用户,Mythos 5则继续锁在受信任的安全合作伙伴手中。同一个模型,两套规则,面向两个群体,这在Anthropic的产品线里是第一次。

而且,普通用户拿到的也并非完整版本。Anthropic在Fable 5外层加了一道安全分类器,一旦请求触及网络安全、生物化学、模型蒸馏等敏感方向,系统会自动切换到能力更弱的上代模型Opus 4.8响应。

定价同样值得注意,输入10美元、输出50美元/百万Token,官方称约为Opus 4.8的两倍。6月23日起,Fable 5还将从Pro、Max等订阅计划中移出,用户想继续使用,需要额外消耗credits。

这套组合拳拆开来看很合理。能力太强所以做安全限制,成本更高所以提价,风险敏感所以分级发布。但放到一起,释放的信号就变得微妙了。这和过去几年大模型公司拼速度、拼开放的竞争逻辑不同,各家都在想办法让自家模型触达更多用户,而Anthropic选择主动收窄入口,把限制变成了产品策略的一部分。

那么,这个号称前所未有的“最强模型”,是被神化了吗?

01.能力提升明显,自动降级成争议

分级归分级,先看实力到底如何。

软件工程是Anthropic这次更新的核心亮点。在SWE-Bench Pro测试中,Fable 5拿到80.3%的成绩。这个测试主要是看模型能不能在真实的GitHub仓库里定位bug、理解上下文、写出能用的修复代码,80.3%意味着每5个真实工程问题,Fable 5能解决4个。

在Terminal-Bench 2.1榜单上,Fable 5得分88.0%,超过了Open AI的Codex CLI。值得注意的是,Fable 5是通用模型,Codex CLI是专为编程场景打造的垂直工具,二者的差距更能体现其编程实力。

但真正能看出差距的是FrontierCode Diamond,这项测试考察模型的产出的代码能不能达到生产级代码库的质量标准。Fable 5拿到29.3%,Opus 4.8只有13.4%,GPT-5.5只有5.7%。三个数据均来自Anthropic官方公布,GPT-5.5的数据为其内部测试结果。

过去几年,AI模型写代码的能力一直在进步,但长期卡在一个瓶颈上:代码能跑,但不好维护;能够通过基准测试,但落地真实项目中仍会问题频发。

Fable 5在这个维度上的突破,说明Anthropic这次升级的不只是解题能力,而是把模型往真正的工程交付方向推进。

程序员李夏告诉「AIX财经」,AI生成代码很容易出现上下文不连贯的问题,初期能精准理解需求,长时间任务中容易遗忘信息,后期维护成本很高。

在他看来,Fable 5在长任务里的逻辑连贯性有明显进步,同类编码任务可一次性完成,准确率更高。不过,Fable 5相比Opus4.8生成速度较慢,思考链更长,整体响应速度有所下降。

视觉能力也有提升。Anthropic称,Fable 5能从复杂科学图表中提取精确数字,也能根据网页截图直接重建应用源码。官方还演示了实操案例,Fable 5只靠游戏画面截图就通关《宝可梦火红》,不需要搭配辅助工具。前代模型做类似任务时,还需要配备复杂的辅助系统。

长上下文和记忆方面,官方给出的说法是,任务越长越复杂,Fable 5的优势越明显。

此外,生命科学是另一个被重点提及的方向。Anthropic透露基于Mythos 5搭建的单细胞数据分析模型,覆盖138个物种,性能优于《Science》近期刊发的同类型模型,参数量却仅为后者的百分之一。

单从跑分成绩来看,综合能力确实上了一个台阶。

再来看看跑分之外。

Fable 5搭载了一套安全分类器,只要用户请求涉及网络安全、生物化学或模型蒸馏方向,系统会自动切换为Opus 4.8来响应,并告知用户发生了模型降级。官方表示,超过95%的日常对话不会触发,写作、编程、分析等任务大多不受影响。不过,实际体验可能因使用场景有所差异。

在实际使用中,这条界限实际上很容易被触发。李夏提到,他想在国内Mac上体验苹果Siri AI的功能,需要修改一些系统级的序列号参数,Fable 5直接拒绝了操作。目前,分类器设定比较保守,存在误判,官方称后续会持续调整。

但Anthropic还披露了另一层限制,对于大模型开发相关的请求,比如构建预训练流水线、设计分布式训练基础设施等,模型会在后台主动降低输出质量,且不会告知用户。

综合来看,Fable 5在各项硬指标上确实有了进步,但自动降级机制在一定程度上会影响使用体验。

02.最强模型,不是人人用得上

Anthropic这次的模型升级,用同一个底层模型,包装成了两款产品,面向两类群体。

Mythos 5留在玻璃翼计划的框架内,只面向苹果、谷歌、微软等12家核心安全伙伴及40余家关键基础设施提供商开放,网络安全和生物方向的限制被解除,Fable 5则面向C端订阅用户。

后续Anthropic还计划向经过审核的研究人员开放一个生物方向的受信通道,提供去掉了生物和化学限制的Fable 5版本。

这涉及到过去大模型行业没有面对过的问题,当模型能力足够自主发现漏洞,全量发布就变成了一种风险。

图源 / pexels

这解释了Fable 5和Mythos 5为什么要拆成两个版本。过去模型分级靠参数,大小之间是能力差距,现在同参数的模型也要分级,分的是信任门槛。

独立开发者展波认为,从安全角度来看这个逻辑很合理。Mythos级别的漏洞挖掘能力如果不加限制地开放给个人,会大幅降低攻击成本,容易被滥用于恶意攻击。先锁住、再逐步放开受信访问,是目前最稳妥的路径。

但安全只解释了为什么要分层。另一个问题在于,能用上Fable 5的普通用户,是不是都从中获益?

从Anthropic发布的跑分和案例来看,这一轮升级,优先服务的是程序员和工程团队。

展波用Fable 5协助优化了自己用Rust编写的解释型语言项目。在同等Web服务场景下,他将其与基于Python的FastAPI和基于Node.js的Hono做了对比。使用Fable 5的解释器驻留内存仅9.8MB,而FastAPI 和Hono分别为43.3MB和63.0MB,吞吐和延迟指标同样领先。

他认为同样一个任务,用Fable 5可能很快就完成,且效果更好。相比于价格,开发者更看重产出质量。只要模型能显著提升项目效果,高价是可以接受的。

李夏也提到,对程序员来说,模型生成质量和收入正相关。产出质量越高,提效越明显,回报越大。模型能力的提升可以直接换算成项目质量和时间节省,付费意愿自然会更强。

但换一个使用场景,结论就不一样了。

AI博主徐子龙以他的日常使用为例,他的日常工作分为写代码、做数据分析和写论文。他认为目前的大模型代码能力过剩,文字能力欠佳。对于科研工作者、内容创作者、法律和金融从业者等群体来说,对AI的核心需求集中在中文理解、长文写作和文档处理上。

展波提到,现在的趋势不是用户在挑模型,是模型在挑用户。编程重度用户被高端模型筛选出来,日常轻度用户被推向更有性价比的替代品。这说明,AI不再是一个普惠工具,而是一层层筛出不同支付能力和使用强度的用户。

即便是最强模型,也要在有需求的人手中才能物有所值。

03.用不起AI的时代,要来了吗?

Fable 5的API定价是输入10美元、输出50美元每百万Token,是Opus 4.8的两倍,也是目前全球公开可用的前沿模型中最贵的。

主流大模型API价格对比

但真正值得关注的不是价格翻了一倍,是付费方式变了。

Fable 5上线后,Pro、Max、Team等订阅用户可以免费使用两周。6月23日起,模型将从订阅计划中移出,继续使用需要额外购买credits,按API费率结算。订阅期内使用Fable 5,消耗的用量额度也是Opus 4.8的两倍。

先免费试用再移出订阅,也是在释放一种信号,把用户从固定月费推向按量计费。订阅制的好处是确定性,用户知道每月花多少钱;按量计费对平台更有利,用得多收得多,用户的花费上限被打开了。说白了,Anthropic想告诉用户:最先进的东西,本来就不该是包月的。

这个转变发生的时间点也值得注意。6月1日,Anthropic刚刚向SEC秘密提交了IPO招股书,估值达到9650亿美元,目标最早今年10月上市。从年初到5月底,Anthropic的年化收入从90亿美元增长至470亿美元,其中Claude Code贡献超过25亿美元,企业客户贡献了绝大部分收入。

一个即将上市的公司,需要向资本市场证明营收增长能力和定价权。把最强模型从固定订阅中拆出来、引导高价值用户按量付费,从财务叙事上看逻辑是通的。

而国产模型正在做完全相反的事。

5月底,DeepSeek宣布V4-Pro API永久降价75%。小米紧随其后,MiMo-V2.5-Pro降幅高达99%,价格几乎对齐DeepSeek。

一边是DeepSeek把价格打到地板,一边是Anthropic把天花板往上抬,不同玩家有不同的打法。

国产模型的降价一方面是技术红利的释放,底层架构发生了变化,省下的空间被用来换更大的市场。

Anthropic的逻辑正好反过来。它不需要靠低价抢市场,高价本身也是筛选器,把愿意为前沿能力付费的高价值用户留下来。

徐子龙认为未来AI会越来越贵,因为需求的扩张远远大于供给的扩张,算力涉及到电、芯片、模型训练,增长速度太慢。AI算力未来会像5G一样成为基础设施,但和5G不同,算力的供给远比带宽紧张,价格也就相应的增长。

从商业模式上看,AI行业正在出现类似云计算早期的分层结构。底层是高度标准化、价格趋近于零的通用能力,谁都能调用,靠走量变现;顶层是少数厂商把持的前沿能力,定价权集中,靠客单价变现。通用能力的价格会被持续压低,但前沿能力的溢价将长期存在。

从能力分级到付费分层,AI行业正在复制云计算走过的路。便宜的模型越来越多,最好的模型越来越贵。

*应受访者要求,文中李夏为化名。

作者:雷晶,编辑:金玙璠

来源:AIX财经

]]>
Anthropic万字长文:AI正在成为自己的“造物主” //m.clubpenjuin.com/382277.html Tue, 09 Jun 2026 06:31:01 +0000 //m.clubpenjuin.com/?p=382277

 

如果你觉得AI还只是帮你改改邮件、写写周报的小助手,那可能有点低估它了。Anthropic最近把自己家底翻了一遍,发现一个有点震撼的事实:AI正在成为自己的“造物主”。

简单说就是,从前AI怎么进化,每一步都得人盯着、人动手。但现在,Anthropic越来越多地把AI开发的工作,直接交给AI自己干。结果是:工程师每季度合并的代码量,是过去几年的8倍;超过80%的新代码是Claude写的;有些耗时几天的活儿,它两小时就干完了。更厉害的是,AI不光能干活,还能做判断。比如给一个开放的研究问题,它自己能设计实验、跑结果、找答案。在一个AI安全测试里,两个人类研究员花了一周解决了23%的问题,Claude用800小时和一万八千美元的算力,解决了97%。按照这个速度,AI能独立完成的任务时长,大约每四个月翻一倍。去年3月它能干4分钟的活儿,今年已经能干12小时的了。按照这个趋势,2027年左右,AI可能就能干人类需要好几周才能完成的事。当然,Anthropic也说了,这还不是“AI彻底自己造自己”的那一天——但那个叫“递归式自我完善”的东西,可能比大多数人想的来得快。好的一面是,科学、医疗、生产力可能会被推着跑起来。不好的一面是,如果AI真的能自己造自己,人类怎么保证还能“管得住”它,就成了一个天大的问题。这篇文章有点长,但值得看完!

以下为编译。

在 AI 发展史上的大多数时间里,人类主导了它开发周期中的每一个环节。但在 Anthropic,我们正把越来越多的 AI 开发工作委托给 AI 系统自己完成,而这正在显著加快我们的工作速度。

如果把这一趋势继续推远,并给予足够多的算力,它最终会指向一种 AI 系统:它能够完全自主地设计并开发自己的后继版本。这被称为递归式自我改进(recursive self-improvement)。我们还没有走到那一步,而且递归式自我改进也并非必然发生。但它到来的时间,可能会比大多数机构准备得更早。

借助公开基准测试,以及此前从未对外披露的 Anthropic 内部数据,Anthropic Institute 正在展示一个事实:AI 已经开始加速 AI 系统本身的开发。举一个例子:今天,Anthropic 工程师平均每个季度交付的代码量,已经是 2021—2025 年期间的 8 倍。

本文讨论的技术趋势表明,未来几年 AI 系统的能力还将大幅提升。这些趋势意义重大。能够“构建自己”的 AI,将会是技术史上的一个重大节点——它可能像 《Machines of Loving Grace》 所描绘的那样,在科学、医疗等领域为世界带来巨大的善意与进步。但完全意义上的递归式自我改进,也可能增加人类失去对 AI 系统控制的风险。如果系统真的具备完全构建其后继版本的能力,那么我们如何保障其安全、如何监控它、如何塑造它的行为,都会变得重要得多。

01 来自外部世界的证据

AI 模型提升的速度正在加快。它们能够可靠独立完成的任务时长,已经从更早期大约每七个月翻一倍的趋势,加速为如今大约每四个月翻一倍。2024 年 3 月,Claude Opus 3 还能完成大约相当于人类 4 分钟工作量的软件任务。一年之后,Claude Sonnet 3.7 已经能处理相当于人类约 1 个半小时的任务。再过一年,Claude Opus 4.6 已经能完成 12 小时级别的任务。[^1] 如果这一趋势延续下去,那么今年之内,熟练人员需要花上数天才能完成的任务,就可能进入 AI 的能力范围;到 2027 年,AI 系统或许将能胜任那些人类需要数周才能完成的任务。

同样的模式也出现在编码与研究基准测试上。基准测试衡量的是模型在某一特定领域中的表现,而当模型成绩接近 100% 时,我们就说该基准被“饱和”了。[^2] SWE-bench 是现实世界软件工程的标准测试之一:它会给模型一个真实的开源代码库和一份真实 bug 报告,要求模型写出能修复问题、并通过项目自身测试的代码变更。仅仅两年时间,模型就在这个基准上从个位数低分一路走到接近饱和。

CORE-Bench 测试的是模型能否复现已有研究结果,这也是其未来开展原创研究的前提。测试方式是向 AI 模型提供一篇已发表论文背后的代码与数据,并要求它重新运行全部流程,确认自己能够复现实验结论。AI 系统在 2024 年时,复现成功率大约只有 20%;而仅仅 15 个月之后,这一基准也已趋于饱和。负责长时任务能力评测的 METR 还发现,Claude Mythos Preview 已经能够工作“至少”16 小时,而且已经“触及 [METR] 在不引入新任务前提下可测量能力的上限”。

公开基准可以告诉我们很多关于系统能力本身的信息,但它们无法直接揭示 AI 系统究竟在多大程度上加速了 AI 自身的开发。要回答这个问题,我们需要来自 Anthropic 这类 AI 公司内部的一手证据。

02 Anthropic 内部的证据

构建一个前沿模型,大致可分为两类工作。其一是工程:编写代码、搭建基础设施、监督模型训练。其二是研究:决定要做哪些实验、解释实验返回的结果,并判断接下来该尝试哪些想法。

无论在工程还是研究上,呈现出的图景都相当一致。在工程侧,Claude 已经能够接收一个定义并不充分的问题,然后自行摸索解决路径;人类提供的是目标,但不再需要提供方法。在研究侧,Claude 已经可以在执行一个定义清晰的实验时,达到甚至超过熟练人类研究者的水平。不过,在工程和研究中,Claude 在“选择目标”时所需的判断力上,依然存在明显能力差距。这正是今天的 AI 与未来那种可以自主设计自己后继者的系统之间的差别。

在 Anthropic,员工通常会随着经验增长而接到越来越开放、也越来越重要的任务。初期,他们执行别人已经定义好的任务,比如:“导出按钮坏了,请修一下。” 随着经验增加,他们会拿到一个目标,然后自己设计实现路径,比如:“调查一下为什么网络在高负载下会变慢。” 而到了最资深的层级,他们决定的已经是“什么问题值得做”,例如:“团队下个季度应该做什么?” 我们可以借助 Anthropic 内部数据,看看 Claude 在应对这些不同类型任务方面已经走到了哪一步。

Claude 正在编写 Anthropic 相当大比例的代码。

截至 2026 年 5 月,Anthropic 代码库中合并进主分支的代码里,超过 80% 出自 Claude。[^3] 在 2025 年 2 月 Claude Code 研究预览版发布之前,这个数字还只是个位数低位。这种变化也体现在了工程师的人均产出上。Anthropic 创立最初四年(2021—2024),每位工程师每天合并的代码行数基本保持稳定;到了 2025 年,当 Claude 开始不再只是“建议代码”,而是直接“运行代码”时,这条曲线开始向上抬升;到了 2026 年,模型能够在更长时间跨度上自主工作后,斜率再次明显变陡。下面这张图展示了这两个拐点。到 2026 年第二季度,典型工程师每天合并的代码量,已经是 2024 年时的 8 倍。[^4] 原因很简单:很多代码已经由 Claude 写出,而工程师的角色转向了指挥与审阅,而不是亲手逐行敲写。

当然,需要注意的事:代码行数并不是完美指标,因为它衡量的是数量而不是质量。所以,2026 年第二季度“每位工程师每天 8 倍代码行数”,几乎肯定高估了真实生产率提升的幅度。但无论如何,它说明了一件事:速度正在加快。在 Anthropic,我们并不会按照“你写了多少行代码”来奖励员工;团队成员之所以产出更多代码,只是因为他们正在用 AI 系统写出更多代码。

代码行数的增长,也与员工对生产率显著提升的主观感受相吻合。2026 年 3 月,在 Anthropic 研究团队 130 名员工参与的一项调查中,受访者中位数估计:在“无论如何本来也会做的那些项目”上,使用 Mythos Preview 后,他们的产出大约是“完全没有 AI 可用”情况下的 4 倍。[^5] 我们预计,3 月时真实的提升幅度可能比这个数字略低。[^6] 尽管如此,我们依然认为整体结论可信,也与我们的其他观察一致:Anthropic 中相当一部分技术员工,正在以没有 AI 帮助时数倍的速度完成自己的核心工作。

我们还看到一些证据表明,Anthropic 员工正利用 Claude 去完成那些如果没有 AI,本来根本不会去做的工作,比如搭建探索性工具、或者清理那些长期被搁置的问题。举例来说,2026 年 4 月,Claude 一次性交付了 800 多个修复,把某一类 API 错误减少到了原来的千分之一。负责监督 Claude 的工程师估计,如果让人类来做,这项工作需要整整 4 年;修别人的 bug 本来就是一件缓慢、繁琐、极其消耗精力的事,而人类也很难同时在脑中维持如此庞大且陌生的上下文。

“大约一年前,我开始非常激进地推进‘Claudifying’。那是一段非常疯狂的旅程,而到现在,大概已经有 5 个月,我再也没亲手写过任何代码了。”——Anthropic员工

Claude 写出来的代码是“好的”,而且还在持续变好。 “好代码”包含两层含义:第一,它能正常工作;第二,它的写法要让另一位工程师能够理解、并继续在其上迭代。对第一条标准而言,证据已经很清楚。

过去一年里,Anthropic 员工在任务进行过程中对 Claude 进行纠正、重定向,或直接接管的频率一直在稳步下降,哪怕是在最复杂、最开放的问题上也是如此。所谓“开放问题”,是指那些没有明确规格说明、工程师自己也不确定正确答案长什么样的问题。下图展示了 Claude 在不同难度任务上的成功率变化。Claude 已经能写出真正可运行的代码。

如何理解这张图: 会话是否成功,由一个 Claude 裁判来判断;如果 Claude Code 代理明显完成了用户任务,而且过程中不需要人为纠正,则该会话被视为成功。工作负载的变化可能导致成功率出现短期波动。

在最开放的那类任务上,Claude 的成功率到 2026 年 5 月已经达到 76%,在 6 个月内提高了 50 个百分点。举个这类任务的例子:一次常规升级导致数以万计的训练作业崩溃。一位工程师几乎只给了 Claude 一点文本信息和集群访问权限,就把实时事故交给它处理。Claude 一边检查运行中的作业,一边逐项测试环境设置,最终锁定了一个触发崩溃的隐蔽调试标志位,成功稳定复现问题,并确认了解法。大约两小时内,Claude 完成了通常需要两到三天才能做完的工作。

第二条标准,是代码是否写得足够清晰,让另一位工程师能看懂并在其上继续开发。在这一点上,人类与 AI 之间的差距依然存在,但正在迅速缩小。Anthropic 内部对此并非完全一致,但许多人认为:在 2025 年末,Claude 写的代码质量仍明显逊于 Anthropic 工程师自己写的代码;而到今天,两者已经大致持平。我们预计,在一年之内,Claude 写出的代码会更好。

这也改变了 Anthropic 审查代码的方式。如今,提交到代码库中的变更会先由一个自动化的 Claude 审阅器读取,它会在代码合并之前检查 bug、安全漏洞以及其他缺陷。利用这一工具,我们做了一次回溯分析,发现:如果过去对代码库中的每一次改动都进行自动化 Claude 审查,那么 claude.ai 过往事故背后大约三分之一的 bug,本来都可以在进入生产环境之前就被拦截下来。写下那些代码的工程师,本身已经是世界上最擅长构建这类系统的人之一。如今,Claude 已经能抓住他们遗漏的错误。

“在 2025 年末,Claude 写的代码质量还比 Anthropic 人类工程师写的差一些;今天,它大致已经达到同等水平;而我们预计,在一年内它会严格意义上超过人类。”——Anthropic员工

Claude 已经很擅长围绕别人设定的目标来跑实验。 每次 Anthropic 发布新模型时,我们都会进行同一个测试:给 Claude 一段用于训练小型 AI 模型的代码,要求它在仍通过相同正确性检查的前提下,把这段代码跑得尽可能快。目标和评估标准事先就被固定好了,所以 Claude 的任务就是通过改写代码、运行代码、计时,再重复这一过程来寻找加速方法。这相当于一个缩小版的实验研究闭环。2025 年 5 月,Claude Opus 4 相比起始代码平均实现了约 3 倍加速;到 2026 年 4 月,Claude Mythos Preview 已经达到约 52 倍。作为参照,一个熟练的人类研究员通常需要 4 到 8 小时,才能做到 4 倍。[^7] 在研究流程的这一环——也就是在定义清晰的实验里做步骤优化——Claude 在不到一年的时间里,就从“非常有帮助”跨越到了“超过人类”。

“今天的整体形态大致是:人类提出想法,而模型能以比过去快一个数量级的速度,把这些想法实现、测试并评估出来。”——Anthropic员工

Claude 正越来越擅长提出自己的实验。 2026 年 4 月,Anthropic 发布了第一个由 Claude 端到端完成开放式研究项目的演示。研究人员给 Claude 驱动的代理们一个 AI 安全方向上的开放问题——大致来说,是“较弱模型是否可以可靠监督较强模型?”——然后让它们自己去解决。这个过程包括提出假设、进行实验、与并行代理共享发现,并不断迭代。这个任务有清晰的表现“地板”和“天花板”:地板是弱监督模型单独工作时能达到的水平;天花板则是强模型在使用正确答案训练后达到的水平。两位人类研究者花了大约一周时间,恢复了其中约 23% 的差距;而这些代理累计工作 800 小时、消耗约 1.8 万美元算力后,恢复了 97%。当然,这项工作也有一些限制:结果并没有顺利迁移到生产规模的模型上,而且问题的选择和评分规则仍然由人类设定。但在这些边界条件之内,代理们是自己设计了每一个实验。人类真正扮演的唯一关键角色,就是设定研究方向。

“Claude 在 1 到 2 天里,几乎没怎么需要我帮忙,就把这一切做完了。我想,如果一位[初级同事]在同样时间里拿着这样的结果回来找我,我会感到有点惊喜。未来已经来了。”——Anthropic员工

Claude 正越来越擅长把研究会话引向真正的研究发现。 我们分析了 Anthropic 研究人员在 2026 年 1 月到 3 月之间与 Claude 一起工作的真实 Claude Code 会话,这些会话处理的都是开放式调查问题,比如“为什么一次训练运行总是崩掉”,或者“为什么某个模型在基准测试上得分这么低”。在每个案例里,我们都找到了研究员中途“走弯路”的时刻:他们沿着一个错误方向前进,导致整个会话偏离正轨,之后才重新拉回来。接着,我们只把“会话偏离之前”的工作内容展示给多个 Claude 模型,并问它们下一步会怎么做。然后,再由另一个能够看到整个会话最终结果的 Claude,来判断究竟是 AI 还是人类提出了更好的下一步。[^8]

由于我们有意挑选了这些“人类选择本来就有改进空间”的时刻(n=129),所以这并不是模型与人类判断力的一次完全公平对照。这些时刻真正提供的是一组现实而困难的场景:正确的下一步并不显然,而人类当时的选择,恰好可以作为一个有用的标尺,来比较模型能力随时间的变化。按照这一指标,我们在 2025 年 11 月表现最好的模型(Opus 4.5),有 51% 的概率比人类当时的选择更优;到 2026 年 4 月(Mythos Preview),这一比例上升到 64%。研究工作的日常,本质上就是由一连串“下一步该做什么”的决策组成,因此,这可以作为衡量模型未来能否自主推进调查研究的一个相关指标。我们把这一结果视为一个早期信号:AI 系统正在越来越擅长做出那些 AI 研究本身所依赖的判断。

如何理解这张图: 图中的“实践天花板线”代表一种“理想答案”——它由一个能看到整个会话全过程(包括后来如何结束)的模型写出。

“截至目前,人类的比较优势仍然在于:看见更大的图景,并且能够跳出眼前任务的边界去思考。”——Anthropic员工

03 Anthropic 的工作未来可能会是什么样?

这些证据表明,在 AI 开发流程中的每一步,人类所扮演的角色都在收缩。一旦人类与 AI 所写代码的质量达到同等水平,人类就会彻底停止亲自写代码,而只保留审阅这一职责。但如果人类审代码的速度赶不上 Claude 生成代码的速度,那么代码审阅本身就会成为 AI 开发的新瓶颈。同样,一旦 Claude 已经能独立跑实验,问题就会转向:“这些实验里,哪些值得跑?” 说得更直接一些:如今,“执行”——也就是写代码、跑实验、产出结果——几乎已经不再消耗人类时间,尽管它仍然消耗算力。

至少在目前,人类的比较优势仍在于研究品味与判断力:包括哪些问题重要、哪些结果可信,以及什么时候该认定一条路径已经走进死胡同。

“工作(以及生活)曾经建立在一种由人与人之间小帮助构成的‘礼物经济’上。‘你能帮我把这个脚本跑起来吗?’……每一次请求都会形成一点点人情债,也会增加一点点彼此之间的感知。[Claude] 更快,而且不会制造任何人情债,但每一次这样的替代,也意味着一次人类协作机会的流失。”“在一切都运转顺利的日子里,我会忍不住觉得我做什么都不重要,一切都自动化了,而且比我更快、更好。但也有些日子,一切突然都坏掉了,我又根本不知道为什么,于是我意识到,自己已经完全不知道这些天究竟在做什么了。”——Anthropic员工

04 如果我们错了呢?

对上面这些证据,一个很自然的反驳是:真正最重要的工作,仍然掌握在人类手里——也就是决定“该做什么问题”。如果没有这种判断力,Claude 充其量只是一个能力很强的助手,而不是一个能够自己推动 AI 进步的系统。

今天的训练方法和模型架构,究竟能否解锁这种能力,确实还很不明确。但 AI 的进步很少来自那种“灵光一现”的顿悟时刻。近年 AI 历史中确实出现过一些这样的时刻,比如 Transformer 架构,或者混合专家(mixture-of-experts)模型;但真正改变范式的想法,往往几年才出现一次。在这中间,大部分进步其实都很“朴素”:把某个东西继续放大,看看哪里出问题,修掉,再试一次。而这恰恰正是 Claude 现在最擅长的工作流。爱迪生说,天才是 1% 的灵感加上 99% 的汗水。而我们看到的是,“汗水”这一部分正在越来越自动化。越来越明显的一点是:推动前沿向前走的许多工作,本身就是可自动化的;大规模研究进展,在很大程度上取决于工具和资源——它们决定了你能多快跑实验、一次能跑多少实验,以及你能多快拿到结果。

即便我们假设 Claude 永远也得不到真正好的研究品味,对现有证据做一个保守解读,也仍然意味着一种“复利式加速”。如果人类把大部分时间都花在那个位数比例的“方向设定”工作上,而剩余部分都交给 Claude 来做,那么每位工程师或研究者实际上都在同时驾驭比过去多得多的工作量。我们看到的证据表明,Anthropic 的员工不仅移动得更快,也覆盖了更广的工作面。在实际层面,这意味着:自从有效的 AI 工具出现之后,AI 已经让 Anthropic 的推进速度比过去快得多。

而一种没那么保守的解读则是:尽管目前证据还很初步,但 Claude 在研究判断力上的提升,也许说明这项能力本身也在进步。“研究品味”也许只是另一种典型的 AI 能力:系统会先在一段时间内表现得很差,然后突然开始变得擅长。类似的模式,我们已经在其他更偏定性的能力上见过,比如 AI 系统开始能够解释一个笑话为什么好笑、展现“心智理论”,或者解开语言谜题。

05 可能的未来

接下来会发生什么,取决于两件事:第一,这条趋势会不会继续;第二,如果继续,我们会选择做什么。我们至少可以想象三种未来情景:

1. 趋势停滞,但今天的 AI 能力广泛扩散

这篇文章里出现了许多指数型轨迹。但这些轨迹也可能最终只是 S 曲线。我们可能正接近曲线的弯折点:规模回报开始递减,增长线条先变直,再趋于平缓。一个“合格研究员”和“伟大研究员”之间的差别,所依赖的那种判断力,也许并不能通过继续扩大训练输入(如算力和数据)来获得。如果真是这样,那么要越过这一瓶颈,就需要一个新想法,比如一种能够取代当前所有前沿模型所依赖的 Transformer 的新架构路线。

另外,限制 AI 进展的关键约束,也可能不在模型本身,而在供应链:前沿能力的推进与扩散,也许需要比当前世界可提供的更多能源和算力。制芯速度、电网扩容、互连带宽,也许才是真正的约束,而不是智能本身。我们也不能排除某种外生冲击对 AI 生态造成突然减速的可能,比如算力或电力供应骤然收缩——无论哪一种,都会让进步变慢,也让前沿实验室继续投入的成本上升。或者,也可能存在其他我们尚未预见到的障碍。

即使把模型能力冻结在今天的水平,我们仍然预计世界会发生重大变化。Project Glasswing 就是一个早期信号:在最初几周里,Mythos Preview 在全球最重要的一些系统中发现了超过一万个高危和严重级别的软件漏洞,多到网络防御的瓶颈已经从“发现漏洞”转向“来不及修补漏洞”。而且,我们仍处在今天这些模型向更广泛经济体系扩散的早期阶段——未来,一个 100 人的公司,越来越可能做出过去 1000 人公司才能完成的工作,因为每一位员工身后都将站着一个代理金字塔。

之所以把这个情景列出来,是为了完整性;但我们并不认为它最有可能发生。到目前为止,我们能测量到的所有能力——包括那些看起来更“软”、更难量化的能力,比如代码质量和开放任务成功率——都遵循着同样的上升曲线。我们还没有看到这条曲线开始弯折。在我们讨论的三种未来里,这一种会给政府和社会最多的适应时间。相比之下,我们更担心后面两种,因为它们会来得更快,留给准备的空间也小得多。

2. AI 实验室继续获得复利式效率提升

在这个情景里,AI 开发将实现相当程度的自动化,但研究方向仍由人类设定,结果也仍由人类裁定。使用 AI 系统的组织会随着时间推移变得越来越高效,因此我们可以预期,每一个组织成员的生产力都会被成倍放大。一个 100 人的公司,可能做出 1 万人甚至 10 万人组织才能完成的工作。这将彻底改造知识工作和政府服务,但它同样可能被用于有害目的:从针对整个人群的威权监控,到为每个个体量身定制、且以任何人工团队都无法匹敌的规模运行的影响力操控。届时,在 Anthropic 这样的公司里,人类的角色也会改变。人们将与 AI 系统协作,放大研究能力、生成新洞见,并共同建立那些用来验证 AI 输出是否可信的系统。

我们在这里展示的证据表明,我们很可能正在走向这个情景。但一个流程中某一环节的提速,往往只是把瓶颈推到了别处:整体速度终究受制于那些还没有加快的部分。在计算机科学中,这叫阿姆达尔定律(Amdahl’s law),对组织同样成立。Anthropic 已经碰到了阿姆达尔定律的一个典型表现:随着组织内代码流动速度越来越快,人类代码审查已经成为新的瓶颈。

而这种摩擦并不只存在于工程侧。Anthropic 员工与高能力模型协作后,新的想法、计划、工具和模拟实验出现了爆炸式增长,多到我们根本没有足够能力去一一推进。一个组织能多快发现并修复这些新瓶颈,也许会成为一种会随着时间持续进化的能力,并最终成为任何组织最重要的能力。

3. AI 系统本身获得完全递归式自我改进能力,并开始构建它们的后继者

如果技术能力继续沿着当前趋势前进,而 AI 系统又获得了那种属于“变革性人类创造力”的能力,那么 AI 系统设计并优化自身的可能性就是现实存在的。

在这个世界里,AI 开发进度将完全由算力的可获得性决定——或者说,由 AI 系统自己发现训练或推理算法效率提升的速度来决定。人类在开发中的角色将大幅缩小,可能把大部分精力转向对一个不断扩张的、由 AI 系统运行的“虚拟实验室”进行监督、验证与核查。我们预计,一旦系统具备自动化 AI 研究与开发的能力,这些技能也会转移到其他科学领域,从而开始改写更多学科的发展方式。

在这种未来里,对齐问题究竟会被如何解决——或者根本解决不了——是我们最没有把握的部分。模型可能足够对齐,同时也具备足够好的研究品味,以至于能自行发现并实现我们尚未达到的新解决方案;它们甚至也可能足够“明智”,在发现条件不足时主动停止发展。另一种可能则是,今天模型中偶尔出现的失配问题,会随着模型不断构建其后继者而不断累积,变得越来越频繁、却越来越难以理解,直到我们最终失去控制。也有可能,我们根本来不及建立、整合并验证那些帮助我们判断自己究竟正处在哪条轨道上的工具。

我们对这个世界会长什么样没有良好直觉,因为今天的经济仍由人类和人类制造的工具驱动。而从定义上说,一个由快速递归式自我改进驱动的世界,可能会被这种能不断自我增强的模型所主导:随着它的能力全面超越人类,并在整个经济中扩散,世界将发生根本变化。如果人类劳动不再具有竞争力,我们很难预测那时的经济会是什么样子。

即使模型开发真的实现了完全自动化与递归化,我们仍无法预测这对大多数人的日常生活究竟意味着什么。阿姆达尔定律在这里同样适用。递归式智能可能会在某些领域迅速实现 《Machines of Loving Grace》 中提到的许多好处。我们预计,具身智能(也就是机器人)可能会很快跟上递归式智能,并沿着类似路径,以更低成本获得越来越高的回报。更强大的智能,也许会帮助我们更快地建造现实世界中的系统,开展更高效的救命药物临床试验,发展新的协调机制。

但仅仅实现递归式改进,并不意味着工业生产方式、社会组织方式或市场运行方式会立刻改变。更强的智能无法让我们在几天内看见一种药物几十年后的长期副作用,无法让选举早于宪法规定的时间举行,也无法在一个周末之内把陌生人变成老朋友。对大多数人而言,这种未来的“体感速度”仍将由瓶颈决定——即便上游实验室已经在以算力的速度奔跑。递归式智能持续越来越快地构建自身,而另一边的人类世界仍受制于关系、治理和制度的节奏;这两者碰撞出的未来,也是我们无法预测的部分。

06 我们应该做什么?

如果有可能有效放慢这项技术的发展,为社会争取更多时间去应对它所带来的巨大影响,我们认为这大概率会是一件好事。但如果“放慢”只是让那些最不谨慎的参与者在技术上赶上来,那反而可能使所有人更不安全。在缺乏全球协调机制的情况下,企业和政府都将不得不在竞争压力和地缘政治压力下,艰难地做出安全相关决策。

我们认为,世界如果拥有“减速”或“暂时暂停”前沿 AI 开发的选项,会是一件好事——这样,社会制度建设和对齐研究才有机会跟上技术前进的速度。Anthropic Institute 将与许多其他机构合作,开展研究并采取行动,帮助建立一种真正可信的减速或暂停机制所必需的系统。这些系统应当使前沿 AI 开发者能够验证:全球其他参与者确实也已经停止或放慢了脚步,同时也能确保坏行为者不会借由“协调减速”的名义偷偷加速领先。如果这样的系统存在,我们预计:只要其他位于前沿或接近前沿的开发者也在可验证前提下采取了同样行动,我们会愿意放慢甚至暂时暂停。

一次有意义的减速或暂停,要求多个资源雄厚、处在前沿或接近前沿的实验室,分处多个国家,并在同样条件下同意停下;同时,还要求各方都能验证其他方确实停下了。由于 AI 系统本身的独特特性,这一军控问题中的“可探测性”(detectability——标准低于“可验证性”)比其他技术困难得多。训练运行比导弹发射井更容易隐藏,它们的输入也都是通用型资源,而偷偷违约的激励又极其强烈——因为当别人暂停时,谁继续推进,谁就可能继承领先地位。一个可信的暂停机制还必须明确:什么触发暂停,什么条件下解除暂停,以及由谁来裁定。

从原则上说,这并不一定不可能。人类社会曾经为其他复杂技术建立过验证机制,比如《中导条约》(Intermediate-Range Nuclear Forces Treaty)。但那类机制用了几十年才建立起基础设施与互信。我们已经没有那么长时间了。相比之下,由单个实验室单方面暂停,今天立刻就可以做到,但作用小得多:它只会改变谁是领跑者,却无法创造当前真正缺失的、更广泛的社会性讨论过程。

未来几个月,我们将组织一系列讨论,让政策制定者、研究人员、公民社会以及其他 AI 公司,一起回答本文提出的一些问题,尤其是关于完全递归式自我改进,以及如何为协调与审议创造更好选项的问题。我们也会把这些讨论的成果发布出来。现在,正是一起研究这些问题的窗口期,而 AI 公司之外的人,也应当被纳入这场讨论。

Marina Favaro 和 Jack Clark 共同撰写了本文,Santi Ruiz 提供编辑支持。Shan Carter、Romello Goodman 和 Nikki Makagiansar 基于 Brian Calvert 与 Jun Shern Chan 收集的数据制作了文中视觉内容。Daniel Freeman、Jim Baker、Max Young、Sarah Pollack、Francesco Mosconi、Holden Karnofsky、Andy Jones、Kevin Troy、Anton Korinek、Meg Tong、Andrew Ho、Dan Altman、Drake Thomas、Jack Shen、Sasha de Marigny 和 Avital Balwit 提供了反馈。

脚注

[^1]: METR 的关键衡量指标,是 AI 系统在一组任务上达到 50% 可靠性时所对应的任务时长;不过,即便使用 80% 可靠性标准,趋势线看起来也几乎一样。

[^2]: 尤其当基准越来越偏向开放式格式和更困难任务(例如奥数级数学问题)时,由于题目与答案集本身可能存在歧义、题目无法求解等问题,基准往往会在低于 100% 的位置就“饱和”。

[^3]: Anthropic 管理层曾公开估计,我们超过 90% 的代码都是由 Claude 写的,这其中包括脚本和实验性代码。本文所说的 “>80%”,指的是合并进生产环境的代码行中,可归因于 Claude 的占比。这个指标更保守,体现在两方面:一是我们的归因流程本身存在缺口;二是那些未被归因给 Claude 的代码行中,也包含自动生成代码和其他并非人类手写的内容。

[^4]: 这轮代码产量激增,正在挤压大家共用的基础设施。作为全球大部分软件构建的平台,GitHub 在整个 2025 年大约记录了 10 亿次代码提交;而到 2026 年年中,这一数字已经变成每周 2.75 亿次,按全年速度估算大约会达到 140 亿次。GitHub 首席运营官表示,公司正“极其努力地”扩容,仅仅为了跟上这个增长速度。

[^5]: 关于这项调查的方法学细节,可参见 Claude Opus 4.7 System Card 的第 2.3.5 节。

[^6]: 许多受访者可能并未仔细考虑应如何校正这个问题中的各种偏差或定义细节,而 METR 最近的研究显示,开发者对 AI 带来生产率提升的主观估计,往往会高于实际值。

[^7]: 具体加速能达到多大程度,很大程度上取决于起始代码本身还留有多少优化空间,因此这里的绝对倍数不应被直接解读为现实世界中的训练加速效果。更有信息量的是这种“同条件对比”所提供的比较:不同模型之间(过去一年从约 3 倍到约 52 倍)以及模型与熟练人类之间(在同样任务上,人类 4 到 8 小时做到约 4 倍)的差异。

[^8]: 为了检查裁判偏置,我们还在另一组 127 个时刻上做了同样测试;这些时刻里,人类当时的下一步本来就已经很强(与原始测试集“人类方向存在改进空间”不同)。在这组对照中,模型给出的建议只有大约 20% 的情况下被判定为更优。

作者:硅星人

来源:硅星人Pro

]]>
AI要自己造AI了?Anthropic最新暴论,到底有多真? //m.clubpenjuin.com/382205.html Mon, 08 Jun 2026 01:45:22 +0000 //m.clubpenjuin.com/?p=382205

 

Anthropic又出暴论了。

这次他们发了一篇报告,标题叫《When AI Builds Itself》(AI在构建自己)。

先来几组数字感受一下:

截至今年5月,Anthropic超过80%的代码已经由Claude自己写;工程师人均代码产出翻了8倍;Claude可以连续自主工作超过16小时。

Anthropic给出的判断是,如果按现在的趋势继续下去,AI自己设计、构建下一代AI,是完全可能发生的。

基于这种风险,Anthropic甚至呼吁全球放缓前沿AI研发!

观点一出,社交媒体立刻炸了:”AI要自己造自己了!””递归自我改进(RSI),奇点要来了!”

熟悉的配方,熟悉的味道。

如果你在AI圈混了超过两年,一定认得这个节奏:

每隔几个月,就会有一家头部AI公司抛出一个让人觉得”时代要变了”的论断;

社交媒体集体进入焦虑模式,然后……

日子还是照过。

前几天OpenAI刚说完“AI显现出递归自我改进(RSI)的早期迹象”,Anthropic后脚就来一篇”AI正在造下一个自己”。

现在连营销话术都要你追我赶了吗?

今天这篇文章就来拆解一下,Anthropic和OpenAI说的RSI到底是什么?现在到了哪一步?未来AI可能走向哪里?

看完你再决定,到底该不该焦虑。

01 Anthropic走到了哪一步?

递归自我改进(Recursive Self-Improvement,RSI),是AI圈讨论了近二十年的老话题。

核心逻辑很简单:AI能改进自身,改进后的下一代又能改进再下一代,不需要人类介入,形成自我加速的能力飞轮。

这是AI奇点理论的触发条件。

不过在讨论”目前RSI到了哪一步”之前,你得先搞清楚,RSI不是一个临界点,而是一个阶梯。

这些年关于RSI的研究,共同给出了一把衡量RSI进度的尺子,可以把它大致分成六个阶段:

第0级:AI是普通工具,补全代码、查资料。

第1级:AI大量参与软件工程,写测试、修bug、改仓库。

第2级:AI参与AI研发本身,训练代码、评估、数据、实验分析。

第3级:半自动研究闭环,AI提假设、写代码、跑实验、分析失败、迭代方案。

第4级:自改进Agent,AI修改自己的工具链和代码架构,并用benchmark自动筛选出更好的版本。

第5级:完整RSI,AI自主设计、训练、部署更强的后继模型,由后继模型继续迭代。

那么,Anthropic现在在哪儿?先看Anthropic自己怎么说。

Anthropic在报告里也画了一张时间轴,把AI介入AI开发,分成五个阶段:

2021-2023年,人类写代码AI不参与;

2023-2025年,用ChatBot生成片段、人复制粘贴;

2025-2026年,Agent能独立写完整文件;

2026年也就是现在,自主Agent可以运行代码、委托子Agent、连续工作数小时;

最后是20XX年,Agent能自主设计并训练下一代模型,那才是真正的RSI。

按他们自己的地图,他们现在已经在第四阶段,离终点只剩一步。

但事实真的如此吗?

对照业界研究的六个阶段,Anthropic的位置更像是处在第3-4阶段之间,也就是半自动研究闭环和自改进Agent阶段。

Anthropic内部有一个公开披露的实验:

Claude Agent全程自主完成一个AI安全研究项目,从提假设到分析结果全部自动,用约800小时、约1.8万美元算力成本,恢复了97%的性能缺口,而两名人类研究员花了整整一周只恢复了23%。

这是一个真实运转的半自动研究闭环,说Anthropic已处在第3阶段不为过。

第4阶段的迹象同样存在。

Anthropic做了一个代码优化实验。

Claude拿到训练小模型的代码,自主运行、计时、修改、再运行,跑出了52倍的速度提升,人类熟练研究员做同样任务只能做到4倍。

这非常接近自改进Agent的逻辑:改工具链、跑benchmark、选更好的版本。

02 卡住RSI的关键

但值得注意的是,还有一个关键环节没被Anthropic跨越。

Anthropic在文章里提到了一个词,叫做research taste(研究品味),这是判断什么问题值得做的能力。

用他们自己的比喻:

初级员工接到的任务是”这个按钮坏了,去修”;

有经验的员工接到的是”网络有时候会变慢,查一下原因”;

最资深的人在思考的是”我们下个季度该做什么”。

目前,Claude在第一层已经很强,第二层在快速追赶。

但在第三层,比如“什么问题值得做、哪些结果可信、什么时候该放弃”这些研究品味上,人类仍有比较优势。

只要人类还在主导这个环节,AI就没有实现完全的自改进Agent,更不用说达到完整RSI阶段。

不过,报告里一个数字值得单独拿出来。

在”判断研究下一步该怎么走”这件事上,Claude Mythos Preview已经能在64%的情况下,被另一个Claude judge判定为提出了更好的下一步,五个月前这个数字还是51%。

这表明进化的趋势是对的,但离AI完全自主判断还很远。

更重要的是,这个数据是在问题边界清晰的情况下测量的。在真实环境里,AI能判断到什么程度,其实并无定论。

03 AI发展的三种结局

Anthropic抛出的数据很亮眼,但是AI未来到底会发展到什么程度,Anthropic也不敢把话说满,在报告里老老实实列出了三种情形。

第一种:趋势停在S曲线上

当AI能力增长遇到天花板——Transformer架构撞墙、算力和能源供应跟不上、地缘政治把全球AI协作切断,指数曲线会弯成S形,然后趋于平缓。

Anthropic认为,这是三种结局里最不可能发生的一种。

但他们也承认,即使是这个最温和的版本,后果也不轻松。

今天已有的模型能力就此冻结,也已经足够让一家百人公司,越来越接近过去千人公司才能完成的工作。

社会结构的震荡不会因为AI停止进步而消失,它只是换了一种形态继续。

第二种:飞轮转起来,人类还在掌舵

AI处理执行,人类负责判断;AI生成选项,人类做最终决策。

听起来是个不错的结局,但Anthropic指出了一个隐藏的麻烦:Amdahl定律,加速一个环节,瓶颈会转移到下一个。

比如代码写得快了,code review变成新的堵点;实验跑得快了,结果分析又慢下来;分析快了,决策链路又开始拖后腿。

Anthropic说他们内部已经在经历这个过程,每一波效率提升之后,下一个瓶颈就浮出水面。

它意味着人类掌舵会越来越费力,要求越来越高,人类需要在更快的节奏里做出更好的判断。

Anthropic认为这是最可能发生的近期情景,而且他们现在已经在这条路上了。

第三种:完整RSI,人类退到验证角色

AI开始自主构建后继模型,进度由算力决定,人类从主导者变成监督者和验证者。

好处在于,可能快速实现医疗突破、科学加速、贫困问题的系统性解法。

但坏的一面是,今天模型训练中,哪怕只有一个微小的目标偏差,在完整RSI的迭代循环里可能以指数速度放大,直到人类完全失去干预能力。

这是最不确定的结局。

讲完三种结局,报告末尾Anthropic开始呼吁,希望建立某种全球协调机制,在风险上升时能够有序放缓甚至暂停前沿AI开发。

翻译一下这段话的意思:AI递归自我改进势头太猛,我们很担心,觉得应该有人出面让大家一起停下来,但Anthropic不会单方面停。

多么熟悉的味道。

这套叙事Anthropic已经用了不止一次,在制造焦虑的同时,把自己定位成”威胁的发现者”和”最有能力应对威胁的公司”。

但看完Anthropic内部真实情况,以及它自己给出的AI未来可能性,你还会感到焦虑吗?

作者:世界模型工场

来源:世界模型工场

]]>
突发!Anthropic呼吁全员停止AI研究 //m.clubpenjuin.com/382178.html Fri, 05 Jun 2026 06:52:48 +0000 //m.clubpenjuin.com/?p=382178

 

重要发现:AI的自进化,开始了。

这是Anthropic刚刚在长文博客中,发表的暴论。

我们的内部数据显示,Claude正在加速AI发展,这可能是一条递归自我提升(RSI)的路径。

并非「危言耸听」,看了下文章,Anthropic是真的实打实地用数据在说话——

截止今年5月,80%以上的Anthropic代码,都是Claude写的。

而在Claude Code发布之前,这个数字还仅是个位数。

与此同时,Anthropic工程师平均每季度交付的代码量,是2021-2025年的8倍。

更重要的是质量——

在最开放、最模糊、连答案长什么样都不确定的编程任务上,Claude的成功率现在是76%,六个月前才26%。

50个百分点的跳升。半年。

Anthropic内部已经有不少工程师觉得,Claude写的代码质量和人类打平了。

预计年内会超过。

Anthropic还强调,如果这个趋势持续下去,AI自己设计和构建下一代AI,是完全可能的。

这可能彻底改变社会,在医疗、科技、经济领域带来巨大的好处。但也可能让对齐问题叠加恶化,最终导致失控。

因此,Anthropic带头呼吁:

如果存在一个可验证的机制,能保证AI实验室确实都没偷偷卷,我们愿意减速、甚至暂停。

除此之外,Anthropic的这篇博客里,还放出了蛮多有意思的观点和事实。

以下是经过整理,更方便大家阅读的版本。

Enjoy。

Anthropic长文定调

AI圈的摩尔定律来了

Anthropic创建了个全新的衡量维度,叫「AI能独立完成的任务时长」。

2024年3月,Claude Opus 3能搞定人类大概需要4分钟的软件任务。

一年后,Claude Sonnet 3.7,1.5小时

又一年,Claude Opus 4.6,12小时

而最新的Mythos,在内测中的表现是:

能连续工作「至少」16小时,已经到了METR测试框架能衡量的上限了。

这个翻倍速度,从原来的每7个月翻一倍,加速到了每4个月翻一倍。

如果趋势不变,2027年,可能是好几周

Claude编写了大部分Anthropic代码

截至2026年5月,我Anthropic代码库的代码,超过80%由Claude编写。

在Claude Code发布前,这个数字一直只有个位数。

这种变化,也体现在工程师的工作方式上。

在 Anthropic 的最初四年,工程师每天Merge的代码行数基本保持不变。

2025年, Claude开始自己写代码,merge数突然开始飙升。

如今,2026年第二季度,工程师每天merge的代码量是2024年的8倍

不过,代码量上去了,代码质量是不是注水了?

Anthropic说,这一年来,工程师纠正Claude的次数,越来越少了。

这一点,在benchmark中可见一斑,如下图所示。

所有难度类型的任务中,Claude的成功率,无一例外的一路暴增。

所以,Anthropic现在干脆用Claude来review代码。

是的,所有提交到代码库的改动,都会先过一遍Claude自动审查,检查bug、安全漏洞和其他缺陷。

他们回溯分析发现,如果之前每次改动都有这道自动审查,大约三分之一导致claude.ai线上事故的bug,上线之前就会被拦下来。

要知道,写那些代码的工程师,已经是全世界造AI系统最顶尖的一批人了。

Claude在抓他们的错误。

创造力的放大镜

接下来是Claude在研究层面的参与程度。

Anthropic有个惯例,每次发新模型,都会给Claude一段训练小型AI模型的代码,让它在保证正确性的前提下,把运行速度优化到最快。

2025年5月,Claude Opus 4交出的答案是:加速3倍。

2026年4月,Claude Mythos Preview做到了52倍。

作为参考,一个熟练的人类研究员,需要4到8个小时才能勉强达到4倍。

不到一年的时间,Claude超过了人类。

2026年4月,Anthropic丢给Claude一个AI安全研究,大意是「一个弱模型能不能可靠地监督一个强模型」,然后让Claude自己提假设、跑实验……

这次先说人类的表现吧,两个人类研究员花了大约一周时间,把gap缩小了23%。

而Claude,在大约800小时、花了大约18000美元的算力之后——

缩小了97%。

我们何去何从?

到这里为止,结论已经很清楚了。

人类在AI开发流程里的角色,每一个环节都在收窄。

代码,Claude写了。代码review,Claude做了。实验执行,Claude快了人类一个数量级。实验设计,Claude开始自己来了……

人类现在最后的比较优势,是研究品味和判断力。

但这个优势能守多久?

Anthropic在博客里说,他们也不确定。

一种可能是,「研究品味」就像之前AI不会的其他东西一样,先是做不到,然后突然就做到了。

就像AI理解幽默、展示心智理论、解语言谜题,都经历了同样的曲线。

另一种可能是,即便Claude永远学不会真正的研究品味,仅靠现在的加速趋势,每个人类研究员能同时指挥的工作量已经大了好几倍。

你不需要AI完全替代你思考,它只要把所有「执行」的活全干了,你就只需要做那5%的方向选择

RSI的三种未来

博客结尾,Anthropic描绘了关于这次「自进化」趋势三个可能演化方向。

1、停滞。

那些指数曲线其实是S曲线。

也许研究判断力这个东西就是没法靠scale解决,需要一种全新的架构突破。

或者,瓶颈在能源、在芯片、在算力的物理供应链上。

不过,即便AI的能力就停滞在今天的水平,也会发生对世界带来重大变化。

前段时间的Project Glasswing,Mythos Preview在上线头几周就发现了超过一万个高危和严重级别的软件漏洞,遍布全球最关键的系统。

2、AI持续加速,但人类仍然把着方向盘。

组织效率会指数级提升,100人的公司做1万甚至10万人的活。知

Anthropic觉得我们大概率正在走进这个场景。

但他们也发现了一个有意思的现象,就是阿姆达尔定律在组织里的体现_

Claude把代码写得飞快了,结果代码review变成了新瓶颈。各种新想法、新工具、新实验爆炸式涌现,远超组织的消化能力。

瓶颈不会消失,只是转移到下一个环节。

3、AI实现完全的递归自我提升,开始自己造下一代自己。

这个场景下,AI的发展速度完全取决于算力了。人类退到监督、验证、审核的位置。

如果真的发生,这种能力大概率会迁移到其他科学领域,医学、材料、能源,全线起飞。

当然,另一种未来,是对齐失败。

这种情况下,偏差会在AI自我迭代的过程中逐步累积,最终——完全失控。

OMT

以上,便是Anthropic此次关于自进化,最关键的几个观点。

说实话,最开始我其实没太当回事,毕竟Anthropic马上就要IPO了,这一波不是典型的「Anthropic式」公关?

你别说,这次,可能真的有点不一样。

因为就在几天前,OpenAI也发布了类似的博客:

我们也在当今系统中看到自进化的早期迹象: AI的发展本身也被AI加速。我们预计这将加剧开发商和国家之间的竞争压力,并带来现有机构无法应对的治理挑战。随着RSI的出现,社会需要方法塑造AI的发展轨迹 ,确保其服务于人类利益。

奇点,似乎来得比所有人预想的都要快。

作者:关注前沿科技

来源:量子位

]]>
Anthropic秘密递表背后:算力赎身迫在眉睫 //m.clubpenjuin.com/382107.html Wed, 03 Jun 2026 07:48:58 +0000 //m.clubpenjuin.com/?p=382107

 

2026年6月,Anthropic向SEC秘密递交S-1招股书,估值9650亿美元。一周前,它刚完成650亿美元H轮融资。几乎同一时间,OpenAI也在准备递表,两家头部AI公司,正抢着成为美国“第一个上市的大模型企业”。

同一时期,智谱AI与MiniMax正在紧锣密鼓筹备A股上市。距离它们2026年1月在港股敲钟,仅仅过去了五个月。资本市场里,一家公司的上市周期通常以年计算,但这两家中国AI公司,显然已经等不及了。

为什么全球AI公司集中在2026年扎堆上市?答案不是技术彻底成熟,也不是二级市场窗口偶然打开。核心真相只有一个:高昂的算力账单已经到期,私募融资的体量早已不足以覆盖持续迭代成本,行业必须换公开市场的海量资本续命、破局

1

Anthropic的S-1并未披露完整财务细节,但SpaceX的招股书,直接撕开了头部大模型的真实生存底色。

监管文件显示,Anthropic每月向SpaceX支付12.5亿美元,独家租用孟菲斯Colossus 1数据中心的全部算力,覆盖超22万台AI芯片,年度算力账单接近150亿美元。结合行业披露的470亿美元年化收入运转率测算,Anthropic近三分之一的营收,都在持续流向马斯克的数据中心。

相比资金压力,算力共计的稳定性更为重要是。尽管双方合约纸面期限至2029年,但马斯克在X平台公开明确表态:这并非长期锁定的稳定合作,一旦SpaceX自身xAI业务算力吃紧,有权随时收回算力资源。合约主动权完全掌握在SpaceX手中,Anthropic始终处于被动依附状态。

这就是Anthropic手握千亿估值、巨额融资,仍紧急冲刺IPO的真实原因。650亿美元H轮融资看似体量庞大,但由于持续高额算力刚性采购,大部分资金无法长期留存账面,12个月内便会以算力采购形式,持续回流至SpaceX、AWS、Google Cloud等上游算力厂商。

相当于挣了个中转费。

私募融资的单轮体量,相对于算力成本的指数级增长,永远追不上,且每一轮融资后,算力采购规模与外部依赖度同步加深,本质是越续命、越绑定、越被动。而公开市场的公众资本池,能提供足够体量的募资,一次性支撑自建算力底座的长期投入,更能帮助企业建立独立资本信用,逐步摆脱对单一算力供应商的被动依附。

私募是续命,上市是换命。Anthropic在账面资金最充裕的节点果断递表,其实是看透了行业宿命:若650亿融资依旧仅用于支付算力账单,下一轮必然需要更大规模融资、接受更苛刻的合作条件,未来的算力赎身只会越来越难,前期投入的收回变得遥遥无期。

OpenAI的处境与Anthropic高度相似,只是商业化路径不同。Altman曾坦言“AI竞赛的胜负不在于谁先上市”,但行业真实财务数据极为残酷。

The Information披露,2026年Q1,OpenAI每创造1美元营收,对应产生1.22美元亏损。全赛道生态布局叠加巨额模型训练、推理算力成本,整体烧钱烈度比Anthropic更高。两家顶级AI企业产品形态迥异,一个深耕通用智能入口、一个聚焦程序员生产力,但底层困境完全统一:核心算力命脉均不自主,永远在为上游算力巨头打工。

2

中国市场这边,智谱AI与MiniMax的第二轮上市冲刺,是全球AI算力倒逼逻辑的区域变体。2026年1月两家企业登陆港股,智谱首日涨幅13%,MiniMax暴涨110%,一度掀起市场热潮。但仅仅五个月后,两家企业火速启动A股辅导,足以说明第一轮港股募资早已跟不上业务扩张节奏——本质是跟不上算力采购的资金消耗速度。

相比美股AI企业,国内AI公司的算力环境相对稳健。没有每月百亿级别的单一算力租金压力,极端依赖单一供应商的风险显著更低,国内云厂商竞争格局分散,算力供给稳定性更强。但高端算力稀缺、技术人才成本持续上涨,是全球AI行业的共性瓶颈。

智谱、MiniMax港股上市后的千亿港元级别估值,对应募资体量,相对算力成本,长期支撑存在压力,在顶级大模型持续算力投入面前,只是入门级门票。冲刺A股,本质是筹措第二轮算力迭代与全球化扩张资金,补齐长期发展的资本短板

中美AI上市竞速,表层节奏差异清晰可见:美股企业争抢行业首轮上市席位,抢占产业话语权;国内企业开启A+H双平台接力融资,夯实长期发展根基。但底层动因完全一致:AI算力成本的增长速度,已经彻底超过私募融资的供给速度

据Anthropic CEO Amodei预测,2026年底单次顶级模型训练成本可能逼近100亿美元,而学术机构Epoch AI的估算为2027年约10亿美元级别。无论取哪套参数,如此高昂的迭代投入,没有任何一轮私募融资能够独立承接,登陆公开市场、依托公众资本突破算力枷锁,成为所有头部AI企业的唯一出路。上市不是终点,是算力赎身的起点。

3

Anthropic这份对外公告,没有披露发行定价,没有明确上市时间表,却彻底改写了全球AI行业的竞争规则。谁率先完成公开市场资本化,谁就率先打破算力与资本的双重枷锁,划定行业后续的发展及格线。

它不是行业体量最大、市场声量最高的玩家,却是第一个看透行业本质的人:算力账单不会等待企业成长,依靠私募续命的路径走得越久,对外部算力的依附就越深,行业容错空间就越小。

2026年,绝非AI技术成熟的产业庆典,而是全球AI企业被算力成本倒逼的集体赎身行动。美股企业借上市挣脱算力捆绑、争夺产业自主权;国内企业靠双平台融资接力,支撑全球化算力布局与长期模型迭代。

全球赛道不同、节奏不同,但终极规律从未改变:所有光鲜的AI资本化叙事背后,都是一场不得不做的、关于算力与资本的生死突围

作者:长青

来源:AI唱反调

]]>
Anthropic与OpenAI缘何上演“抢滩登陆战”? //m.clubpenjuin.com/382044.html Tue, 02 Jun 2026 07:45:17 +0000 //m.clubpenjuin.com/?p=382044

 

在2000多年前的秦末乱世中,谁先入关中便抢得了先机;而如今在这场人工智能时代的AI初创巨头的“抢滩登陆战”中,先上市者或许也将能率先“称王”。

不少华尔街人士表示,在人工智能巨头OpenAIAnthropic的巅峰对决中,技术底牌的厚薄固然决定了长远的胜负,但眼下,谁能在这场资本拉力赛中率先扣响IPO(首次公开募股)的扳机,同样是一个足以扭转战局的致胜筹码。

如今,美股市场上的IPO窗口显然已经大开,整个资本市场正处于极度亢奋的蜜月期。就在上个月,AI芯片新贵Cerebras登陆美股首日便狂飙68%。在过去五年所有上市市值超百亿美元的公司中,仅数字设计平台Figma去年创下的250%的惊人涨幅超过了这一数字。

全球首富马斯克旗下的SpaceX上月已计划于今夏上市,这很可能是史上规模最大的IPO——目标估值高达逾1.5万亿美元。这将为IPO市场再添一把火。

这更让OpenAI和Anthropic有理由力争成为首家上市的大型人工智能模型开发商。Anthropic已于周一秘交招股书,最早可能于今年秋季上市;而OpenAI也一直在与投行合作筹备自己的上市申请。

“抢滩登陆战”缘何如此关键?

在这场资本长跑中,“第一名”不仅意味着无上的荣耀,更意味着难以估量的绝对优势。更残酷的是,沦为“第二名”或“落后者”将要付出的代价,往往是沉重的。

学术研究表明,IPO往往呈现行业集群化趋势,且在周期后半段上市的公司表现通常不尽如人意。这合乎情理,因为具有更深护城河的高质量公司往往会率先上市,从而带动一波可能实力稍逊的追随者。

而即便是在市场火热之际,可分配的资金也不是无限的。投资者可能会抛售其他股票转而涌入SpaceX,随后再进行调整,以便在今年晚些时候或明年押注OpenAI和Anthropic。而率先上市的那家很可能吞噬更多日益稀缺的资本。

要知道,OpenAI和Anthropic目前都在寻求天价估值。Anthropic最近的融资估值接近1万亿美元。OpenAI在3月的最新估值为8520亿美元。

“市场中的‘氧气’终究有限,”为全美各大交易所提供上市咨询服务的Issuer Network创始人Patrick Healy表示,“SpaceX将消耗海量资金,而第二个上市的公司将比第三个拥有更有利的地位。”

对于目前运营更加稳健、由Dario Amodei掌舵的Anthropic而言,眼下等待的代价显然可能尤其令人难以承受。鉴于奥尔特曼治下的OpenAI内部不断传出管理层震荡与内耗的负面杂音,一旦OpenAI率先上市却遭到市场冷遇——这种情况目前似乎很有可能发生,其引发的连锁反应可能会迫使Anthropic推迟或缩减上市计划。

这正是2019年网约车两大竞争对手Lyft和Uber Technologies上市时发生的情形。规模较小的Lyft率先启动IPO,但表现未达预期。

Lyft上市后股价的下跌直接影响了两个月后Uber的上市。尽管Uber下调了估值目标,但其股票在上市后仍出现下跌,即便当时其他科技股在市场上表现尚可。

两害相权取其轻

当然,抢先上市也并非毫无风险。

作为先行者,由于所处行业尚处于起步阶段且缺乏业绩记录,市场可能需要时间来反映其价值。

科技股上市历史上曾出现过这种情况。2012年,受市场对其能否适应向手机广告转型的担忧影响,Facebook股票在上市后的头三个月内市值缩水逾半。直到随后该公司展现出韧性,且投资者对其商业模式愈发放心,股价随后开启了持续上涨行情。但其他急于上市的公司——尤其是Twitter——最终也不得不推迟上市。

无论如何,两害相权取其轻,即便初登资本市场就要迎接狂风暴雨,Facebook等早期“抢跑者”依然能在等待股价回血的漫长黑夜里,率先收割到了公开市场的红利:这不仅包括IPO募集来的真金白银,更包括通过股权变现稳定军心、留住核心天才员工。

Renaissance Capital高级IPO市场策略师Matthew Kennedy表示,先走一步的人将能够定下基调,而走在第二的人看起来可能就像是一个落后者,并最终被迫在营销讨论中拿自己与对方进行对比。

这些赤裸裸的现实利益,也让OpenAI和Anthropic的上市争夺战演变成了一场今年必须见分晓的生死时速。

通过上市,Anthropic和OpenAI将能够接触到范围更广的股东群体,其中包括数以百万计的私人养老金投资者。上市还能提供资本,并允许公司将股票用于收购,以及用员工更容易出售的股票来奖励他们。

值得一提的是,目前即便Anthropic暂时取得了领先,但OpenAI或许也并未落后太远。据媒体报道,这家ChatGPT开发商正准备在未来几周内申请IPO,并正与高盛集团和摩根士丹利合作,在今年秋季可能上市之前提交一份秘密 IPO申请。

哪家公司率先上市——以及市场对此作何反应——将有助于塑造这两家公司的未来以及人工智能热潮的下一阶段,这既可能彰显市场对人工智能变革力量的信心,也可能对人工智能的过度扩张发出警示。

无论如何,筹码已经全部推向牌桌。而这场万亿赌局的赌注,正高到令人窒息……

作者:潇湘

来源:科创板日报

]]>