罕见!Anthropic向全人类发出警告:停止研究AI!

文章来源: 倍可亲 – 新闻取自各大新闻媒体及互联网，新闻内容并不代表本网立场

　　AI造AI，已经发生了！Anthropic重磅长文揭秘，超80%代码由Claude编写，工程师人均产出暴增8倍，Mythos研究提速52倍。看着如此恐怖的进化速度，Anthropic却发出呼吁：必要时，请暂停AI研发。

　　AI造AI的时代，已然降临！

就在刚刚，Anthropic扔出了一篇重磅长文：When AI builds itself（当AI开始造AI）。

　　打开这篇博客，满屏只透出一个词：加速！

这一次，他们用最硬核的真实数据，把AI「递归自我改进」（RSI）彻底砸到了台面上——

　　在Anthropic内部，超80%的代码，全由Claude编写；

　工程师人均代码产出较2024年暴涨8倍，许多研究员已经5个月，没有手写过一行代码；

　　最开放的工程难题上，Claude成功率半年从26%飙到76%；

　　优化训练代码，人类4-8小时做到4倍加速，Claude Mythos Preview直接干到52倍。

　「递归自我改进」的奇点尚未彻底降临，但它逼近的速度，恐怕已超出全球所有顶尖实验室的准备。

　　然而，最具戏剧性的一幕出现了：

　　就在Anthropic不断铺陈RSI，将以何等惊人的速度到来时，却突然发出严肃呼吁——

　　必要时，一起按下前沿AI的「暂停键」。

　一时间，这篇博文全网刷屏，许多人疯狂安利：墙裂建议每个人都读一读！

80%的代码，出自Claude之手

　　整篇文章，Anthropic都在向外界证实一个令人胆寒的现实——

　　Claude正在疯狂按下AI进化的「加速键」。

　　他们正在蹚出一条通向「递归自我改进」的现实路径：让AI亲手打造出比自己更强大的下一代系统。

而这一切，比所有人预想的还要快。

　　截至2026年5月，Anthropic合入代码库的代码中，超80%由Claude撰写。

　　而在2025年2月Claude Code发布之前，这个数字还停留在「个位数」。

　　一年多时间，从「打打下手」到「包揽八成」。

Claude进化时间线

　　产能端的变化更直观。2021到2024年，Anthropic工程师人均每天合入的代码量基本是一条水平线。

　　2025年，Claude开始自己运行代码，曲线第一次上扬；

　　2026年，模型开始在更长时间跨度上自主工作，曲线第二次陡升。

　　到2026年第二季度，典型工程师的日代码合入量，已经是2024年的8倍。

一位Anthropic员工的自述更扎心：

　　大约一年前我开始全力「Claude化」。这是一场疯狂的冒险——到现在，我已经有约5个月没自己写过任何代码了。

不过，Anthropic也很诚实地补了一刀：

　　代码行数衡量数量多过质量，8倍肯定高估了真实生产力。

　　但2026年3月，对130名研究人员的内部调查显示，中位数受访者估计，自己的产出是没有AI时的4倍左右。

不光写得多，写得还比人好

　　量大管饱，那Claude输出的质量如何？

　　Anthropic给出了两个判断标准：代码能不能跑，以及别的工程师能不能看懂、能不能在上面继续盖楼。

　　第一条，证据已经非常硬核。

　　过去一年，研究员纠正、打断、中途接管Claude任务的比率持续下降——

　　哪怕是在最复杂、最开放的任务上。

　　在最开放的任务难度档位上，Claude的成功率在2026年5月达到了76%，6个月暴涨50个百分点。

举个真实案例：一次例行升级，突然让数万个训练任务集体崩溃。

　　工程师只丢给Claude一段文字描述和集群权限，Claude在运行中的任务里逐一排查环境变量，揪出了那个极其隐蔽的调试标志，复现、验证、修复

　　两小时，Claude干完了正常需要两三天的活。

更夸张的是2026年4月的一次「大扫除」，Claude一口气提交了800多个修复，把一类API错误压低了1000倍。

　负责监督的工程师估算：这些活儿如果让人来干，得花4年。

　　第二条标准，差距还在，但正在以肉眼可见的速度消失。Anthropic内部的共识是：

　　我们预计Claude编写的代码，将在今年内全面超越人类。

Claude写代码，Claude审代码，这个闭环已经转起来了。

Anthropic每次发新模型，都会做同一个测试：

　　给Claude一段训练小型AI模型的代码，要求它在保证正确性的前提下，跑得越快越好。

　　这本质上，就是一个微缩版的AI研究实验循环——改代码、跑、计时、再改。

　　看看这份极具压迫感的「成绩单」：

　　2025年5月：Claude Opus 4约3倍加速2026年4月：Claude Mythos Preview约52倍加速

　　而一位熟练的人类研究员，需要4到8小时，才能做到4倍。

　　一年时间，Claude从「超级有用」到「超人水平」。在这种目标明确的实验优化环节，人类已经被甩出了一个数量级。

更重磅的是，Claude开始展现「研究判断力」的苗头。

　　Anthropic做了一个极其刁钻的实验：他们翻出真实研究session里人类研究员「走弯路」的129个时刻，把弯路之前的全部上下文喂给Claude，问它：下一步该怎么走？

　　再让另一个能看到完整结局的Claude当裁判。

　　结果，2025年11月的Opus 4.5，有51%的概率给出比人类更优的下一步；

　　2026年4月的Mythos Preview，这个数字涨到了64%。

　　还有那个著名的「端到端」实验：Claude智能体被丢进一个开放的AI安全难题，自己提假设、自己设计实验、自己和并行智能体交换发现。

　　两位人类研究员花一周，只追回了23%的性能差距；

　　Claude智能体军团用800个累计小时、约1.8万美元算力，追回了97%。

人类唯一的实质性贡献，只剩下：选了这个题。

AI留给人类「1%灵感」

　　所剩时间不多了

　　把以上所有证据拼在一起，一幅图景浮现出来：

　　在AI开发的每一个环节，人类的角色都在收窄。

　　写代码？Claude包了。跑实验？Claude比你快一个数量级。判断下一步？Claude正在追上来。

　　Anthropic的判断是：一旦人类和AI的代码质量达到平价，人类将彻底停止写代码，只负责审查。

　　但问题来了，如果人类审查的速度跟不上Claude生成的速度，人类自己就会变成AI发展的瓶颈。

　　这正是计算机科学里经典的「阿姆达尔定律」（Amdahl’s law）——

　　整体速度，永远被那个没提速的环节卡住。

　Anthropic已经撞上了第一堵墙：代码审查排队。

　　第二堵墙也来了：员工和强大模型合作之后，新想法、新工具、新模拟的产出量爆炸，多到公司根本没有能力全部消化。

目前，人类仅存的比较优势，叫做「研究品味」——

　　判断哪些问题值得做、哪些结果可信、哪条路是死胡同。

　　但Anthropic毫不留情地补了一刀，爱迪生说天才是1%的灵感加99%的汗水，而我们看到，汗水正在被全面自动化。

　　文章里有一段非常清醒的论述：AI的进步很少靠「灵光一现」。

　　Transformer这种范式级灵感，几年才出一次；

　　之间的绝大多数进步，靠的都是「放大、看哪坏了、修好、再试」。这恰恰是Claude最擅长的工作流。

　　至于「研究品味」？

　　Anthropic的原话是，它可能只是又一个AI暂时不会、然后突然就会了的能力。解释笑话、心智理论、语言谜题——哪一个不是这么被攻克的？

三种未来

　　Anthropic押注最后两个

　　那接下来会发生什么？Anthropic给出了三种剧本。

　　剧本一：趋势停滞，S曲线见顶。

　　也许「研究品味」就是堆算力堆不出来的；也许瓶颈在芯片、电网和供应链。

　　但即便模型能力今天就冻结，世界也回不去了——

　　Project Glasswing的Mythos Preview，仅在最初几周就在全球关键系统中，找出了超过10000个高危和严重级漏洞，多到网络防御的瓶颈从「找漏洞」变成了「来不及打补丁」。

　　不过Anthropic自己都说：这是三种剧本里他们最不相信的一种。

　　因为到目前为止，每一条能测量的能力曲线，都没有弯。

　　剧本二：复合加速持续，人类掌舵，

　　AI研发大幅自动化，人类继续掌舵方向。100人的公司干出10万人组织的活儿。

这是Anthropic认为最可能的走向——

　　但效率的另一面，是整套能力同样可以服务于全民监控和千人千面的操纵机器。

　　剧本三：完全的递归自我改进。

　　AI自己设计、训练、迭代自己的继任者。AI进步的速度只取决于算力供给，人类退居验证和监督。

　　Anthropic罕见地承认：对这个世界，「我们没有好的直觉」——

　　今天模型里那些罕见的失准行为，可能在一代代自我构建中复合放大，越来越频繁，越来越难以理解，直到失控。

　　上个月在伦敦的演讲，联创Jack Clark给出过一个更具体的数字：

　　2028年底前，出现递归自我改进的概率为60% 。

　　警告全球：必要时，暂停AI

　　于是，就有了这篇博客，最戏剧性的部分。Anthropic公开写道：

　　我们相信，让世界拥有「减速或暂停前沿AI开发」的选项，是一件好事—— 这能让社会结构和对齐研究跟上技术的脚步。

注意，他们没有天真地喊「都停下」。

　　Anthropic说得很清楚：如果只有谨慎者放慢脚步，等于把领先优势拱手送给最不谨慎的人。

　　所以真正需要的，是多国、多个前沿实验室、在同样条件下同时停，且彼此可验证。

当AI开始造AI，正叩开ASI的大门

　　人类通往超级智能（ASI）的路径上，一直横着一道理论上的「最后关卡」：智能爆炸的临界点。

　　当AI改进AI的速度，超过人类改进AI的速度，飞轮就会脱离人类的手，开始自转，且越转越快。

　　今天，全球估值最高的AI公司之一，拿着自家代码库的提交记录告诉你：

　　跨越临界的倒计时，已经悄然开启。

剩下的，只有最后一格：研究品味。

　　一旦这格被点亮，AI研发的速度将只由算力决定。从AGI到ASI的距离，可能短到以「模型代际」来计量。

　　到那时，受益的将远超AI本身——

　　药物研发、材料科学、能源、机器人，每一个领域，都会被这台自我加速的智能引擎重新发动。

罕见!Anthropic向全人类发出警告:停止研究AI!

今日台湾香港澳门新加坡晚间新闻摘要（美东时间 2026年6月5日 星期五）

今日体育晚间新闻摘要（美东时间 2026年6月5日 星期五）

相关新闻

发表评论 撤销回复

今日台湾香港澳门新加坡晚间新闻摘要（美东时间 2026年6月5日星期五）

今日体育晚间新闻摘要（美东时间 2026年6月5日星期五）

发表评论撤销回复