OpenAI急了：Anthropic正用AI编程把它拉下神坛

文章来源: 腾讯科技 – 新闻取自各大新闻媒体，新闻内容并不代表本网立场！

ChatGPT的发布让OpenAI一战封神，所有人都觉得这家AI公司会一直赢下去。然而在AI编程这条赛道上，占据先机的却并非OpenAI。

2025年2月份，竞争对手Anthropic低调发布了Claude Code。这款能够直接操作计算机、自主完成编程任务的AI智能体，在短短几个月内为Anthropic带来了超过25亿美元的年化收入。

与之相比，OpenAI的同类产品Codex，同期年化收入约为10亿美元。双方的差距不止一倍。

更令OpenAI尴尬的是，Anthropic的核心创始团队，正是几年前从OpenAI离开的那批人。

OpenAI位于旧金山Mission Bay的新总部大楼是一栋现代化的玻璃幕墙建筑。接待处摆放着介绍公司发展历程的宣传资料，楼梯间的墙壁上挂满了一系列里程碑事件的纪念海报：GPT系列、DALL·E、ChatGPT——每一幅都记录着这家公司过去几年的高光时刻。

但其中没有AI编程。

01 从Codex到Copilot：OpenAI错失的先发优势

OpenAI其实很早就开始了AI编程方向的探索。

2021年，奥特曼和OpenAI联合创始人格雷格·布罗克曼（Greg Brockman）还在旧金山Mission区的老办公室，向《连线》杂志记者展示了一个叫Codex的项目。它是GPT-3的一个分支版本，在GitHub的数十亿行开源代码上训练而成。用户输入一句自然语言描述，它就能生成一段相应的代码。

“它可以代表你在计算机世界里执行操作，”布罗克曼当时说，“你拥有一个可以执行命令的系统。”

但这个早期的技术积累，最终没有转化为产品层面的持续投入。

Codex被微软看中了。这家软件公司当时正在开发一个叫GitHub Copilot的产品，这是一款能嵌入程序员编辑器、提供代码补全功能的工具。一位早期加入OpenAI的员工回忆，当时的Codex“除了自动补全之外做不了太多事情”，但微软已经将其视为未来产品的重要方向。

2022年6月，GitHub Copilot正式发布，几个月内就吸引了数十万用户。

正常情况下，OpenAI应该会加大对这一方向的投入。但接下来发生的事情，让后来负责Codex产品的团队感到遗憾。

最初的Codex团队被解散了。一部分成员转去做DALL·E 2图像生成项目，一部分去参与GPT-4的训练。当时公司的首要目标是实现AGI，AI编程没有被视为需要独立投入的领域。

一位前团队成员说，之后的几年里，OpenAI没有专门的团队在开发AI编程产品。“当时的感觉是，这个领域已经被GitHub Copilot覆盖了，”毕竟微软会继续使用OpenAI的模型来迭代这个产品，不需要OpenAI自己操心。

几个月后，ChatGPT上线，两个月内用户数突破1亿。OpenAI完全被这次成功转移了注意力。

接下来的2023年和2024年，OpenAI把主要资源投入到多模态模型的研发上，致力于让AI理解图像、视频、音频，像人一样操作光标和键盘。当时Midjourney等产品正在兴起，行业普遍认为大语言模型需要具备处理多模态信息的能力，才能迈向更高层次的智能。

这个方向的选择本身没有问题。只是在这段时间里，AI编程这条赛道正在悄然生长，而OpenAI的注意力并不在这里。

02 专注编程赛道：Anthropic的差异化突围

Anthropic选择了另一条发展路径。

这家公司也做多模态模型和聊天机器人，但有一个方向始终没有放松：编程能力

布罗克曼后来在一个播客节目里谈到，Anthropic“从早期就非常专注在编程上”。他们不仅用算法竞赛题目训练模型，还往训练数据里加入了真实项目中那些结构混乱的代码，就像普通开发者日常面对的那种。“这是我们没有及时意识到重要性的地方，”他说。

2024年6月，Anthropic发布Claude Sonnet 3.5。很多开发者试用后发现，这个模型的编程能力确实突出。

一家叫Cursor的初创公司最先受益于此。几个二十多岁的年轻人做了一款产品：在代码编辑器里用自然语言提需求，AI直接帮忙修改代码。他们接入Sonnet 3.5后，用户量开始快速增长。据熟悉Cursor的人士透露，几个月内，Anthropic就开始内部测试自己的独立版本了，也就是后来的Claude Code。

Cursor火起来之后，OpenAI曾试图收购这家公司，但遭到拒绝。对方认为编程赛道潜力巨大，希望保持独立。

收购未能达成，OpenAI内部也开始有团队尝试AI编程方向。2024年底，几个小型团队陆续启动。

一个是安德烈·米申科（Andrey Mishchenko）和蒂博·索蒂奥（Thibault Sottiaux）带领的团队，这两人分别是Codex的研究负责人和前谷歌DeepMind研究员。他们最初的动机比较务实：用AI编程来加速AI研究，让AI自动管理训练任务、监控GPU集群，研究员就能腾出时间做更有创造性的工作。

另一个是亚历山大·恩比里科斯（Alexander Embiricos）带领的团队，他之前负责多模态智能体的研发。他做了一个叫Jam的演示项目，在公司内部引起了不少关注。

Jam和2021年的Codex有本质区别。Codex是输出代码让人来执行，Jam则可以直接进入命令行，自己运行代码。恩比里科斯看着电脑屏幕上那个跟踪Jam操作的自建页面一遍遍自动更新，感到有些不可思议。

“我以前一直以为多模态交互可能是实现AGI的路径，也许我们以后就是整天和AI共享屏幕，”他说，“但后来逐渐意识到，让模型以编程方式直接访问计算机，可能是更有效的方向。”

这几个团队磨合了几个月后合并在一起。等OpenAI在2025年初完成o3（比o1更针对编程任务优化的模型）的训练，他们终于有了构建产品的技术基础。

但这时，Claude Code已经准备公开发布了。

03 收购受阻与内部冲刺：OpenAI的双线应对

2025年2月，Claude Code以“有限研究预览”的形式首次亮相。5月，全面开放使用。

这个产品和之前流行的“氛围编码”模式不同。氛围编码是人主导、AI辅助的编程模式，由人做决策，AI执行具体操作。而Claude Code可以直接在命令行工作，访问用户的所有文件和应用程序，开发者可以把部分工作真正交给AI来完成。

OpenAI也开始加快节奏。

索蒂奥在3月组建了一个“冲刺团队”，把内部几个小组整合在一起，计划在几周内推出竞品。与此同时，奥特曼开始寻找收购目标，他们看上了一家叫Windsurf的AI编程初创公司，报价30亿美元。如果收购完成，产品、团队、企业客户都能快速补

但这笔交易被微软搁置了数月。

据《华尔街日报》报道，微软希望获得Windsurf的知识产权。这家云巨头从2021年起就用OpenAI的模型支撑着GitHub Copilot，每次财报电话会都会提及这个产品。但Cursor、Windsurf、Claude Code陆续出现后，GitHub Copilot的产品形态显得有些过气。此时OpenAI再推一个新的编码产品，微软的态度自然变得复杂。

Windsurf的交易正赶上OpenAI和微软重新谈判合作协议。OpenAI希望从微软那里争取更多自主权，不希望产品和算力资源被过度控制。这笔收购成了双方博弈过程中的牺牲品。到7月，交易正式告吹。后来谷歌招揽了Windsurf的创始人，剩余团队则被另一家编码初创公司Cognition收入麾下。

“我本来挺希望做成这笔交易的，”奥特曼说，“但不是每一笔交易都能控制。”

不过他提到，Codex团队的表现让他有些意外。谈判那几个月，索蒂奥和恩比里科斯一直在迭代产品，没有停下来。到8月，OpenAI开始加速推进自己的产品。

04 从5%到40%：Codex市场份额猛追

布罗克曼有一个自己设计的测试方法，叫“反向图灵测试”。他多年前亲自编写了这套程序，规则是这样的：两台电脑前各坐一个人，每人屏幕上有两个聊天窗口，一个连接着对面的人，一个连接着AI。目标是判断哪个窗口是AI，同时还得让对方以为你才是AI。

去年大部分时间，OpenAI最好的模型要完成这个游戏的代码编写，需要好几个小时，中间还得有人一步步引导。到12月，Codex用GPT-5.2做引擎，一个结构清晰的提示词输入后，就能直接生成一个可运行的游戏。

感受到变化的不仅仅是布罗克曼。开发者社区里开始频繁讨论AI编程智能体的能力提升，话题从硅谷扩散到更广的范围。一些没有编程背景的人，也开始尝试用这些工具做些简单的软件项目。

Anthropic和OpenAI都在争抢用户。有开发者表示，自己每月支付200美元的Codex或Claude Code订阅费，实际能用到价值1000多美元的服务。两家公司都在用慷慨的用量限制把用户往工作流里引导，等人用习惯了，再按实际用量收费。

从数据上看，OpenAI确实在缩小差距。

2025年9月，Codex的使用量大约是Claude Code的5%。到2026年1月，这个比例上升到接近40%。

Notion的联合创始人西蒙·拉斯特（Simon Last）说，他和团队在GPT-5.2发布后从Claude Code切换到了Codex，主要原因是后者更稳定。“我发现Claude Code有时候会给出不准确的信息，”他说，“它说自己正在处理任务，实际上并没有进展。”

在OpenAI负责Codex行为研究的凯蒂·施（Katy Shi）说，有些用户觉得Codex的回应风格偏“干”，但越来越多人开始接受这种不刻意迎合的特点。“工程领域的工作，本来就需要能够接受批评性反馈，不能因为表达方式直接就觉得被冒犯。”

企业客户也在逐步进入。OpenAI应用部门的CEO菲吉·西莫（Fidji Simo）称：“ChatGPT已经成为AI领域的代表性产品，这在B2B市场是一个明显优势，多数企业倾向于使用员工已经熟悉的技术。”OpenAI销售Codex的策略，主要是将其打包进ChatGPT的企业套件中一并提供。

思科的总裁杰图·帕特尔（Jeetu Patel）告诉员工，不用太在意使用Codex产生的费用，关键是要熟悉这个工具。有员工问他用了之后会不会失业，他的回答是：“不会，但不用一定会失业。不熟悉这些工具的人，慢慢会失去竞争力。”

有开发者认为，OpenAI在B端市场的渠道优势正在发挥作用。不少公司已经采购了ChatGPT的企业版，在此基础上增加一个Codex功能，决策成本并不高。

也有分析指出，Codex最近的能力提升与GPT-5.2的推理能力优化直接相关。o系列模型采用的训练方法，即让模型在结果可验证的编程任务中不断试错、获得反馈，这对代码生成的质量有明显帮助。编程本身就是一个反馈信号明确的领域，代码要么能运行要么不能，这种特性对模型迭代很有利。

05 奥特曼的难题：既要速度，又怕失控

AI编程智能体的影响已经不限于开发者社区

《华尔街日报》上个月将科技股1万亿美元的抛售部分归因于Claude Code，因为投资者担心软件本身的价值可能被压缩。之后Anthropic宣布，Claude Code可以对IBM那些运行COBOL语言的老系统进行现代化改造，IBM的股票遭遇了25年来最大单日跌幅。

OpenAI也在加大投入。今年的超级碗广告，他们投放的是Codex，而不是ChatGPT。

在OpenAI总部，Codex的使用已经相当普遍。多位工程师提到，他们现在很少手写代码，每天的工作主要是和Codex交互。

一位参与了内部黑客马拉松的工程师描述说，现场大约100人，用四小时时间通过Codex搭建一个可用的演示项目。不少项目既是用Codex开发的，目标也是为了让工程师更好使用Codex。有的团队做了个工具，把Slack消息自动汇总成周报，有的团队用AI生成了一个内部服务的百科式指南。以前这些事情可能需要几天才能完成，现在一个下午就能跑通流程。

凯文·维尔（Kevin Weil）是前Instagram高管，目前负责OpenAI for Science部门，为研究人员开发AI产品。他说Codex现在会在夜间帮他处理一些项目，早上到公司检查进度就行。这种做法已经成了他和几百名同事的日常工作方式。OpenAI 2026年的目标之一是开发一个能够自主进行AI研究的AI实习生。

西莫表示，Codex最终会整合进ChatGPT和所有产品线，不仅是用来编程，而是协助处理各种任务。

奥特曼说他想发布一个通用版本的Codex，但对安全性还有些顾虑。1月底，他一个非技术背景的朋友请他帮忙安装OpenClaw，但他没有答应，认为“现在还不是时候”，那个智能体可能会误删重要文件。但这件事过去几周后，OpenAI就把OpenClaw的创作者招进了公司。

不少开发者认为，Codex和Claude Code之间的差距确实在缩小，但也有机构对OpenAI的进度表示担忧。一个叫Midas Project的非营利组织发布报告称，OpenAI在GPT-5.3-Codex上没有完整披露网络安全风险，安全承诺的落实情况不够透明。OpenAI的对齐负责人阿米莉亚·格拉泽（Amelia Glaese）否认为了推进Codex而牺牲安全，表示Midas对公司的承诺存在误解。

布罗克曼对AGI的进展保持乐观，认为“项目正在按计划推进”。但在不少硅谷工程师的印象里，他一直是那种产品发布前夜还在检查代码库细节的负责人。

现在的状况不太一样了。布罗克曼面对的是几十万个AI智能体，在执行具体的任务和项目。他说这种新的工作方式“让人感觉轻松了一些，因为以前确实需要记住很多细节”。但有时候，“你不太清楚那些事情具体是怎么被解决的”。

他说，这种变化会让你“感觉对问题的感知不像以前那么敏锐了”。

OpenAI急了：Anthropic正用AI编程把它拉下神坛

伊朗最新消息：美国称在石油航线附近击沉16艘伊朗布雷船

特朗普总统：“史诗狂怒行动”头14天已“重创”伊朗恐怖政权，美以部队将继续进行“非常猛烈”的打击

相关新闻

发表评论 撤销回复

发表评论撤销回复