文章来源: 腾讯科技 – 新闻取自各大新闻媒体,新闻内容并不代表本网立场!
ChatGPT的发布让OpenAI一战封神,所有人都觉得这家AI公司会一直赢下去。然而在AI编程这条赛道上,占据先机的却并非OpenAI。
2025年2月份,竞争对手Anthropic低调发布了Claude Code。这款能够直接操作计算机、自主完成编程任务的AI智能体,在短短几个月内为Anthropic带来了超过25亿美元的年化收入。

与之相比,OpenAI的同类产品Codex,同期年化收入约为10亿美元。双方的差距不止一倍。
更令OpenAI尴尬的是,Anthropic的核心创始团队,正是几年前从OpenAI离开的那批人。
OpenAI位于旧金山Mission Bay的新总部大楼是一栋现代化的玻璃幕墙建筑。接待处摆放着介绍公司发展历程的宣传资料,楼梯间的墙壁上挂满了一系列里程碑事件的纪念海报:GPT系列、DALL·E、ChatGPT——每一幅都记录着这家公司过去几年的高光时刻。
但其中没有AI编程。
01 从Codex到Copilot:OpenAI错失的先发优势
OpenAI其实很早就开始了AI编程方向的探索。
2021年,奥特曼和OpenAI联合创始人格雷格·布罗克曼(Greg Brockman)还在旧金山Mission区的老办公室,向《连线》杂志记者展示了一个叫Codex的项目。它是GPT-3的一个分支版本,在GitHub的数十亿行开源代码上训练而成。用户输入一句自然语言描述,它就能生成一段相应的代码。
“它可以代表你在计算机世界里执行操作,”布罗克曼当时说,“你拥有一个可以执行命令的系统。”
但这个早期的技术积累,最终没有转化为产品层面的持续投入。
Codex被微软看中了。这家软件公司当时正在开发一个叫GitHub Copilot的产品,这是一款能嵌入程序员编辑器、提供代码补全功能的工具。一位早期加入OpenAI的员工回忆,当时的Codex“除了自动补全之外做不了太多事情”,但微软已经将其视为未来产品的重要方向。
2022年6月,GitHub Copilot正式发布,几个月内就吸引了数十万用户。

正常情况下,OpenAI应该会加大对这一方向的投入。但接下来发生的事情,让后来负责Codex产品的团队感到遗憾。
最初的Codex团队被解散了。一部分成员转去做DALL·E 2图像生成项目,一部分去参与GPT-4的训练。当时公司的首要目标是实现AGI,AI编程没有被视为需要独立投入的领域。
一位前团队成员说,之后的几年里,OpenAI没有专门的团队在开发AI编程产品。“当时的感觉是,这个领域已经被GitHub Copilot覆盖了,”毕竟微软会继续使用OpenAI的模型来迭代这个产品,不需要OpenAI自己操心。
几个月后,ChatGPT上线,两个月内用户数突破1亿。OpenAI完全被这次成功转移了注意力。
接下来的2023年和2024年,OpenAI把主要资源投入到多模态模型的研发上,致力于让AI理解图像、视频、音频,像人一样操作光标和键盘。当时Midjourney等产品正在兴起,行业普遍认为大语言模型需要具备处理多模态信息的能力,才能迈向更高层次的智能。
这个方向的选择本身没有问题。只是在这段时间里,AI编程这条赛道正在悄然生长,而OpenAI的注意力并不在这里。
02 专注编程赛道:Anthropic的差异化突围
Anthropic选择了另一条发展路径。
这家公司也做多模态模型和聊天机器人,但有一个方向始终没有放松:编程能力
布罗克曼后来在一个播客节目里谈到,Anthropic“从早期就非常专注在编程上”。他们不仅用算法竞赛题目训练模型,还往训练数据里加入了真实项目中那些结构混乱的代码,就像普通开发者日常面对的那种。“这是我们没有及时意识到重要性的地方,”他说。
2024年6月,Anthropic发布Claude Sonnet 3.5。很多开发者试用后发现,这个模型的编程能力确实突出。

一家叫Cursor的初创公司最先受益于此。几个二十多岁的年轻人做了一款产品:在代码编辑器里用自然语言提需求,AI直接帮忙修改代码。他们接入Sonnet 3.5后,用户量开始快速增长。据熟悉Cursor的人士透露,几个月内,Anthropic就开始内部测试自己的独立版本了,也就是后来的Claude Code。
Cursor火起来之后,OpenAI曾试图收购这家公司,但遭到拒绝。对方认为编程赛道潜力巨大,希望保持独立。
收购未能达成,OpenAI内部也开始有团队尝试AI编程方向。2024年底,几个小型团队陆续启动。
一个是安德烈·米申科(Andrey Mishchenko)和蒂博·索蒂奥(Thibault Sottiaux)带领的团队,这两人分别是Codex的研究负责人和前谷歌DeepMind研究员。他们最初的动机比较务实:用AI编程来加速AI研究,让AI自动管理训练任务、监控GPU集群,研究员就能腾出时间做更有创造性的工作。
另一个是亚历山大·恩比里科斯(Alexander Embiricos)带领的团队,他之前负责多模态智能体的研发。他做了一个叫Jam的演示项目,在公司内部引起了不少关注。
Jam和2021年的Codex有本质区别。Codex是输出代码让人来执行,Jam则可以直接进入命令行,自己运行代码。恩比里科斯看着电脑屏幕上那个跟踪Jam操作的自建页面一遍遍自动更新,感到有些不可思议。
“我以前一直以为多模态交互可能是实现AGI的路径,也许我们以后就是整天和AI共享屏幕,”他说,“但后来逐渐意识到,让模型以编程方式直接访问计算机,可能是更有效的方向。”
这几个团队磨合了几个月后合并在一起。等OpenAI在2025年初完成o3(比o1更针对编程任务优化的模型)的训练,他们终于有了构建产品的技术基础。
但这时,Claude Code已经准备公开发布了。
03 收购受阻与内部冲刺:OpenAI的双线应对
2025年2月,Claude Code以“有限研究预览”的形式首次亮相。5月,全面开放使用。
这个产品和之前流行的“氛围编码”模式不同。氛围编码是人主导、AI辅助的编程模式,由人做决策,AI执行具体操作。而Claude Code可以直接在命令行工作,访问用户的所有文件和应用程序,开发者可以把部分工作真正交给AI来完成。
OpenAI也开始加快节奏。
索蒂奥在3月组建了一个“冲刺团队”,把内部几个小组整合在一起,计划在几周内推出竞品。与此同时,奥特曼开始寻找收购目标,他们看上了一家叫Windsurf的AI编程初创公司,报价30亿美元。如果收购完成,产品、团队、企业客户都能快速补

但这笔交易被微软搁置了数月。
据《华尔街日报》报道,微软希望获得Windsurf的知识产权。这家云巨头从2021年起就用OpenAI的模型支撑着GitHub Copilot,每次财报电话会都会提及这个产品。但Cursor、Windsurf、Claude Code陆续出现后,GitHub Copilot的产品形态显得有些过气。此时OpenAI再推一个新的编码产品,微软的态度自然变得复杂。
Windsurf的交易正赶上OpenAI和微软重新谈判合作协议。OpenAI希望从微软那里争取更多自主权,不希望产品和算力资源被过度控制。这笔收购成了双方博弈过程中的牺牲品。到7月,交易正式告吹。后来谷歌招揽了Windsurf的创始人,剩余团队则被另一家编码初创公司Cognition收入麾下。
“我本来挺希望做成这笔交易的,”奥特曼说,“但不是每一笔交易都能控制。”
不过他提到,Codex团队的表现让他有些意外。谈判那几个月,索蒂奥和恩比里科斯一直在迭代产品,没有停下来。到8月,OpenAI开始加速推进自己的产品。
04 从5%到40%:Codex市场份额猛追
布罗克曼有一个自己设计的测试方法,叫“反向图灵测试”。他多年前亲自编写了这套程序,规则是这样的:两台电脑前各坐一个人,每人屏幕上有两个聊天窗口,一个连接着对面的人,一个连接着AI。目标是判断哪个窗口是AI,同时还得让对方以为你才是AI。
去年大部分时间,OpenAI最好的模型要完成这个游戏的代码编写,需要好几个小时,中间还得有人一步步引导。到12月,Codex用GPT-5.2做引擎,一个结构清晰的提示词输入后,就能直接生成一个可运行的游戏。

感受到变化的不仅仅是布罗克曼。开发者社区里开始频繁讨论AI编程智能体的能力提升,话题从硅谷扩散到更广的范围。一些没有编程背景的人,也开始尝试用这些工具做些简单的软件项目。
Anthropic和OpenAI都在争抢用户。有开发者表示,自己每月支付200美元的Codex或Claude Code订阅费,实际能用到价值1000多美元的服务。两家公司都在用慷慨的用量限制把用户往工作流里引导,等人用习惯了,再按实际用量收费。
从数据上看,OpenAI确实在缩小差距。
2025年9月,Codex的使用量大约是Claude Code的5%。到2026年1月,这个比例上升到接近40%。
Notion的联合创始人西蒙·拉斯特(Simon Last)说,他和团队在GPT-5.2发布后从Claude Code切换到了Codex,主要原因是后者更稳定。“我发现Claude Code有时候会给出不准确的信息,”他说,“它说自己正在处理任务,实际上并没有进展。”
在OpenAI负责Codex行为研究的凯蒂·施(Katy Shi)说,有些用户觉得Codex的回应风格偏“干”,但越来越多人开始接受这种不刻意迎合的特点。“工程领域的工作,本来就需要能够接受批评性反馈,不能因为表达方式直接就觉得被冒犯。”
企业客户也在逐步进入。OpenAI应用部门的CEO菲吉·西莫(Fidji Simo)称:“ChatGPT已经成为AI领域的代表性产品,这在B2B市场是一个明显优势,多数企业倾向于使用员工已经熟悉的技术。”OpenAI销售Codex的策略,主要是将其打包进ChatGPT的企业套件中一并提供。
思科的总裁杰图·帕特尔(Jeetu Patel)告诉员工,不用太在意使用Codex产生的费用,关键是要熟悉这个工具。有员工问他用了之后会不会失业,他的回答是:“不会,但不用一定会失业。不熟悉这些工具的人,慢慢会失去竞争力。”
有开发者认为,OpenAI在B端市场的渠道优势正在发挥作用。不少公司已经采购了ChatGPT的企业版,在此基础上增加一个Codex功能,决策成本并不高。
也有分析指出,Codex最近的能力提升与GPT-5.2的推理能力优化直接相关。o系列模型采用的训练方法,即让模型在结果可验证的编程任务中不断试错、获得反馈,这对代码生成的质量有明显帮助。编程本身就是一个反馈信号明确的领域,代码要么能运行要么不能,这种特性对模型迭代很有利。
05 奥特曼的难题:既要速度,又怕失控
AI编程智能体的影响已经不限于开发者社区
《华尔街日报》上个月将科技股1万亿美元的抛售部分归因于Claude Code,因为投资者担心软件本身的价值可能被压缩。之后Anthropic宣布,Claude Code可以对IBM那些运行COBOL语言的老系统进行现代化改造,IBM的股票遭遇了25年来最大单日跌幅。
OpenAI也在加大投入。今年的超级碗广告,他们投放的是Codex,而不是ChatGPT。

在OpenAI总部,Codex的使用已经相当普遍。多位工程师提到,他们现在很少手写代码,每天的工作主要是和Codex交互。
一位参与了内部黑客马拉松的工程师描述说,现场大约100人,用四小时时间通过Codex搭建一个可用的演示项目。不少项目既是用Codex开发的,目标也是为了让工程师更好使用Codex。有的团队做了个工具,把Slack消息自动汇总成周报,有的团队用AI生成了一个内部服务的百科式指南。以前这些事情可能需要几天才能完成,现在一个下午就能跑通流程。
凯文·维尔(Kevin Weil)是前Instagram高管,目前负责OpenAI for Science部门,为研究人员开发AI产品。他说Codex现在会在夜间帮他处理一些项目,早上到公司检查进度就行。这种做法已经成了他和几百名同事的日常工作方式。OpenAI 2026年的目标之一是开发一个能够自主进行AI研究的AI实习生。
西莫表示,Codex最终会整合进ChatGPT和所有产品线,不仅是用来编程,而是协助处理各种任务。
奥特曼说他想发布一个通用版本的Codex,但对安全性还有些顾虑。1月底,他一个非技术背景的朋友请他帮忙安装OpenClaw,但他没有答应,认为“现在还不是时候”,那个智能体可能会误删重要文件。但这件事过去几周后,OpenAI就把OpenClaw的创作者招进了公司。
不少开发者认为,Codex和Claude Code之间的差距确实在缩小,但也有机构对OpenAI的进度表示担忧。一个叫Midas Project的非营利组织发布报告称,OpenAI在GPT-5.3-Codex上没有完整披露网络安全风险,安全承诺的落实情况不够透明。OpenAI的对齐负责人阿米莉亚·格拉泽(Amelia Glaese)否认为了推进Codex而牺牲安全,表示Midas对公司的承诺存在误解。
布罗克曼对AGI的进展保持乐观,认为“项目正在按计划推进”。但在不少硅谷工程师的印象里,他一直是那种产品发布前夜还在检查代码库细节的负责人。
现在的状况不太一样了。布罗克曼面对的是几十万个AI智能体,在执行具体的任务和项目。他说这种新的工作方式“让人感觉轻松了一些,因为以前确实需要记住很多细节”。但有时候,“你不太清楚那些事情具体是怎么被解决的”。
他说,这种变化会让你“感觉对问题的感知不像以前那么敏锐了”。