中国MiniMax发布AI推理模型，宣称其超越了DeepSeek

被 admin 2025年6月21日

2025年6月21日

文章来源: 华尔街日报 – 新闻取自各大新闻媒体，新闻内容并不代表本网立场！
MiniMax表示，整个强化学习阶段用到512块英伟达H800芯片三周的时间，租赁成本为53.74万美元。DeepSeek此前曾表示，训练其最新的一个模型耗资560万美元。

中国人工智能(AI)领域的竞争日趋激烈之际，中国初创公司MiniMax发布了一款新的AI推理模型，并宣称该模型超越了DeepSeek。

总部位于上海的MiniMax本周早些时候发布了MiniMax-M1模型，该公司称M1在面向生产力的复杂场景中能力是开源模型中的最好一档，超过国内的闭源模型，接近海外最领先的模型。

MiniMax表示，M1支持目前业内最高的100万上下文的输入，是DeepSeek-R1的八倍，与谷歌(Google)的Gemini 2.5 Pro一样。更大的输入token上限（也称为上下文窗口）使模型能够处理更长、更复杂的信息。与此同时，MiniMax表示，M1在用8万token深度推理的时候，只需要使用DeepSeek-R1约30%的算力。

MiniMax表示，整个强化学习阶段用到512块英伟达(Nvidia) H800芯片三周的时间，租赁成本为53.74万美元。DeepSeek此前曾表示，训练其最新的一个模型耗资560万美元。

这家初创公司的估值为30亿美元，此前开发了一款名为Talkie、类似Character.ai的伴侣聊天机器人，Talkie在美国已变得非常流行。

MiniMax是中国领先的AI初创公司之一，被视为“AI六小龙”之一。这些独角兽公司中的大多数都获得了中国科技巨头阿里巴巴(Alibaba)和腾讯(Tencent)的投资，阿里巴巴和腾讯都寻求在中国国内孵化出能挑战OpenAI的企业。

DeepSeek的低成本、高性能R1模型是一种所谓的深度学习模型，用于完成需要进行大量数据处理和复杂计算的任务，该模型自今年年初以来已引起全球关注。

DeepSeek在上个月对R1模型进行了一次升级，外界普遍预计该公司将很快发布新的R2模型，分析师认为R2模型可能会进一步提高大语言模型训练和推理工作的效率。

MiniMax表示，未来几天还将推出更多更新。

（本文来自道琼斯通讯社）

上一个新闻

【本站编译】突发新闻！特朗普称美国战机对伊朗三处核设施实施“成功”袭击

下一个新闻

中国MiniMax发布AI推理模型，宣称其超越了DeepSeek

【本站编译】突发新闻！特朗普称美国战机对伊朗三处核设施实施“成功”袭击

特朗普发表全国讲话：美国已空袭伊朗核设施

相关新闻

发表评论 撤销回复

发表评论撤销回复