登录
星期二, 5 8 月, 2025
首页 中国新闻 中国MiniMax发布AI推理模型,宣称其超越了DeepSeek

中国MiniMax发布AI推理模型,宣称其超越了DeepSeek

admin

文章来源: 华尔街日报 – 新闻取自各大新闻媒体,新闻内容并不代表本网立场!
MiniMax表示,整个强化学习阶段用到512块英伟达H800芯片三周的时间,租赁成本为53.74万美元。DeepSeek此前曾表示,训练其最新的一个模型耗资560万美元。

中国人工智能(AI)领域的竞争日趋激烈之际,中国初创公司MiniMax发布了一款新的AI推理模型,并宣称该模型超越了DeepSeek。

总部位于上海的MiniMax本周早些时候发布了MiniMax-M1模型,该公司称M1在面向生产力的复杂场景中能力是开源模型中的最好一档,超过国内的闭源模型,接近海外最领先的模型。

MiniMax表示,M1支持目前业内最高的100万上下文的输入,是DeepSeek-R1的八倍,与谷歌(Google)的Gemini 2.5 Pro一样。更大的输入token上限(也称为上下文窗口)使模型能够处理更长、更复杂的信息。与此同时,MiniMax表示,M1在用8万token深度推理的时候,只需要使用DeepSeek-R1约30%的算力。

MiniMax表示,整个强化学习阶段用到512块英伟达(Nvidia) H800芯片三周的时间,租赁成本为53.74万美元。DeepSeek此前曾表示,训练其最新的一个模型耗资560万美元。

这家初创公司的估值为30亿美元,此前开发了一款名为Talkie、类似Character.ai的伴侣聊天机器人,Talkie在美国已变得非常流行。

MiniMax是中国领先的AI初创公司之一,被视为“AI六小龙”之一。这些独角兽公司中的大多数都获得了中国科技巨头阿里巴巴(Alibaba)和腾讯(Tencent)的投资,阿里巴巴和腾讯都寻求在中国国内孵化出能挑战OpenAI的企业。

DeepSeek的低成本、高性能R1模型是一种所谓的深度学习模型,用于完成需要进行大量数据处理和复杂计算的任务,该模型自今年年初以来已引起全球关注。

DeepSeek在上个月对R1模型进行了一次升级,外界普遍预计该公司将很快发布新的R2模型,分析师认为R2模型可能会进一步提高大语言模型训练和推理工作的效率。

MiniMax表示,未来几天还将推出更多更新。

(本文来自道琼斯通讯社)

相关新闻

发表评论

 (c) 2023 – 2025 All Right Reserved.