🤖 AI 热点新闻日报

2026年2月21日 · 星期六
1

MiniMax M2.5正式发布,全球首个原生Agent生产级模型

MiniMax 2026-02-21

MiniMax正式发布M2.5模型,这是全球首个专为Agent场景原生设计的生产级大模型。M2.5采用创新的Actor-Critic架构,内置任务规划、工具调用和反思机制。

架构创新:M2.5原生支持多步骤任务执行,无需外部框架即可实现复杂的Agent工作流。模型内置50+常用工具的知识,开箱即用支持网页浏览、代码执行、数据分析等任务。
MiniMax Agent 大模型
2

10B激活参数跑出旗舰成绩

MiniMax 2026-02-21

M2.5采用MoE架构,总参数100B但仅激活10B,在多项基准测试中超越GPT-4o和Claude 3.5 Sonnet。其高效的架构设计使推理成本降低至同等性能模型的1/5。

性能表现:在MMLU、HumanEval、GSM8K等基准测试中,M2.5均进入第一梯队。特别在多轮对话和复杂任务执行场景中,M2.5展现出超越参数规模的智能表现。
MoE 性能测试 效率
3

编程能力在权威基准测试中表现优异

MiniMax 2026-02-21

M2.5在HumanEval编程基准测试中达到94.7%的通过率,在SWE-bench真实代码任务中取得62.3%的成绩,超越GPT-4o。模型支持Python、JavaScript、Go等20+编程语言。

代码能力:M2.5不仅能生成代码,还能理解复杂代码库、进行bug修复和代码重构。在真实开发场景测试中,M2.5的代码采纳率达到78%,接近人类开发者水平。
编程 代码生成 基准测试
4

行业影响:中国AI Agent技术引领全球

行业分析 2026-02-21

M2.5的发布标志着中国在AI Agent领域取得全球领先地位。作为首个原生Agent架构的生产级模型,M2.5为行业树立了新的技术标杆,可能改变AI应用开发范式。

市场反应:M2.5发布后,MiniMax API调用量在24小时内增长800%。多家国际科技公司表示将评估M2.5在其产品中的应用潜力,中国AI模型的国际影响力持续提升。
中国AI Agent 国际影响