AI 热点新闻日报 - 2026年2月21日

1

MiniMax M2.5正式发布，全球首个原生Agent生产级模型

MiniMax 2026-02-21

MiniMax正式发布M2.5模型，这是全球首个专为Agent场景原生设计的生产级大模型。M2.5采用创新的Actor-Critic架构，内置任务规划、工具调用和反思机制。

                    架构创新：M2.5原生支持多步骤任务执行，无需外部框架即可实现复杂的Agent工作流。模型内置50+常用工具的知识，开箱即用支持网页浏览、代码执行、数据分析等任务。
                

MiniMax Agent 大模型

2

MiniMax 2026-02-21

M2.5采用MoE架构，总参数100B但仅激活10B，在多项基准测试中超越GPT-4o和Claude 3.5 Sonnet。其高效的架构设计使推理成本降低至同等性能模型的1/5。

                    性能表现：在MMLU、HumanEval、GSM8K等基准测试中，M2.5均进入第一梯队。特别在多轮对话和复杂任务执行场景中，M2.5展现出超越参数规模的智能表现。
                

MoE 性能测试效率

3

MiniMax 2026-02-21

M2.5在HumanEval编程基准测试中达到94.7%的通过率，在SWE-bench真实代码任务中取得62.3%的成绩，超越GPT-4o。模型支持Python、JavaScript、Go等20+编程语言。

                    代码能力：M2.5不仅能生成代码，还能理解复杂代码库、进行bug修复和代码重构。在真实开发场景测试中，M2.5的代码采纳率达到78%，接近人类开发者水平。
                

编程代码生成基准测试

4

行业分析 2026-02-21

M2.5的发布标志着中国在AI Agent领域取得全球领先地位。作为首个原生Agent架构的生产级模型，M2.5为行业树立了新的技术标杆，可能改变AI应用开发范式。

                    市场反应：M2.5发布后，MiniMax API调用量在24小时内增长800%。多家国际科技公司表示将评估M2.5在其产品中的应用潜力，中国AI模型的国际影响力持续提升。
                

中国AI Agent 国际影响