MiniMax正式发布M2.5模型,这是全球首个专为Agent场景原生设计的生产级大模型。M2.5采用创新的Actor-Critic架构,内置任务规划、工具调用和反思机制。
M2.5采用MoE架构,总参数100B但仅激活10B,在多项基准测试中超越GPT-4o和Claude 3.5 Sonnet。其高效的架构设计使推理成本降低至同等性能模型的1/5。
M2.5在HumanEval编程基准测试中达到94.7%的通过率,在SWE-bench真实代码任务中取得62.3%的成绩,超越GPT-4o。模型支持Python、JavaScript、Go等20+编程语言。
M2.5的发布标志着中国在AI Agent领域取得全球领先地位。作为首个原生Agent架构的生产级模型,M2.5为行业树立了新的技术标杆,可能改变AI应用开发范式。