🤖 AI 热点新闻日报

2026年2月18日 · 星期三
1

智谱GLM-5发布,744B参数MoE架构

智谱AI 2026-02-18

智谱AI正式发布GLM-5大模型,采用7440亿参数Mixture-of-Experts架构,单次推理仅激活约100B参数,实现性能与效率的最优平衡。模型在多项基准测试中达到SOTA水平。

架构创新:GLM-5采用新一代MoE架构,支持动态专家路由,可根据任务类型自动选择最优专家组合。推理成本较Dense模型降低70%,性能却超越GPT-4o。
大模型 MoE 智谱AI
2

GLM-5编程能力领先,完全适配华为昇腾芯片

智谱AI 2026-02-18

GLM-5在HumanEval、MBPP等编程基准测试中刷新记录,代码生成准确率达到92.3%。同时,模型已完成对华为昇腾AI芯片的完整适配,实现国产算力全栈自主可控。

国产适配:GLM-5与华为昇腾的深度适配标志着国产大模型+国产算力的完整闭环形成。在昇腾集群上,GLM-5推理性能达到A100的95%,训练效率提升30%。
编程能力 华为昇腾 国产算力
3

Claude Sonnet 4.6同日发布

Anthropic 2026-02-18

Anthropic发布Claude Sonnet 4.6,在保持高性价比的同时显著提升推理和编程能力。新版本支持更长的上下文窗口,并在代码理解和生成方面取得重大突破。

产品定位:Sonnet 4.6延续了Anthropic"智能与效率平衡"的产品策略,在成本仅为Opus 1/5的情况下,实现了90%以上的能力覆盖,成为企业开发者的首选。
Claude Anthropic 编程助手
4

技术突破:MoE架构成为大模型新范式

技术分析 2026-02-18

从GPT-4到GLM-5,Mixture-of-Experts架构正在成为大模型的主流选择。MoE通过稀疏激活实现"大力出奇迹"与"精打细算"的完美平衡,解决了大模型部署成本的核心痛点。

行业趋势:MoE架构的普及将大幅降低大模型应用门槛。未来,万亿参数模型可能仅需百亿参数的成本即可运行,AI应用的规模化部署将加速到来。
技术趋势 MoE 模型架构