当前位置：首页 » AI最新动态

GLM-5.2 开源：1M 上下文、744B MoE 与工程化突破

1小时前 AI最新动态 12 0

智谱 AI 近日正式开源 GLM-5.2，同步发布技术博客。该模型基于 744B MoE 架构（40B 激活），支持 1M 上下文，采用 MIT 协议开源。API 已全量上线，价格与 5.1 保持一致。

这不仅仅是一个“又多了一个开源模型”的发布，更标志着开源阵营在 Agent 长任务和 1M 上下文能力上正在从“能用”向“够打”逼近。

1M 上下文：工程化的突破

GLM-5.2 的目标不仅仅是短问短答的聪明，而是在更长、更复杂、更接近真实工程项目的任务中保持稳定。官方在官方博客中指出，长上下文要变成工程上可用的能力，模型必须在“长、乱、持续执行”的 coding-agent 轨迹里保持质量。

训练重点落在大规模实现、自动化研究、性能优化、复杂调试等真实工作流上。模型需要读仓库、看报错、写代码、跑命令、再根据反馈继续修。

为了支撑 1M 上下文，GLM-5.2 在架构上进行了创新：

IndexShare：每 4 个稀疏注意力层之间共享一个轻量 indexer。在 1M context 长度下，这会将每 token 的 FLOPs 降低 2.9 倍。
MTP 改进：进一步提升推理效率。

在 Coding 领域，GLM-5.2 的表现同样亮眼：

GLM-5.2 的发布不仅仅是参数的提升，更是开源模型在复杂任务处理能力上的一次重要跨越。它踩在了“够不够强、够不够便宜、能不能自己部署、长上下文会不会掉链子”这四个开发者核心关切的交叉点上。

苏米注：GLM-5.2 在 IndexShare 等架构上的优化，直接降低了 1M 上下文的推理成本。对于需要处理超长文档或复杂代码库的开发者来说，这是一个性价比极高的选择。

声明：本站原创文章文字版权归本站所有，转载务必注明作者和出处；本站转载文章仅仅代表原作者观点，不代表本站立场，图文版权归原作者所有。如有侵权，请联系我们删除。

请登录后发表评论