10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

GLM 5.2 开源详览:1M 上下文、744B MoE 架构与 Coding 实测

1小时前 AI最新动态 7 0

智谱 AI 近日正式开源 GLM-5.2,同步发布技术博客。该模型基于 744B MoE 架构(40B 激活),支持 1M 上下文,采用 MIT 协议开源。API 已全量上线,价格与 5.1 保持一致。

在 Coding 领域,GLM-5.2 在 Arena 榜单上以 1595 分拿下第二,成为该榜单上最强的开源可用模型。

图片 1

图片 2

长程任务能力(Long Horizon Task)

GLM-5.2 专为长程任务设计,在三个基准评测(跑在 1M 上下文、Max 档位)中均排名开源第一:

  • FrontierSWE(20 小时级复杂工程):GLM-5.2 得分 74.4%,仅次于 Opus 4.8(75.1%),领先于 GPT-5.5(72.6%)。
  • PostTrainBench(Agent 10 小时内做 post-training):GLM-5.2 得分 34.3%,优于 GPT-5.5(25.0%)。
  • SWE-Marathon(超长周期工程):GLM-5.2 得分 13.0%,表现接近 Opus 4.7。

图片 3

Coding 与 Agent 评测

在 8 项 Coding + Agentic 评测中,GLM-5.2 保持开源 SOTA:

  • Terminal-Bench 2.1:81.0 分(接近 Opus 4.8 的 85.0)。
  • HLE with Tools:54.7 分,超越 Opus 4.8(52.3)和 GPT-5.5(52.2)。
  • Agentic Coding:在 Claude Code 上跑测试,High 档位与 Opus 4.8 基本重合,Max 档位约 75%。

图片 4

图片 5

1M 上下文架构优化

GLM-5.2 在架构上进行了系统性优化,使 1M 上下文在工程中真正可用:

  • IndexShare for DSA:每 4 层 Transformer 共享一个轻量 indexer,复用 top-k 索引,节省 3/4 的 indexer 计算量。
  • 极致 Infra 优化:Day 0 即可运行在国产算力平台上。

图片 6

图片 7

图片 8

总结

GLM-5.2 的发布标志着国产开源模型在长程任务和 Coding 领域的新高度。其 1M 上下文能力和 MIT 开源协议,为开发者和企业提供了强大的底层支持。

苏米注:GLM-5.2 在 HLE with Tools 上的表现令人惊喜,说明其在复杂工具调用和 Agentic 任务上的潜力巨大。对于需要处理超长上下文代码库的开发者来说,这是一个值得尝试的强力模型。

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:GLM 5.2 开源详览:1M 上下文、744B MoE 架构与 Coding 实测
#GLM-5.2 #智谱AI #开源模型 #Coding #1M上下文 
收藏 1
Omnigent:Databricks 开源的多 Agent 管理平台,5 天获 3000 Star
这是最后一篇
推荐阅读
  • Wan 2.6:角色与音色可参考,多镜头更稳定,短视频制作更可控
  • 阿里云腾讯云全面停售 Coding Plan:AI 编程低价时代终结,开发者如何应对
  • n8n 2.x 重大更新,让工作流走向对话式:Chat Hub、Agent、工作流对话
  • GPT-5.5正式发布:全面超越 Claude Opus 4.7,重新夺回 SOTA 宝座
  • Hermes Agent 2026.04.13 更新
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
31032 11月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
28232 1年前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
19833 1年前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
19621 1年前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
16167 1年前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
16090 1年前
字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
15639 11月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
14918 1年前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
14310 1年前
国产大模型横向对比:Kimi K2.6、GLM-5.1、Qwen3、MiniMax M2 四大模型选型指南
13974 2月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 GLM 5.2 开源详览:1M 上下文、744B MoE 架构与 Coding 实测
2 SpaceX 600 亿美元收购 Cursor:马斯克买下 AI 编程入口
3 GLM-5.2 开源:1M 上下文、744B MoE 与工程化突破
4 Kimi K2.7 Code 高速版实测:4 个工程任务验证,适合进工作流的 coding agent
5 ChatGPT Pro/Plus/Teams 强制重置:最后窗口期利用指南
6 4 个免费 Token 渠道全攻略:两个月没花一分钱
7 ZCode 3.0 + GLM-5.2 深度评测:国产 AI 编程工具的最佳组合
8 Kimi K2.7 Code 模型发布:长程编程 token 消耗降 30%,6 倍速高速版即将上线
9 OpenCode 发布大模型调用数据报告:DeepSeek 用量第一,Qwen 缓存命中率 98%
10 GLM-5.2 发布:1M 上下文 + 全量开放,国产 Coding 模型新标杆
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联