10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

GLM-5实测直逼Claude Opus 4.5:国产大模型再上台阶

4月前 AI最新动态 1172 0

在国产大模型 Seedance 刷屏之后,本周 AI 圈再迎重磅:智谱 AI 全新旗舰 GLM-5 正式上线。

更具话题的是,它的内测版本正是此前在海外引发热议的匿名模型「Pony Alpha」。

该模型上线 OpenRouter 即登顶热度榜,代理式编程单项实测超越 Claude Opus,位列全球第一;

在身份官宣之前,更直接带动相关公司股价连续两日大涨,成为港股 AI 板块的强势催化。

全球权威榜单:并列第三,国产模型排名再创新高

2 月 12 日,Artificial Analysis Intelligence Index v4.0 发布。在纳入 397 款模型、覆盖 10 项专业评测的权威榜单中,GLM-5 以综合 50 分并列全球第三,仅次于 GPT-4.6 与 GPT-5.2、Claude Opus 4.5,跻身全球排名最靠前的国产模型之列。

从「对话写代码」到「系统工程」:国产大模型首次担任系统架构师

2 月 11 日,智谱 AI 发布新一代旗舰 GLM-5。该模型此前以匿名代号「Pony Alpha」在 OpenRouter 引爆技术圈,被海外开发者评价为「最强开源代码模型」「推理深度与工程化能力逼近闭源顶级水准」。在硅谷大模型全面转向 Agentic Coding 的大背景下(如 GPT-5.3-Codex、Claude Opus 4.6 聚焦长时程、高复杂度工程任务),GLM-5 成为国内首个跟上这一前沿趋势的模型,实现了从「对话式代码生成」到「端到端系统工程」的跨越。

实测显示,GLM-5 在工程场景的表现直指顶级:构建高并发电商库存系统时,不仅生成精美 UI,还能自主设计 Redis 缓存、消息队列与数据库锁,整体代码可直接上线;面对复杂开源项目报错日志,能规划排查路径、解析依赖树并输出修复补丁,且方案完全开源。

在专业评测方面,GLM-5 取得 SWE-bench Verified 77.8 分(逼近 Opus 4.6 的 80.9 分)、Terminal-Bench 2.0 开源第一、Vending Bench 2 经营模拟夺冠,Coding 与 Agent 能力达到开源 SOTA 水平。

架构与智能体能力:稀疏 MoE 驱动长程任务

GLM-5 采用 MoE 稀疏架构,擅长长程 Agent 任务与复杂系统设计,可支撑数百次工具调用、长程记忆与复杂指令执行。海外开发者直言:“原本以为开源界接不住 Agentic Coding 这根接力棒,直到测了 GLM-5。”

随着 GLM-5 上线,国产大模型首次在真实工程场景拥有比肩国际顶尖的「系统架构师」能力。这意味着中国在稀疏架构、代码能力与智能体领域正式进入全球第一梯队,行业竞争重心也从通用能力对比,转向垂直场景的深度落地与工程化实力。

国产算力适配里程碑:七大芯片同日支持

GLM-5 已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等主流国产芯片平台的深度推理适配与算子级优化,能够在国产算力集群上实现高吞吐、低延迟的稳定运行,跑出「最强中国方案」。

  • 华为昇腾:在 GLM-5 开源发布同时实现 Day0 全流程适配。推理侧,基于 Atlas 800 A3 采用 W4A8 混合精度量化,实现 744B 模型单机高效部署;通过 Lightning Indexer、Sparse Flash Attention 等融合算子加速端到端推理,并已适配 vLLM-Ascend、SGLang 等主流引擎。训练侧,面向 DSA 场景设计并实现亲和融合算子,在 128K 长序列下显存减少 30G、性能较 FA 提升 8 倍。
  • 摩尔线程:基于 SGLang 推理框架,在旗舰级 AI 训推一体 GPU MTT S5000 上 Day-0 完成全流程适配与验证。
  • 海光 DCU:已实现高吞吐、低延迟的稳定推理与训练表现,显著提升国产算力对大模型的承载效率。

这不仅体现了智谱 AI 在国产化适配上的广度与深度,也进一步验证了国产芯片集群对大规模生成式模型的承载能力,生态成熟进入倒计时。

一手实测:「聪明程度」逼近 Claude Opus 4.5

为验证 GLM-5 的真实技术实力,进行了全场景、高强度、长周期的一手实测,覆盖工业级后端开发、长步骤复杂任务规划、多轮问题调试、数百次工具调用等工程化核心场景,并全程对标 Claude Opus 4.5 的使用体验,结果充分印证其开源 SOTA 水平。

以《TerraLive·实景地球学习与旅行推荐》为例,GLM-5 颠覆了「AI 仅做代码补全」的既有认知:它像一位集资深全栈工程师、3D 图形工程师与交互设计师于一身的多面手,从需求分析到产品落地独立完成。

输入自然语言提示后,最终交付的《TerraLive》是一个功能完整、体验流畅、视觉精美的 3D 地球应用。从一句提示到可交互成品,耗时极短,效率较传统开发模式成倍提升。

在智能写作方面,GLM-5 能自动拆解复杂分析任务、输出专业垂直报告并高效提炼信息。

它正把开发者从繁琐细节中解放出来,让创意以难以想象的速度落地,堪称真正的「超级生产力引擎」。体感上,GLM-5 的「聪明程度」已逼近 Claude Opus 4.5——但价格不再高昂。

性能与成本:Agentic Coding 全球第一,推理成本不足 1/40

海外博主 @AICodeKing 的实测显示:GLM-5 在代理式编程(Agentic Coding)场景得分 589,超越 Claude Opus 4.5 的 585 分,位列全球第一;完成同等编程任务的推理成本仅 0.14 美元,不足 Opus 4.6(6.39 美元)的 1/40。过去往往是昂贵的 Opus 负责「大脑规划」、国产模型做「执行」。现在,GLM-5 已可独立承担「大脑」角色,真正实现国产平替。

Pony Alpha 引爆海外,GLM-5官宣前后市值一度突破 1500 亿港元

2 月 6 日,OpenRouter 悄然上架匿名模型「Pony Alpha」,没有预热与宣发,但 24 小时内即登顶平台热度榜。OpenRouter 官方将其描述为「前沿基础模型」,并强调其在编程、智能体工作流、推理及角色扮演方面的强劲表现,尤其具备「极高的工具调用准确率」。

2 月 9 日起,受「匿名顶级模型疑似为智谱 GLM-5」消息发酵影响,截至 2 月 11 日股价连续两日强势领涨,盘中一度飙升,公司总市值一度站上 1500 亿港元,跻身港股科技股前列。资金集中押注其在代码能力、智能体与通用性能上进入全球第一梯队,反映市场对国产大模型头部厂商技术迭代与商业化前景的高度认可。

2 月 11 日,智谱官方官宣「Pony Alpha = GLM-5」。技术预期落地后,本轮由模型技术突破驱动的估值修复,成为 2026 年年初港股 AI 赛道的标志性行情。这也是国产大模型首次出现「海外技术热度倒逼港股估值」的案例。资本市场交易逻辑由「跟随者」切换至参数规模、MoE 架构与开源 SOTA 等硬核突破,AI 公司的定价权正从财务报表转向技术预期。

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:GLM-5实测直逼Claude Opus 4.5:国产大模型再上台阶
#GLM-5 #Pony Alpha #智谱 
收藏 1
Clawra:OpenClaw 驱动的开源 AI 女友,突破文字交互的多模态人设体验
7个Seedance 2.0体验入口完整指南
推荐阅读
  • Anthropic 发布 AI Agent Zero Trust 安全白皮书:六大能力域与八步部署指南
  • Open AI推出图像生成API,单张图像生成模型输出定价低至0.14元
  • 小米 MiMo-V2.5 开源 + Orbit 百万亿 Token 计划:面向 AI Builder 的生态布局
  • 宝塔面板一键部署OpenClaw 上新,宿主机安装、面板内管理、打开即可使用
  • Hermes 上线 MoA 混合 Agent 模式:多模型协作提升任务质量
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
31550 11月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
28648 1年前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
20661 1年前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
20343 1年前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
16469 1年前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
16389 1年前
字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
16013 11月前
国产大模型横向对比:Kimi K2.6、GLM-5.1、Qwen3、MiniMax M2 四大模型选型指南
15237 2月前
腾讯ima知识库skills上线:教你如何把腾讯 IMA 知识库接入 OpenClaw 一步打通
15206 3月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
15188 1年前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 豆包导航上线:月活3亿+,AI超级入口再下一城
2 DeepSeek V4 正式版即将发布:引入峰谷定价机制,闲时算力更低价
3 Claude Code 疑似暗藏地区检测机制:中国用户为何频繁被封?
4 OpenAI 承认 Codex 额度消耗异常:修复后额外赠送重置次数
5 Hermes Agent上线MoA功能:多模型混合协作,基准测试超越GPT-5.5和Opus-4.8
6 GPT-5.6 宣而不发,Fable 5 归来再禁:出口管制下的模型封锁
7 千问输入法正式上线:阿里双输入法赛马,语音输入成新战场
8 Hermes 上线 MoA 混合 Agent 模式:多模型协作提升任务质量
9 Doubao-Seed-2.1 vs DeepSeek-V4 vs GPT-5.5 实测对比:谁最适合 Agent 开发任务?
10 GPT-5.6 预览版发布:三大模型 Sol/Terra/Luna,全球用户暂无法使用
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联