10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

智谱 GLM-5.1 高速版上线,全球最快旗舰API,7倍提速开始喷代码

2周前 AI最新动态 377 0

智谱 AI 正式推出 GLM-5.1 高速版,定位旗舰模型,主打全球最快 API 响应速度。官方数据显示,GLM-5.1 高速版相比标准版实现了约 7 倍提速,首 token 时间(TTFT)低于 1 秒,同时保持旗舰级模型能力。

性能实测:四模型同场竞速

为了直观对比各模型的速度差异,我们使用同一套测试环境,同时配置了四个模型进行并发测试:

  • GLM 高速版(glm-5.1-highspeed)
  • GLM 5.1(glm-5.1)
  • DeepSeek V4 Pro(deepseek-chat)
  • Sonnet 4.6(claude-sonnet-4-6)

测试环境统一使用 /private/tmp/speed_test 脚本,输入相同提示词「用 1000 字」,对比各模型的生成速度。

图片 1

编程任务速度对比

在编程任务场景下,四个模型的生成速度差异显著:

  • GLM 高速版:397 tok/s(第一名,遥遥领先)
  • DeepSeek V4 Pro:136 tok/s
  • Sonnet 4.6:65 tok/s
  • GLM 5.1:58 tok/s

GLM 高速版的生成速度是 GLM 5.1 标准版的约 7 倍,是 DeepSeek V4 Pro 的近 3 倍,是 Sonnet 4.6 的 6 倍多。

图片 2

耗时对比:讲故事 vs 总结小说

在两项具体任务中的耗时表现:

任务 GLM 高速版 DeepSeek V4 Pro Sonnet 4.6 GLM 5.1
讲故事 14s 31s 50s 64s
总结小说 4s 18s >108s 26s

在「总结小说」任务中,Sonnet 4.6 耗时超过 108 秒仍未完成,而 GLM 高速版仅用 4 秒即完成。

图片 3

WebDev 排行榜:GLM-5.1 排名第五

在 WebDev(Web 开发)任务排行榜上,GLM-5.1 以 1532 分位列第 5 名,仅次于 Claude Opus 4.7 Thinking(1567 分)、Claude Opus 4.7(1559 分)、Claude Opus 4.6 Thinking(1546 分)和 Claude Opus 4.6(1541 分),领先于 Claude Sonnet 4.6(1524 分)、Kimi K2.6(1519 分)和 GPT-5.5(1501 分)。

图片 4

实际应用场景

AI Shader 生成

GLM-5.1 高速版已应用于 AI 驱动的实时图形编程工具。用户只需输入文字描述(如「fractal lava lamp with caustics」),模型即可实时生成 WebGL 着色器代码,渲染帧率稳定在 120 FPS。

图片 5

低多边形 3D 场景生成

在 3D 场景生成方面,GLM-5.1 高速版也能快速生成低多边形风格的虚拟场景,包括城市景观、人物角色和交互 UI 元素。

图片 6

技术原理:TileRT 零调度架构

GLM-5.1 高速版之所以能实现如此大幅的速度提升,核心在于采用了 TileRT 技术。传统推理方式中,每个操作(op)完成后都需要向调度器汇报并等待批准,导致效率低下。TileRT 采用 Persistent Kernel(常驻内核) 技术,实现了「零调度」——数据被分成 tile 连续处理,不再需要频繁汇报,计算单元可以自主高效运行。

图片 7

配置与使用

GLM-5.1 高速版已集成到主流 AI 编程工具中。配置方式:

模型 配置
GLM 5.1 settings_glm.json + --model glm-5.1
GLM 5.1 高速版 settings_glm_hs.json + --model glm-5.1-highspeed
DeepSeek V4 Pro settings_deepseek.json + --model deepseek-chat
Sonnet 4.6 --model claude-sonnet-4.6 (订阅)

图片 8

图片 9

图片 10

图片 11

图片 12

苏米观点

GLM-5.1 高速版的核心价值在于「旗舰级能力 + 极速响应」的组合。397 tok/s 的生成速度在同类旗舰模型中处于领先地位,7 倍于标准版的提速幅度意味着在实际使用中,用户几乎感受不到等待延迟。

对于 AI 编程场景来说,速度不仅仅是体验问题——更快的生成速度意味着更快的迭代循环、更高的开发效率。GLM-5.1 高速版在 WebDev 排行榜上位列第 5,说明它在保持速度的同时,代码生成质量也达到了旗舰水平。

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:智谱 GLM-5.1 高速版上线,全球最快旗舰API,7倍提速开始喷代码
#智谱 #GLM-5.1 #AI模型 #高速API #性能评测 
收藏 1
MiniMax Hub本地工作台:AI Agent与画布工作流的完美结合
EverOS:给 AI 装上自我进化的记忆,Claude Code 插件开源
推荐阅读
  • GPT-Image-2 灰度测试作品展示:多风格图像生成能力详解
  • 扣子Coze重磅上线「扣子编程」,智能体、工作流、网页应用,移动应用通通都是一句话搞定!
  • AI Agent时代下,Markdown和HTML如何正确分工
  • 龙虾变身导演?LibTV 重塑视频创作新范式,OpenClaw 实现自动化制片
  • LongCat-Flash-Omni 正式发布并开源:开启全模态实时交互时代
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
30745 10月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
27933 1年前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
19411 1年前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
19322 1年前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
16021 1年前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
15785 1年前
字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
15350 11月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
14756 1年前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
14191 1年前
腾讯ima知识库skills上线:教你如何把腾讯 IMA 知识库接入 OpenClaw 一步打通
12706 2月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 苹果Siri AI大脑换谷歌Gemini:WWDC 2026库克谢幕
2 提示词:把Dynamic Workflows成本从6.2万美元狂砍到129美元的拆解15个提示词
3 Token 定价大揭秘:一边涨价疯抢一边永久降价,海外价格差 100 倍
4 DeepSeek 首次大规模限流:免费时代终结,AI 行业付费时代来临
5 ChatGPT 史上最大改版:从聊天机器人到超级 App,Codex 周活突破 500 万
6 微信 A2A 能力正式上线:语音操控,双手自由
7 谷歌开源 Gemma 4 12B:统一无编码器架构,16GB 内存笔记本即可运行多模态模型
8 Kimi Work 桌面 Agent:支持 300 个 Agent 并行,实现网页数据抓取与分析
9 Codex 发布 6 大角色插件包:非程序员也能让 AI 替你干活
10 Qwen3.7-Plus正式发布:多模态混合智能体,视觉与语言统一的新基座
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联