10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

Step 3.7 Flash:10 秒生成千行代码,生产级 Agent 的高效率之选

2小时前 AI最新动态 9 0

阶跃星辰是国内 AI 公司中较为低调但技术实力强劲的一家。从开源 Step 3.5 Flash 到推出 Step Audio 2.0,其模型迭代速度一直很快。5 月 30 日,Step 3.7 Flash 正式上线。

根据官方信息,Step 3.7 Flash 总参数 196B + 1.8B ViT,每次推理仅激活 11B 参数。其定位为面向生产级 Agent 的高效率模型,能够串联搜索、工具调用、代码生成和部署链路。此外,该模型还支持在内存 ≥ 128GB 的 Mac 上本地运行,拓展了端侧应用场景。

图片 1

Benchmark 表现:多项指标领先

在通用 Agent 综合能力测试中,Step 3.7 Flash 表现亮眼。官方对比显示,该模型主要对标 Flash 级模型(如 DeepSeek V4 Flash、Gemini 3.5 Flash),并与 Pro 档模型(GPT 5.5、Claude Opus 4.7、Kimi K2.6)进行参照。

图片 2

实测:接入 Claude Code 的六大场景

为了验证模型的实际能力,我将 Step 3.7 Flash 接入 Claude Code,从搜索与工具调用、代码输出与前端审美两个维度进行了实测。

图片 3

场景一:搜索与工具调用

任务 1:AI Coding 工具对比表

需求:搜索主流 AI Coding 工具和 Agent 框架,对比能力、定价、适用人群,输出可视化 HTML。

模型调用 Search 能力检索了 Claude Code、Cursor、Codex CLI 等产品的文档和定价页,并交叉验证信息一致性。几分钟内即生成了对比表,信息准确度高。

图片 4

图片 5

任务 2:旗舰模型参数看板

需求:搜索主流旗舰模型,对比定价、上下文窗口、强项与短板,制作可视化看板。

该任务信息源更杂、参数更细。模型生成的看板配色克制、排版有节奏,关键参数醒目,准确度经核对较高。

图片 6

图片 7

图片 8

部署方案:结合 Cloudflare Pages 或 Vercel CLI,可通过 Agent 定时抓取数据并自动更新网站,无需数据库,实现动态信息展示。

场景二:代码生成与前端审美

我尝试了几个复杂的产品 Demo 需求,测试模型的实际编码能力:

1. Agent 工作流编排界面

需求:类似 ComfyUI 节点风格,面向 Agent 调用的界面。

结果:一次生成,包含节点拖拽、连线、参数面板、运行日志区。

图片 9

2. MeetPoint Planner(多人聚会选点系统)

需求:输入位置和偏好,推荐聚会地点,调用地图 API。

结果:包含筛选条件、打分逻辑,首次运行即可用。

图片 10

3. Daily Pulse(AI 资讯日报)

需求:给定栏目结构,生成仿杂志风的信息架构。

结果:分区清晰,视觉节奏感强。

图片 11

4. CYBERKEYS(赛博键盘)

需求:赛博朋克美学的键盘视觉设计。

结果:配色、霓虹反光、键帽样式表现出色,视觉质量高。

图片 12

苏米注:最令我惊讶的是输出速度。上述复杂需求大多在一分钟内完成,部分甚至仅需 10 秒,代码量均在 1000 行以上。"Flash"之名确实名副其实。

Agentic 能力:技术解析

官方博客显示,Step 团队在 Step-SWE-Bench 上运行了测试,覆盖 Hermes Agent、OpenClaw、Claude Code 等六个主流 harness。Step 3.7 Flash 平均分 67.08%,较 3.5 Flash 的 56.50% 有显著提升。

图片 13

技术博客揭示了几个关键点:

  • 训练目标改变:从单点能力转向 Agent 轨迹层面的 end-to-end 优化,在轨迹级别整合数据、奖励、推理。
  • Advisor Mode:在规划或反复失败时请教更大的顾问模型。开启后,在 SWE-Bench Verified 上达到 Claude Opus 4.6 的 97% 代码能力,单任务成本仅为 1/9($0.19 vs $1.76)。这是国内首个将 executor + advisor 策略做成产品级开关的厂商。
  • 视觉能力提升:使用 Python 工具操作图像(裁剪、放大、画框等)。模型能自发组合视觉与非视觉工具,写完代码后自动运行 GUI 验证渲染和交互。

总结

Step 3.7 Flash 的核心优势在于:搜索能力强、代码生成质量高、输出速度极快、支持多模态。结合其订阅价格(Step Plan 49 元/月),性价比突出。

在模型竞争日益激烈的今天,单点 Benchmark 已不再是唯一标准。从任务开始到交付的整条曲线——速度、智能、成本三者同时在线——才是关键。Step 3.7 Flash 在这三者上表现均衡,是一个值得尝试的生产级 Agent 高效率模型。

相关链接:

官方博客:https://static.stepfun.com/blog/step-3.7-flash/

API 接入:platform.stepfun.com/step-plan

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Step 3.7 Flash:10 秒生成千行代码,生产级 Agent 的高效率之选
#Step 3.7 Flash #阶跃星辰 #AI模型评测 #Agent #代码生成 
收藏 1
Codex Computer Use 登陆 Windows:手机远程调度 AI 成为现实
Claude Code Dynamic Workflows:AI 自主调度并行处理复杂任务
推荐阅读
  • Karpathy 加入 Anthropic:AI 领域关键人物重回研发一线
  • Cherry Studio零门槛快速启动和切换 Qwen Code、Gemini CLI、Claude Code
  • 智谱一周连续开源8个项目,GLM-4.6V 视觉模型才最大功臣
  • Claude Opus 4.6 发布:AI 不再单打独斗,把Claude变成可管理的团队
  • SkyClaw 免费 Agent 模型:无限 Token,适配 OpenClaw、Hermes、Nanobot
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
30361 10月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
27369 1年前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
18911 1年前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
18869 1年前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
15847 1年前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
15437 1年前
字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
14994 10月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
14537 1年前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
14053 1年前
Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
12291 1年前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 OpenAI Codex Computer Use 正式登陆 Windows,附完整设置指南
2 Claude Opus 4.8 深度解析:从聊天机器人到自主工作系统的进化
3 Claude Code Dynamic Workflows:AI 自主调度并行处理复杂任务
4 Step 3.7 Flash:10 秒生成千行代码,生产级 Agent 的高效率之选
5 Codex Computer Use 登陆 Windows:手机远程调度 AI 成为现实
6 Claude Opus 4.8 发布:Dynamic Workflows 让 AI 自主编排大规模开发任务
7 Anthropic 发布 AI Agent Zero Trust 安全白皮书:六大能力域与八步部署指南
8 支付宝 AI 钱包发布:3 亿笔 Agent 支付背后的商业协议布局
9 小红书上线Skill挂载功能,AI创作者变现新通道开启
10 SkyClaw 免费 Agent 模型:无限 Token,适配 OpenClaw、Hermes、Nanobot
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联