AI Agent 的"能力边界"问题一直是个痛点——装了 Hermes Agent 或 OpenClaw 之后,它能做什么?商汤在 GitHub 开源的 SenseNova-Skills(4.6k Star,MIT 协议)给出了一个直接的答案:给 Agent 装上"技能",让它能做 PPT、分析 Excel、生成信息图、做行业调研,一条龙完成。
SenseNova-Skills 是什么
SenseNova-Skills 是一个为 Agent 设计的技能仓库。每个技能是一个独立目录,通过 SKILL.md 声明触发条件和执行方式,遵循 Agent Skills 规范。Hermes Agent 和 OpenClaw 都可以直接接入——只需把仓库地址告诉 Agent,它会自动克隆、配置依赖、完成安装。
苏米注:这种"技能即插件"的设计思路,本质上是在把 Agent 变成一个可扩展的平台。每个 SKILL.md 相当于一个应用的"说明书",让 Agent 知道什么时候该调用哪个技能。这很接近 Agent 时代的"App Store"概念。
五大技能类别
🎨 图像与可视化
该类别包含三个核心技能:
| 技能名 | 能力 |
|---|---|
sn-infographic |
信息图生成:87 种布局 × 66 种风格,VLM 评审质量排序 |
sn-image-imitate |
风格模仿:给定参考图,模仿其风格生成新图 |
sn-image-resume |
简历信息 → 简历图片 |
这些技能依赖底层 sn-image-base,通过 SenseNova 平台 API 调用。
📊 PPT 生成
PPT 技能支持三种模式:
- 快速模式:自主决策,即刻构建完整草稿
- 标准模式:风格预览确认 + 分页 HTML + VLM 质检 → 导出 PPTX
- 创意模式:每页一张 16:9 全图,T2I 出图,失败自动回退网络搜索
支持多模态输入(PDF、DOCX、MD、TXT),解析后自动规划大纲、分配素材槽位、生成分页、VLM 质检、最终合成 PPTX。
📈 Excel 数据分析
| 技能名 | 能力 |
|---|---|
sn-da-excel-workflow |
多表读取、清洗、过滤、跨表聚合、导出全流程 |
sn-da-image-caption |
截图 OCR、图表解读、导出 CSV |
sn-da-large-file-analysis |
≥1 万行 Excel 自动转 Parquet 优化 |
🔬 深度研究
完整的四阶段研究流水线,每个阶段由独立技能负责:
| 阶段 | 技能 | 产出 |
|---|---|---|
| 规划 | sn-research-planning |
plan.json(维度拆解、搜索策略、完成标准) |
| 取证 | sn-dimension-research |
sub_reports/{id}.md(多来源交叉验证) |
| 综合 | sn-research-synthesis |
synthesis.md(主线判断、证据强弱、矛盾点) |
| 成稿 | sn-research-report |
report.md(最终报告) |
支持断点续跑——研究做到一半中断后,下次可以从中断点继续。
🔍 搜索
搜索技能覆盖多个平台:
| 技能 | 覆盖平台 |
|---|---|
sn-search-academic |
ArXiv、Semantic Scholar、PubMed、Wikipedia |
sn-search-code |
GitHub、Stack Overflow、Hacker News、HuggingFace |
sn-search-social-cn |
B 站、知乎、抖音 |
sn-search-social-en |
Reddit、Twitter (X)、YouTube |
端到端案例
仓库提供了多个完整的端到端案例,展示了技能如何组合使用:
案例一:内存价格分析(数据分析 → 深度调研 → PPT)
智能体先对 CSV 报价数据做字段刻画和时间戳标准化,从整体走势、品类涨幅、服务器级 vs 消费级背离三个角度分析。然后把数据结论作为研究问题转入深度调研,按维度检索供给收缩、AI 服务器需求、原厂控产等信息,交叉验证后写入报告。最后交给 PPT 生成:排 16 页大纲、生成分页 HTML、VLM 评审、合成 PPTX。
一条完整的三段叙事:价格在涨 → 为什么涨 → 怎么应对。
案例二:员工绩效分析(数据分析)
10 份分散的月度考核 xlsx 读入,对齐列结构,纵向拼成长表,做总体 + 个体分析。结论落到具体岗位和员工,产出 Word 版 + 可视化 HTML 版。
案例三:具身智能行业调研(深度研究)
给定关键词后先列出研究维度(市场规模、玩家份额、融资、成本结构),再定向检索、读取原始页面,不同来源冲突的数字先 reconcile 再落到报告。最终产出图文并茂的报告 + 5 张配图。
与小浣熊的关系
SenseNova-Skills 的技能和模型能力已经集成进了商汤的商业产品小浣熊(xiaohuanxiong.com),该平台目前有 1500 万个人用户、数千家企业用户,提供企业级安全防护。
如果你追求开箱即用、不想自己搭环境和配 API Key,可以直接使用小浣熊。但如果你是 Hermes Agent 或 OpenClaw 用户,SenseNova-Skills 就是免费的技能包,装上去就能用。
苏米观点
SenseNova-Skills 做对了三件事:
- 标准化接口:每个技能写一个 SKILL.md,声明触发条件、能力边界、执行方式。Agent 通过这套规范自动识别"什么时候该用哪个技能"。这有点像 Agent 界的 App Store——技能是独立应用,Agent 是操作系统。
- 组合成流水线:单技能只做好一件事,但多个技能串联起来就能跑完一条完整的业务链路。内存价格分析就是数据 → 研究 → PPT 的全自动串联。
- 开源 + 可插拔:MIT 协议,任何人都可以 fork 扩展。商汤直接支持 Hermes Agent 和 OpenClaw,没有绑定自己的平台。
同时也有几个需要注意的限制:
- 依赖 SenseNova 的 API Key,不是纯开源能跑的
- PPT 和深度研究的场景偏重,轻量级使用可能"杀鸡用牛刀"
- 部分搜索技能(B 站、知乎、抖音)需要 cookie 认证,有一定上手门槛