当前位置：首页 » AI开源项目

SenseNova-Skills 开源：为 Hermes Agent 装上 PPT、数据分析、深度调研技能

1小时前 AI开源项目 8 0

AI Agent 的"能力边界"问题一直是个痛点——装了 Hermes Agent 或 OpenClaw 之后，它能做什么？商汤在 GitHub 开源的 SenseNova-Skills（4.6k Star，MIT 协议）给出了一个直接的答案：给 Agent 装上"技能"，让它能做 PPT、分析 Excel、生成信息图、做行业调研，一条龙完成。

SenseNova-Skills 是什么

SenseNova-Skills 是一个为 Agent 设计的技能仓库。每个技能是一个独立目录，通过 SKILL.md 声明触发条件和执行方式，遵循 Agent Skills 规范。Hermes Agent 和 OpenClaw 都可以直接接入——只需把仓库地址告诉 Agent，它会自动克隆、配置依赖、完成安装。

苏米注：这种"技能即插件"的设计思路，本质上是在把 Agent 变成一个可扩展的平台。每个 SKILL.md 相当于一个应用的"说明书"，让 Agent 知道什么时候该调用哪个技能。这很接近 Agent 时代的"App Store"概念。

五大技能类别

🎨 图像与可视化

该类别包含三个核心技能：

技能名	能力
`sn-infographic`	信息图生成：87 种布局 × 66 种风格，VLM 评审质量排序
`sn-image-imitate`	风格模仿：给定参考图，模仿其风格生成新图
`sn-image-resume`	简历信息 → 简历图片

这些技能依赖底层 sn-image-base，通过 SenseNova 平台 API 调用。

📊 PPT 生成

PPT 技能支持三种模式：

快速模式：自主决策，即刻构建完整草稿
标准模式：风格预览确认 + 分页 HTML + VLM 质检 → 导出 PPTX
创意模式：每页一张 16:9 全图，T2I 出图，失败自动回退网络搜索

支持多模态输入（PDF、DOCX、MD、TXT），解析后自动规划大纲、分配素材槽位、生成分页、VLM 质检、最终合成 PPTX。

📈 Excel 数据分析

技能名	能力
`sn-da-excel-workflow`	多表读取、清洗、过滤、跨表聚合、导出全流程
`sn-da-image-caption`	截图 OCR、图表解读、导出 CSV
`sn-da-large-file-analysis`	≥1 万行 Excel 自动转 Parquet 优化

🔬 深度研究

完整的四阶段研究流水线，每个阶段由独立技能负责：

阶段	技能	产出
规划	`sn-research-planning`	plan.json（维度拆解、搜索策略、完成标准）
取证	`sn-dimension-research`	sub_reports/{id}.md（多来源交叉验证）
综合	`sn-research-synthesis`	synthesis.md（主线判断、证据强弱、矛盾点）
成稿	`sn-research-report`	report.md（最终报告）

支持断点续跑——研究做到一半中断后，下次可以从中断点继续。

🔍 搜索

搜索技能覆盖多个平台：

技能	覆盖平台
`sn-search-academic`	ArXiv、Semantic Scholar、PubMed、Wikipedia
`sn-search-code`	GitHub、Stack Overflow、Hacker News、HuggingFace
`sn-search-social-cn`	B 站、知乎、抖音
`sn-search-social-en`	Reddit、Twitter (X)、YouTube

端到端案例

仓库提供了多个完整的端到端案例，展示了技能如何组合使用：

案例一：内存价格分析（数据分析 → 深度调研 → PPT）

智能体先对 CSV 报价数据做字段刻画和时间戳标准化，从整体走势、品类涨幅、服务器级 vs 消费级背离三个角度分析。然后把数据结论作为研究问题转入深度调研，按维度检索供给收缩、AI 服务器需求、原厂控产等信息，交叉验证后写入报告。最后交给 PPT 生成：排 16 页大纲、生成分页 HTML、VLM 评审、合成 PPTX。

一条完整的三段叙事：价格在涨 → 为什么涨 → 怎么应对。

案例二：员工绩效分析（数据分析）

10 份分散的月度考核 xlsx 读入，对齐列结构，纵向拼成长表，做总体 + 个体分析。结论落到具体岗位和员工，产出 Word 版 + 可视化 HTML 版。

案例三：具身智能行业调研（深度研究）

给定关键词后先列出研究维度（市场规模、玩家份额、融资、成本结构），再定向检索、读取原始页面，不同来源冲突的数字先 reconcile 再落到报告。最终产出图文并茂的报告 + 5 张配图。

与小浣熊的关系

SenseNova-Skills 的技能和模型能力已经集成进了商汤的商业产品小浣熊（xiaohuanxiong.com），该平台目前有 1500 万个人用户、数千家企业用户，提供企业级安全防护。

如果你追求开箱即用、不想自己搭环境和配 API Key，可以直接使用小浣熊。但如果你是 Hermes Agent 或 OpenClaw 用户，SenseNova-Skills 就是免费的技能包，装上去就能用。

苏米观点

SenseNova-Skills 做对了三件事：

标准化接口：每个技能写一个 SKILL.md，声明触发条件、能力边界、执行方式。Agent 通过这套规范自动识别"什么时候该用哪个技能"。这有点像 Agent 界的 App Store——技能是独立应用，Agent 是操作系统。
组合成流水线：单技能只做好一件事，但多个技能串联起来就能跑完一条完整的业务链路。内存价格分析就是数据 → 研究 → PPT 的全自动串联。
开源 + 可插拔：MIT 协议，任何人都可以 fork 扩展。商汤直接支持 Hermes Agent 和 OpenClaw，没有绑定自己的平台。

同时也有几个需要注意的限制：

依赖 SenseNova 的 API Key，不是纯开源能跑的
PPT 和深度研究的场景偏重，轻量级使用可能"杀鸡用牛刀"
部分搜索技能（B 站、知乎、抖音）需要 cookie 认证，有一定上手门槛

项目地址：github.com/OpenSenseNova/SenseNova-Skills

声明：本站原创文章文字版权归本站所有，转载务必注明作者和出处；本站转载文章仅仅代表原作者观点，不代表本站立场，图文版权归原作者所有。如有侵权，请联系我们删除。

未经允许不得转载：SenseNova-Skills 开源：为 Hermes Agent 装上 PPT、数据分析、深度调研技能

请登录后发表评论