10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI开源项目

SenseNova-Skills 开源:为 Hermes Agent 装上 PPT、数据分析、深度调研技能

1小时前 AI开源项目 8 0

AI Agent 的"能力边界"问题一直是个痛点——装了 Hermes Agent 或 OpenClaw 之后,它能做什么?商汤在 GitHub 开源的 SenseNova-Skills(4.6k Star,MIT 协议)给出了一个直接的答案:给 Agent 装上"技能",让它能做 PPT、分析 Excel、生成信息图、做行业调研,一条龙完成。

SenseNova-Skills 是什么

SenseNova-Skills 是一个为 Agent 设计的技能仓库。每个技能是一个独立目录,通过 SKILL.md 声明触发条件和执行方式,遵循 Agent Skills 规范。Hermes Agent 和 OpenClaw 都可以直接接入——只需把仓库地址告诉 Agent,它会自动克隆、配置依赖、完成安装。

苏米注:这种"技能即插件"的设计思路,本质上是在把 Agent 变成一个可扩展的平台。每个 SKILL.md 相当于一个应用的"说明书",让 Agent 知道什么时候该调用哪个技能。这很接近 Agent 时代的"App Store"概念。

五大技能类别

🎨 图像与可视化

该类别包含三个核心技能:

技能名 能力
sn-infographic 信息图生成:87 种布局 × 66 种风格,VLM 评审质量排序
sn-image-imitate 风格模仿:给定参考图,模仿其风格生成新图
sn-image-resume 简历信息 → 简历图片

这些技能依赖底层 sn-image-base,通过 SenseNova 平台 API 调用。

📊 PPT 生成

PPT 技能支持三种模式:

  • 快速模式:自主决策,即刻构建完整草稿
  • 标准模式:风格预览确认 + 分页 HTML + VLM 质检 → 导出 PPTX
  • 创意模式:每页一张 16:9 全图,T2I 出图,失败自动回退网络搜索

支持多模态输入(PDF、DOCX、MD、TXT),解析后自动规划大纲、分配素材槽位、生成分页、VLM 质检、最终合成 PPTX。

📈 Excel 数据分析

技能名 能力
sn-da-excel-workflow 多表读取、清洗、过滤、跨表聚合、导出全流程
sn-da-image-caption 截图 OCR、图表解读、导出 CSV
sn-da-large-file-analysis ≥1 万行 Excel 自动转 Parquet 优化

🔬 深度研究

完整的四阶段研究流水线,每个阶段由独立技能负责:

阶段 技能 产出
规划 sn-research-planning plan.json(维度拆解、搜索策略、完成标准)
取证 sn-dimension-research sub_reports/{id}.md(多来源交叉验证)
综合 sn-research-synthesis synthesis.md(主线判断、证据强弱、矛盾点)
成稿 sn-research-report report.md(最终报告)

支持断点续跑——研究做到一半中断后,下次可以从中断点继续。

🔍 搜索

搜索技能覆盖多个平台:

技能 覆盖平台
sn-search-academic ArXiv、Semantic Scholar、PubMed、Wikipedia
sn-search-code GitHub、Stack Overflow、Hacker News、HuggingFace
sn-search-social-cn B 站、知乎、抖音
sn-search-social-en Reddit、Twitter (X)、YouTube

端到端案例

仓库提供了多个完整的端到端案例,展示了技能如何组合使用:

案例一:内存价格分析(数据分析 → 深度调研 → PPT)

智能体先对 CSV 报价数据做字段刻画和时间戳标准化,从整体走势、品类涨幅、服务器级 vs 消费级背离三个角度分析。然后把数据结论作为研究问题转入深度调研,按维度检索供给收缩、AI 服务器需求、原厂控产等信息,交叉验证后写入报告。最后交给 PPT 生成:排 16 页大纲、生成分页 HTML、VLM 评审、合成 PPTX。

一条完整的三段叙事:价格在涨 → 为什么涨 → 怎么应对。

案例二:员工绩效分析(数据分析)

10 份分散的月度考核 xlsx 读入,对齐列结构,纵向拼成长表,做总体 + 个体分析。结论落到具体岗位和员工,产出 Word 版 + 可视化 HTML 版。

案例三:具身智能行业调研(深度研究)

给定关键词后先列出研究维度(市场规模、玩家份额、融资、成本结构),再定向检索、读取原始页面,不同来源冲突的数字先 reconcile 再落到报告。最终产出图文并茂的报告 + 5 张配图。

与小浣熊的关系

SenseNova-Skills 的技能和模型能力已经集成进了商汤的商业产品小浣熊(xiaohuanxiong.com),该平台目前有 1500 万个人用户、数千家企业用户,提供企业级安全防护。

如果你追求开箱即用、不想自己搭环境和配 API Key,可以直接使用小浣熊。但如果你是 Hermes Agent 或 OpenClaw 用户,SenseNova-Skills 就是免费的技能包,装上去就能用。

苏米观点

SenseNova-Skills 做对了三件事:

  • 标准化接口:每个技能写一个 SKILL.md,声明触发条件、能力边界、执行方式。Agent 通过这套规范自动识别"什么时候该用哪个技能"。这有点像 Agent 界的 App Store——技能是独立应用,Agent 是操作系统。
  • 组合成流水线:单技能只做好一件事,但多个技能串联起来就能跑完一条完整的业务链路。内存价格分析就是数据 → 研究 → PPT 的全自动串联。
  • 开源 + 可插拔:MIT 协议,任何人都可以 fork 扩展。商汤直接支持 Hermes Agent 和 OpenClaw,没有绑定自己的平台。

同时也有几个需要注意的限制:

  • 依赖 SenseNova 的 API Key,不是纯开源能跑的
  • PPT 和深度研究的场景偏重,轻量级使用可能"杀鸡用牛刀"
  • 部分搜索技能(B 站、知乎、抖音)需要 cookie 认证,有一定上手门槛

项目地址:github.com/OpenSenseNova/SenseNova-Skills

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:SenseNova-Skills 开源:为 Hermes Agent 装上 PPT、数据分析、深度调研技能
#SenseNova #AI Agent #开源项目 #Hermes #办公自动化 
收藏 1
pixel2motion:AI 驱动的 logo 动效开源工作流,1.1K Star
Hermes 上线 MoA 混合 Agent 模式:多模型协作提升任务质量
推荐阅读
  • LLM Wiki 开源知识库应用:基于 Karpathy 方法论,让 AI 自动构建个人知识体系
  • Karakeep:开源自托管书签神器,AI智能标记让收藏更轻松
  • Skyvern:这个浏览器 AI 自动化项目火了,基于视觉理解的浏览器自动化框架
  • Karpathy 编程四原则:让 Claude Code 不再瞎改代码的开源技能插件
  • short-video-factory:5分钟教你搭建免费AI批量剪辑工具,轻松制作带货视频
评论 (0)
请登录后发表评论
分类精选
WeKnora:终于等到了腾讯ima的开源知识库框架,用 API 轻松打造本地智能文档检索
10187 9月前
OpenSpec:比 Cursor Plan 更聪明?试试这款让 AI 编码更靠谱的规范驱动工具
9863 8月前
Antigravity-Manager:这个开源神器让你白嫖ClaudeOpus 4.5,Gemini 3!还能接Claude Code等任意平台
7812 6月前
CapCut API:一个剪映API开源项目,让AI自动剪辑视频
7210 6月前
awesome-openclaw-skills:700+ Skills 一条命令装配完成,如何让本地 AI Agent 真正落地可用
6933 4月前
AIRI:你的开源AI女友,让你随时拥有属于自己的 AI VTuber
6840 9月前
CompressO:开源免费的视频压缩神器,让你的硬盘瞬间轻松 10 倍
6720 9月前
就要创作:从提示词到创作团队,开源 AI 网文写作平台
6703 8月前
iFlow CLI:让命令行终端不止于编程的AI效率开源神器
5981 10月前
Composio:让AI Agent自动完成工作任务,能让AI一键操控你的所有软件
5949 8月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 SenseNova-Skills 开源:为 Hermes Agent 装上 PPT、数据分析、深度调研技能
2 pixel2motion:AI 驱动的 logo 动效开源工作流,1.1K Star
3 DeepSeek 开源 DSpark 推理加速框架:V4 生产环境提速最高 85%
4 Talk to 峰哥开源项目:AI 实时声音克隆 + 人格注入,1秒延迟语音对话
5 models.dev 开源项目:AI 模型规格与定价大全,统一口径的比价平台
6 Taste Skill:51.8K Star 前端设计规则框架,让 AI 生成的网页告别模板味
7 AI 起名 Skill 开源:基于八字五行的中国传统姓名学工作流
8 Orca:7.3K Star 的 AI 编程总控台,让 Claude Code 和 Codex 并行工作
9 开源中国古典诗词 API:37 万首诗,一键接入国风应用
10 Open File Viewer:一个容器统一 110 种文件格式的前端预览 SDK
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联