#开源
Voicebox 开源:本地语音克隆神器,7 个 TTS 引擎 + 多轨道编辑器
又发现一个本地语音克隆神器,开源了。
ElevenLabs 在 2023 年的爆火,说明了 AI 语音合成的需求是很旺盛的。大家都渴望着能用自己的声音生成配音,或者克隆某个喜欢的音色,于是纷纷选择订阅各种在线服务。
当多数人兴致勃勃想搞 A…
Gemma 4 + TurboQuant:Google开源模型新方案,本地部署 LLM 内存降低 83%
在过去三年里,很多人认为模型越大越"聪明"。他们觉得参数越多性能越好,GPU 越多就越强。这个普遍认知本周被 Google 的开源模型 "Gemma 4" 彻底颠覆。
Gemma 是 Google 发布的一系列 open-weight 模型…
Browser Harness 开源:592 行代码实现自愈式浏览器自动化,3.2K Star
从去年开始,AI Agent 火得一塌糊涂。从 AutoGPT 到各种浏览器自动化工具,大家都在做同一件事:让 AI 替人类操作网页。
但用过这类工具的人都知道,现实远比想象骨感。传统的浏览器自动化,本质上是在"教 AI 用人类的方式上网"…
Kimi K2.6 正式发布:开源代码能力新标杆,智能体集群扩展至 300 个
前言
月之暗面正式上线并开源了新模型 Kimi K2.6。从官方公布的 benchmark 来看,代码能力追平或者超越 GPT 5.4 和 Opus 4.6,非常能打。当然与 A 厂刚发布的 Mythos 和 Opus 4.7 还有差距。
…
说人话 Skill 详解:如何去除 AI 生成内容的翻译腔和工程师腔
苏米注:你有没有遇到过这种情况——让 AI 帮你写内容,结果出来的是一份"看似专业、实则充满 AI 味"的文档?GitHub 上有个叫"说人话"的项目,目标非常朴实:把你用 ChatGPT、Claude 生成的那些充…
Product Manager Skills 开源:46 个实战技能 +6 个工作流,产品经理的实战 MBA
苏米注:你有没有遇到过这种情况——让 AI 帮你写个 PRD,结果出来的是一份"看似专业、实则空洞"的文档?市面上大部分 AI 提示词只教你"怎么让 AI 输出",却不教你"为什么这样写才对"。今天介绍的这个开源项目…
Google TimesFM 开源详解:1000 亿时间点预训练,零样本时间序列预测模型
苏米注:Google Research 团队开源的 TimesFM 在 GitHub 上已经斩获 17.9K Star,在全球趋势榜冲到前三。在时间序列预测这个小众但极其实用的领域,能引起这么大轰动的项目真不多见。今天我来详细拆解这个"黑科…
在飞书操控 Claude Code:GitHub 开源 Skill 远程部署指南
苏米注:在手机上远程控制电脑上的 Claude Code 是个很实用的需求。今天推荐的这个 GitHub 开源 Skill 让你在飞书里操控 Claude Code,不用迁移现有环境配置,所有 Skills 和会话上下文都能 1:1 还原。…
Hermes Agent 零基础上手指南:3 种安装方式 +12 个踩坑解决方案
苏米注:Hermes Agent 是 GitHub 上火爆的开源 AI Agent 工具,由 Nous Research 开发。这篇教程我整理了完整的安装指南和常见踩坑解决方案,适合零基础上手的用户。
一、Hermes Agent 是什么
…
Hermes Web UI 汉化版发布:8 平台统一管理的 AI 对话控制台
苏米注:Hermes Web UI 是一个开源的 AI 对话管理工具,能把 Telegram、Discord、微信等 8 个平台的 AI 对话统一到一个网页控制台管理。对于同时使用多个 AI 平台的用户来说,这个工具能大幅提升管理效率。
一…