OmniVoice Studio:本地运行的开源 AI 声音克隆工具
OmniVoice Studio 是一个开源的 ElevenLabs 替代方案,支持实时听写、零样本语音克隆、视频配音,并且可以在桌面端本地运行。
对经常做视频、播客、课程、公众号素材整理的人来说,最有价值的地方在于:不用每次都把音频上传到云端,也不用被 API、账号和订阅额度卡住。

核心功能
1. 语音克隆
给一小段语音,就可以克隆相似声音。项目强调支持 646 种语言,对多语种内容创作者很有吸引力。

2. 视频配音
可以把视频或 YouTube 链接拿来处理:先转录 → 再翻译 → 再重新配音 → 最后导出视频。如果你经常把英文资料改成中文内容,或者做跨语言视频素材,这个流程会很实用。

3. 实时听写
项目里有一个全局听写组件:⌘+⇧+Space 在任意应用里呼出,语音转文字后自动粘贴。这个功能很适合写作、做会议纪要、整理灵感,也适合不想一直打字的人。
4. 多 TTS 引擎
支持多种语音引擎切换,比如 OmniVoice、CosyVoice 3、MLX-Audio 等。可以根据设备、语言、声音效果去选择更合适的后端。

适用场景
最适合以下几类场景:
- 把英文视频资料转成中文配音
- 给课程、教程、产品介绍做旁白
- 给短视频批量生成不同语言版本
- 把口述内容变成文章初稿
- 做播客剪辑、配音和声音设计
- 在本地保存自己的声音素材库
苏米注:做内容的人经常遇到一个问题——资料很多,但整理、翻译、配音、剪辑都很耗时间。如果这些步骤能在本地跑起来,就可以形成一条更稳定的内容生产链路。
安装和使用
项目支持桌面端:macOS、Windows、Linux。桌面安装包会在首次启动时自动配置环境和下载模型。
需要注意:项目目前还处于 active beta,使用时要预期可能会遇到 bug。
- 如果只是尝鲜,可以先用桌面安装包
- 如果想长期折腾、改功能或参与贡献,可以从源码运行
GitHub 项目地址:https://github.com/debpalash/OmniVoice-Studio
苏米的总结
如果你正在做视频、课程、出海内容、多语种素材整理,OmniVoice Studio 值得先收藏。等它继续稳定下来,它可能会成为很多创作者电脑里的常用工具。
声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。