当前位置：首页 » AI开源项目

OmniVoice Studio：本地运行的开源 AI 声音克隆和视频配音工具

1月前 AI开源项目 1234 0

OmniVoice Studio：本地运行的开源 AI 声音克隆工具

OmniVoice Studio 是一个开源的 ElevenLabs 替代方案，支持实时听写、零样本语音克隆、视频配音，并且可以在桌面端本地运行。

对经常做视频、播客、课程、公众号素材整理的人来说，最有价值的地方在于：不用每次都把音频上传到云端，也不用被 API、账号和订阅额度卡住。

给一小段语音，就可以克隆相似声音。项目强调支持 646 种语言，对多语种内容创作者很有吸引力。

可以把视频或 YouTube 链接拿来处理：先转录 → 再翻译 → 再重新配音 → 最后导出视频。如果你经常把英文资料改成中文内容，或者做跨语言视频素材，这个流程会很实用。

项目里有一个全局听写组件：⌘+⇧+Space 在任意应用里呼出，语音转文字后自动粘贴。这个功能很适合写作、做会议纪要、整理灵感，也适合不想一直打字的人。

支持多种语音引擎切换，比如 OmniVoice、CosyVoice 3、MLX-Audio 等。可以根据设备、语言、声音效果去选择更合适的后端。

最适合以下几类场景：

苏米注：做内容的人经常遇到一个问题——资料很多，但整理、翻译、配音、剪辑都很耗时间。如果这些步骤能在本地跑起来，就可以形成一条更稳定的内容生产链路。

项目支持桌面端：macOS、Windows、Linux。桌面安装包会在首次启动时自动配置环境和下载模型。

需要注意：项目目前还处于 active beta，使用时要预期可能会遇到 bug。

如果你正在做视频、课程、出海内容、多语种素材整理，OmniVoice Studio 值得先收藏。等它继续稳定下来，它可能会成为很多创作者电脑里的常用工具。

声明：本站原创文章文字版权归本站所有，转载务必注明作者和出处；本站转载文章仅仅代表原作者观点，不代表本站立场，图文版权归原作者所有。如有侵权，请联系我们删除。

请登录后发表评论