TTS - 苏米客

VoxCPM2：国产开源 2B 参数 TTS 模型，支持 30 种语言与语音克隆

VoxCPM2：国产开源 2B 参数 TTS 模型，支持 30 种语言与语音克隆 OpenBMB 团队发布了 VoxCPM2 文本转语音（TTS）模型。该模型拥有 2B 参数，支持语音克隆、语音设计和高质量语音合成，涵盖英文、中文、日语、韩…

131

5天前

AI产品百科

OmniVoice Studio：本地运行的开源 AI 声音克隆和视频配音工具

OmniVoice Studio：本地运行的开源 AI 声音克隆工具 OmniVoice Studio 是一个开源的 ElevenLabs 替代方案，支持实时听写、零样本语音克隆、视频配音，并且可以在桌面端本地运行。对经常做视频、播客、课…

554

1周前

AI开源项目

Voicebox：开源声音克隆工具，本地运行不耗Token，支持多国语言

制作视频时，很多人希望语音能更有特色——无论是音色还是语气。市面上很多工具要么声音固定，要么需要充值才能使用声音克隆功能。今天介绍的 Voicebox 是一款开源免费的声音克隆工具，所有数据和模型都运行在本地，普通…

297

2周前

AI产品百科

Voicebox 开源：本地语音克隆神器，7 个 TTS 引擎 + 多轨道编辑器

又发现一个本地语音克隆神器，开源了。 ElevenLabs 在 2023 年的爆火，说明了 AI 语音合成的需求是很旺盛的。大家都渴望着能用自己的声音生成配音，或者克隆某个喜欢的音色，于是纷纷选择订阅各种在线服务。当多数人兴致勃勃想搞 A…

733

1月前

AI开源项目

Gemini 3.1 Flash TTS 实测：3 个避坑指南 +2 个 Audio Tags 神技详解

苏米注：Gemini 3.1 Flash TTS 发布后，我花了 3 小时深度测试，发现了 3 个官方没说清楚的坑和 2 个实用神技。今天这篇文章帮你避开这些坑，同时充分利用它的强大功能。一、坑①：中文发音偶尔翻车，专业术语直接"翻译腔…

508

1月前

最近在整理开源AI项目时，发现了一个有意思的现象：很多开发者在寻找TTS（文本转语音）方案时，往往陷入一个困境——要么模型动辄几百MB，要么必须依赖GPU和云服务。而实际上，许多应用场景（比如嵌入式设备、离线场景、…

556

2月前

AI开源项目

Fun-CineForge：阿里开源的端到端电影配音系统，解决口型同步与多角色音色转换

大多数视频配音工具要么只能做简单的文本转语音，要么在处理多角色对话时容易出现口型错位、音色混乱等问题。这让我想起了专业配音演员的工作——他们不仅要掌握多种音色，还要精准把握角色的说话时机和嘴型。前不久，阿里通义实…

583

2月前

AI开源项目

Fish Audio：开源语音合成突破性进展，中文TTS性能超越商用方案

最近在浏览开源项目时，Fish Audio 凭借 27k Stars 登上了 GitHub 热榜。与其他热门项目不同的是，它真正有意思的地方不在于热度本身，而在于它在语音合成领域的实际能力突破。在深入了解其技术细节和应用形态后，我认为这…

599

2月前

AI开源项目

2026年必备的6款AI声音克隆工具合集，从免费到本地化部署的完整指南

在AI浪潮中，声音克隆技术正快速从概念走向实用。从短视频配音到跨境营销，这类工具的应用场景正在扩展。我体验了市面上的多款产品，发现它们在样本需求、支持语言、生成质量和操作难度上存在明显差异。本文选取6款主流工具，按从小白友好到专业向的顺…

3110

4月前

AI工具集合

免费用！2026年AI短视频创作必备的5款配音神器！

短视频内容创作中，配音是决定传播效果的关键环节。传统配音方案存在明显痛点：自主配音缺乏专业感，专业配音成本高企（单条几十至数百元）。随着文本转语音（TTS）技术的迭代，AI配音工具已能提供接近真人的音质效果，同时提供丰富的音色库和方言支持。…

1456

4月前

AI工具集合

#TTS