#TTS
VoxCPM2:国产开源 2B 参数 TTS 模型,支持 30 种语言与语音克隆
VoxCPM2:国产开源 2B 参数 TTS 模型,支持 30 种语言与语音克隆
OpenBMB 团队发布了 VoxCPM2 文本转语音(TTS)模型。该模型拥有 2B 参数,支持语音克隆、语音设计和高质量语音合成,涵盖英文、中文、日语、韩…
OmniVoice Studio:本地运行的开源 AI 声音克隆和视频配音工具
OmniVoice Studio:本地运行的开源 AI 声音克隆工具
OmniVoice Studio 是一个开源的 ElevenLabs 替代方案,支持实时听写、零样本语音克隆、视频配音,并且可以在桌面端本地运行。
对经常做视频、播客、课…
Voicebox:开源声音克隆工具,本地运行不耗Token,支持多国语言
制作视频时,很多人希望语音能更有特色——无论是音色还是语气。市面上很多工具要么声音固定,要么需要充值才能使用声音克隆功能。
今天介绍的 Voicebox 是一款开源免费的声音克隆工具,所有数据和模型都运行在本地,普通…
Voicebox 开源:本地语音克隆神器,7 个 TTS 引擎 + 多轨道编辑器
又发现一个本地语音克隆神器,开源了。
ElevenLabs 在 2023 年的爆火,说明了 AI 语音合成的需求是很旺盛的。大家都渴望着能用自己的声音生成配音,或者克隆某个喜欢的音色,于是纷纷选择订阅各种在线服务。
当多数人兴致勃勃想搞 A…
Gemini 3.1 Flash TTS 实测:3 个避坑指南 +2 个 Audio Tags 神技详解
苏米注:Gemini 3.1 Flash TTS 发布后,我花了 3 小时深度测试,发现了 3 个官方没说清楚的坑和 2 个实用神技。今天这篇文章帮你避开这些坑,同时充分利用它的强大功能。
一、坑①:中文发音偶尔翻车,专业术语直接"翻译腔…
KittenTTS:25MB轻量级开源TTS模型,CPU即可运行的离线语音合成方案
最近在整理开源AI项目时,发现了一个有意思的现象:很多开发者在寻找TTS(文本转语音)方案时,往往陷入一个困境——要么模型动辄几百MB,要么必须依赖GPU和云服务。
而实际上,许多应用场景(比如嵌入式设备、离线场景、…
Fun-CineForge:阿里开源的端到端电影配音系统,解决口型同步与多角色音色转换
大多数视频配音工具要么只能做简单的文本转语音,要么在处理多角色对话时容易出现口型错位、音色混乱等问题。
这让我想起了专业配音演员的工作——他们不仅要掌握多种音色,还要精准把握角色的说话时机和嘴型。
前不久,阿里通义实…
Fish Audio:开源语音合成突破性进展,中文TTS性能超越商用方案
最近在浏览开源项目时,Fish Audio 凭借 27k Stars 登上了 GitHub 热榜。
与其他热门项目不同的是,它真正有意思的地方不在于热度本身,而在于它在语音合成领域的实际能力突破。
在深入了解其技术细节和应用形态后,我认为这…
2026年必备的6款AI声音克隆工具合集,从免费到本地化部署的完整指南
在AI浪潮中,声音克隆技术正快速从概念走向实用。从短视频配音到跨境营销,这类工具的应用场景正在扩展。
我体验了市面上的多款产品,发现它们在样本需求、支持语言、生成质量和操作难度上存在明显差异。
本文选取6款主流工具,按从小白友好到专业向的顺…
免费用!2026年AI短视频创作必备的5款配音神器!
短视频内容创作中,配音是决定传播效果的关键环节。传统配音方案存在明显痛点:自主配音缺乏专业感,专业配音成本高企(单条几十至数百元)。随着文本转语音(TTS)技术的迭代,AI配音工具已能提供接近真人的音质效果,同时提供丰富的音色库和方言支持。…