#TTS
2026年必备的6款AI声音克隆工具合集,从免费到本地化部署的完整指南
在AI浪潮中,声音克隆技术正快速从概念走向实用。从短视频配音到跨境营销,这类工具的应用场景正在扩展。
我体验了市面上的多款产品,发现它们在样本需求、支持语言、生成质量和操作难度上存在明显差异。
本文选取6款主流工具,按从小白友好到专业向的顺…
免费用!2026年AI短视频创作必备的5款配音神器!
短视频内容创作中,配音是决定传播效果的关键环节。传统配音方案存在明显痛点:自主配音缺乏专业感,专业配音成本高企(单条几十至数百元)。随着文本转语音(TTS)技术的迭代,AI配音工具已能提供接近真人的音质效果,同时提供丰富的音色库和方言支持。…
刚刚!阿里 Qwen3-TTS 发布,语音合成能力大幅提升!
继发布Z-Image(造相)广受好评后,阿里又上好货了。
就在刚刚发布 Qwen3-TTS,版本号 2025-11-27,这次更新解决了语音合成的几个核心问题。
音色大幅扩展49 种高品质音色,覆盖不同性别、年龄和角色设定。具体包括撒娇搞…
SoulX-Podcast:支持多人对话的方言tts,支持语音克隆,可现实长篇播客,文末一键包
最近在体验新的AI语音生成工具时,发现了一个不错的tts方言包,支持多人对话的方言tts:SoulX-Podcast。
作为一名经常接触各类AI开源项目的产品经理,我注意到语音合成领域正在从单人独白向多人对话场景演进。
这个项目的特别之处在…
从 Fish-Speech 到 OpenAudio:开源 TTS 正在进入情感表达时代
最近几个月,我在测试一系列文本转语音(TTS)模型时,遇到一个让我印象非常深的瞬间,我输入一句话后,AI 不仅准确地朗读,还带上了轻微的笑声和语调起伏,几乎能听出“人味”。
这个项目叫 OpenAudio(原名 Fi…
NeuTTS Air:首个可离线运行的"拟人语音克隆”TTS模型
作为一个长期关注语音AI与本地部署能力结合的产品经理,我对这个项目的第一印象是:终于有一个真正能离线运行、声音自然、还能“克隆人声”的TTS模型。
我们都知道,语音合成(Text-to-Speech)技术这些年飞速发…
FireRedTTS-2:开源多语言多人对话 TTS,支持零样本语音克隆
我一直在关注TTS(Text-to-Speech)的发展,像之前分享的index-TTS2,已经是非常大的突破了。
但随着播客、虚拟角色、智能客服和多模态聊天机器人的普及,对话式语音生成的需求越来越强烈。
但市面上不少方案依然存在两个痛点:…
VoxCPM:开源声音克隆TTS神器,0.5B 逼真的语音克隆
最近我刷开源项目时,看到面壁团队(OpenBMB)放出了一个非常炸裂的开源工具 VoxCPM:一款 无需分词器的端到端语音生成(Tokenizer-Free TTS)模型,主打两个能力:
上下文感知的自然语音生成和逼真的零样本声音克隆
Vo…
Google语音技术探索:从语音识别到语音合成,ASR 与 TTS 模型的全面梳理
Google 在语音识别(ASR,Automatic Speech Recognition)和语音合成(TTS,Text-to-Speech)领域一直处于技术前沿,推出了多个先进的模型和工具。以下是对 Google 的 ASR 和 TTS …
IndexTTS2:全球首创!B站推出影视级TTS模型,支持零样本语音克隆、情绪双克隆与精准时长控制
在过去几年里,我体验过不少文本转语音(TTS)项目——从开源社区的 XTTS、F5-TTS,到商业化的 ElevenLabs、OpenAI TTS。大多数模型都能把文字变成比较自然的语音,但要达到“影视级…