#语音合成
7款免费文本转语音工具盘点,效果堪比付费软件
想做短视频配音,又不想花钱买专业配音软件?这两年免费 TTS 工具的进步非常大,一年前还是电子音,现在不少工具的还原度已经能媲美付费产品了。
以下是 7 款真正好用的免费文本转语音工具,按场景分类推荐。
TTSMaker(马克配音)&mda…
GPT-SoVITS声音克隆实战,从安装到一键调用的完整教程
不需要先成为语音算法工程师。准备一段自己的录音,再找一个能够操作终端和浏览器的 AI Agent,你就可以把 GPT-SoVITS 安装、训练和封装成日常可调用的工具。
最近我完整体验了一次 GPT-SoVITS:从下载安装到第一次语音合成…
VoxCPM2:国产开源 2B 参数 TTS 模型,支持 30 种语言与语音克隆
VoxCPM2:国产开源 2B 参数 TTS 模型,支持 30 种语言与语音克隆
OpenBMB 团队发布了 VoxCPM2 文本转语音(TTS)模型。该模型拥有 2B 参数,支持语音克隆、语音设计和高质量语音合成,涵盖英文、中文、日语、韩…
Gemini 3.1 Flash TTS 实测:3 个避坑指南 +2 个 Audio Tags 神技详解
苏米注:Gemini 3.1 Flash TTS 发布后,我花了 3 小时深度测试,发现了 3 个官方没说清楚的坑和 2 个实用神技。今天这篇文章帮你避开这些坑,同时充分利用它的强大功能。
一、坑①:中文发音偶尔翻车,专业术语直接"翻译腔…
刚刚!阿里 Qwen3-TTS 发布,语音合成能力大幅提升!
继发布Z-Image(造相)广受好评后,阿里又上好货了。
就在刚刚发布 Qwen3-TTS,版本号 2025-11-27,这次更新解决了语音合成的几个核心问题。
音色大幅扩展49 种高品质音色,覆盖不同性别、年龄和角色设定。具体包括撒娇搞…
Kyutai TTS:一款开源TTS文本转语音模型,超低延迟语音合成工具
Kyutai TTS 是一款针对实时应用优化的文本转语音模型。它提供超低延迟、高准确率的语音合成,并支持文本流式输入和长音频生成,适用于各种需要实时语音交互的场景,例如语音助手、实时字幕生成等。Kyutai TTS 的独特之处在于其延迟流…
UntitledPen:AI语音生成平台,文本转语音和语音转文本
UntitledPen 是一款AI语音合成工具,能为您的内容创作出自然逼真的语音。它支持文本转语音和语音转文本,并提供多种语言和音色选择,让您可以轻松创建高质量的音频内容,适用于各种场景,例如有声读物、视频配音、广告制作等。其AI辅助写作…
ViiTor:AI视频翻译、专注于视频翻译、语音克隆和动态语音合成等技术
ViiTor是一款强大的多功能 AI 平台,专注于视频翻译、语音克隆和动态语音合成等技术。它支持多达 18 种语言,能够将视频内容快速翻译成多种语言,并自动生成字幕。此外,Viitor AI 的语音克隆功能仅需几秒音频样本即可生成高质量的…
Vocu AI:语音克隆平台,超拟真AI语音合成与瞬时克隆
Vocu AI 是一个基于人工智能的语音克隆平台,可以根据任意样本音频生成不同风格的语音角色。专注于5秒瞬时语音克隆和超拟真语音合成的创新产品,由自研尖端Vocu文生语音大模型驱动,可深入理解文本,瞬时克隆任意声音,并实现与真人无异的超拟…
Videotok:AI视频创作平台,AI驱动脚本、图像、动画及配音等功能
Videotok是一款AI视频创作工具,它能帮助个人创作者和品牌快速制作高质量视频。您可以使用文本、图片、音频等多种素材,创建各种类型的视频,例如短视频、广告、产品演示等。Videotok 集成了多种AI功能,例如AI脚本生成、AI图像生…