#语音模型

Fun-Audio-Chat:阿里巴巴发布全新开源语音交互大模型
在这个大模型满天飞的时代,我们似乎已经习惯了和 AI 文字聊天时的“秒回”与“博学”。但一旦切换到语音通话模式,那种“丝滑感”往往瞬间消失——要…
Kyutai TTS:一款开源TTS文本转语音模型,超低延迟语音合成工具
Kyutai TTS 是一款针对实时应用优化的文本转语音模型。它提供超低延迟、高准确率的语音合成,并支持文本流式输入和长音频生成,适用于各种需要实时语音交互的场景,例如语音助手、实时字幕生成等。Kyutai TTS 的独特之处在于其延迟流…