当前位置：首页 » AI产品百科

Linly Talker：数字人对话系统，Linly开源社区推出的一个开源数字人框架

11月前 AI产品百科 1295 0

Linly Talker是一个创新的数字人对话系统，结合了大语言模型（LLMs）与视觉模型，创造出一种新颖的人机互动方式。该系统集成了多种技术，如 Whisper、Linly、Microsoft Speech Services 和 SadTalker 生成系统，旨在提供逼真的数字人对话体验。Linly-Talker 支持用户上传图像进行对话，并通过多轮对话系统增强互动性和现实感。该项目由 Kedreamix 开发，并在 GitHub 上开源，供开发者和研究人员使用和改进。

Linly Talker功能

多模型集成：Linly-Talker整合了Linly、GeminiPro、Qwen等大模型，以及Whisper、SadTalker等视觉模型，实现了高质量的对话和视觉生成。
多轮对话能力：通过GPT模型的多轮对话系统，Linly-Talker能够理解并维持上下文相关的连贯对话，极大地提升了交互的真实感。
语音克隆：利用GPT-SoVITS等技术，用户可以上传一分钟的语音样本进行微调，系统将克隆用户的声音，使得数字人能够以用户的声音进行对话。
实时互动：系统支持实时语音识别和视频字幕，使得用户可以通过语音与数字人进行自然的交流。
视觉增强：通过数字人生成等技术，Linly-Talker能够生成逼真的数字人形象，提供更加沉浸式的体验。

官网链接：https://github.com/Kedreamix/Linly-Talker

声明：本站原创文章文字版权归本站所有，转载务必注明作者和出处；本站转载文章仅仅代表原作者观点，不代表本站立场，图文版权归原作者所有。如有侵权，请联系我们删除。

未经允许不得转载：Linly Talker：数字人对话系统，Linly开源社区推出的一个开源数字人框架

#Linly Talker #Linly #多模型 #多轮对话 #语音克隆

收藏 1

评论 (0)

请登录后发表评论