当前位置：首页 » AI开源项目

Talk to 峰哥开源项目：AI 实时声音克隆 + 人格注入，1秒延迟语音对话

1小时前 AI开源项目 9 0

「Talk to 峰哥」是一个开源项目，核心玩法是用 AI 实时克隆一个人的声音和性格，然后跟他进行真正的语音聊天。不是文字转语音的机械朗读，而是像打电话一样来回对话，延迟压到了 1 秒以内。

峰哥只是第一个完整 demo，项目支持替换为其他角色——只要准备好语音素材和人格描述即可。

核心功能

项目采用模块化设计，每个环节都有备选方案：

最简单的方法是交给 AI 编程助手（Claude Code、Cursor、Codex），让它读取 .env.example 自动配置。手动部署步骤：

克隆仓库，安装 Python 3.12+ 和 uv 包管理器
安装 LiveKit Server（macOS 可直接 brew install livekit）
复制 .env.example 为 .env.local，填入三个 API Key：Cartesia（语音识别，免费注册）、MiniMax（大模型）、TTS 方案
TTS 方案选择：有 NVIDIA 显卡（8G+ 显存）推荐 VoxCPM；无显卡可用 MOSS-TTS 或 Cartesia Sonic
启动：双击 Talk-to-Me-V3.6.command，或分别运行 LiveKit Server、Agent Worker、Web Server
浏览器访问 127.0.0.1:8766 即可开始对话

GitHub：YeJe-cpu/talk-to-fengge

声明：本站原创文章文字版权归本站所有，转载务必注明作者和出处；本站转载文章仅仅代表原作者观点，不代表本站立场，图文版权归原作者所有。如有侵权，请联系我们删除。

请登录后发表评论