10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

Wan 2.6:角色与音色可参考,多镜头更稳定,短视频制作更可控

3月前 AI最新动态 804 0

作为一个长期用AI工具做内容设计和产品探索的人,我对视频生成的“可控性”一直很敏感:角色能否保持一致、镜头是否能按叙事意图切换、声音和口型是否对齐。

今天把万相2.6试了一圈,我的核心结论是:它把创作方式从“纯提示词驱动”推进到“以角色为中心的参考驱动”,并且把声画同步和多镜头规划做到了一个可用的水平,适合短视频、广告与预演等场景的快速产出。

关键更新

多模态参考生成

继文本、图像、音频之后,Wan 2.6 支持视频参考生成。可复刻任意 5s 视频内的人物、动物、动画人物、物体,并作为后续视频创作的主角,不止复刻形象,还能复刻音色;支持主角的单人表演和双人合拍,并输出声画同步的视频(包含配乐、音效、人声)。

声画同步生成
支持更完整的叙事声画同步,多人对话场景稳定生成,能生成真实自然的人声表达。声音质感提升,音乐和歌唱效果也更好听。
多镜头智能调度
自然语言和专业分镜提示词都能理解,可在一段视频中实现多镜头叙事,并保持关键信息的高度一致性
超长视频输出

支持 15 秒 1080P 高清视频输出,更真实细腻的画面质感、更高级的美学表现

实际体验

合拍对话(角色+音色参考):上传我自己的短视频作为音色参考,再设定一个历史人物形象,同框对话。口型和语义对应准确,镜头在说话者时有推进,音色之间区分明显。对双人场景来说,这解决了我过去经常遇到的“声音串味”和“镜头只会停在一个景别”的问题。

 

音频驱动的图生视频:只给一张正面图和一段我录的快语速音频,不写提示词。模型自动完成口型匹配、情绪节奏和镜头切换,连贯性比我之前试过的同类方案更稳定。

 

单图+提示词的播客段子:一张猫狗合照+分场景提示词。模型在说话角色时推进镜头、角色远离镜头时音量减小;两种音色区分度清晰。属于“拿来就能发”的效果。

结构化对比

维度 常见AI视频(近半年实测体验) 万相2.6
角色控制 主要依赖文本或单图引导,角色一致性弱,多人同框易混乱 角色参考(人/动物/物体),外观与音色可同步,支持单人与双人合拍
声画同步 常见做法是后期叠加语音,口型与节奏常不匹配 从参考音频提取音色与节奏,口型对齐度提升,多人场景更易区分
镜头组织 多为单镜头生成,分镜需要人工拼接,角色细节易漂移 文本驱动的智能分镜,镜头切换保持关键视觉信息相对一致
时长与分辨率 以短片段为主,长时连贯性与一致性是难点 文生/图生最长15秒,参考生视频10秒;最高1080P
使用门槛 提示词友好,但多人与分镜需要额外剪辑与配音 建议准备参考图/音频+简洁分镜提示词,减少后期剪辑与配音工作量
适合人群 单镜头实验、素材快速试水 短视频创作者、广告与品牌内容团队、影视前期预演、虚拟IP运营

如何用?

准备参考:上传角色的图像或视频;若需要音色统一,准备干净的语音样本。

编写提示词:用“场景1/2/3…”的方式描述镜头、景别、说话者和语句;同框可明确角色名称。

调用角色:在界面中录制或上传素材,使用“@角色名”触发参考;选择文生/图生/参考生模式。

质量检查:重点看口型对齐、镜头切换的一致性、音色区分;若大远景模糊,尝试以中近景为主。

体验入口

阿里云百炼:https://bailian.console.aliyun.com/?tab=model#/model-market/all?providers=wan

万相官网:https://tongyi.aliyun.com/wan/

总结

万相2.6的价值在于把“角色与音色的一致性”和“多镜头的基本可控”整合到同一条生成链路里。

对于需要快速产出、又希望形象统一的团队(短视频、广告、虚拟IP、影视预演),它能显著减少剪辑与配音的重复劳动,把精力转到脚本与镜头意图上。

现阶段的限制也清晰:超长叙事、复杂调度仍需人工;远景细节还不稳定。

整体而言,这是一条更贴近实际制作流程的升级路径,我会把它纳入日常工具栈,用于系列化内容与方案预演。

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Wan 2.6:角色与音色可参考,多镜头更稳定,短视频制作更可控
#万相2.6 #Wan2.6 
收藏 1
banana-slides:你是不是在这个开源?用Nano Banana Pro生成PPT
Style3D:AI让灵感一秒变爆款,轻松搞定选品、测款,面向服装电商的AI设计评测
推荐阅读
  • 火山方舟满血版DeepSeek R1 API免费体验,可薅145元代金券!不封顶(附API接入教程)
  • 亲测 PixVerse R1:通用级实时视频生成的技术突破,让想象力进入 AI 构建的虚拟空间。
  • CES 2026 观察:AI 不再是单独的产品,而是硬件的默认引擎
  • 实测 PaddleOCR 3.3:109 种语言与结构化解析,一次部署覆盖大部分文档场景
  • Windsurf:Codeium推出免费的智能代码补全神器 Windsurf Editor, 以对话方式编写完整项目代码
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
27572 8月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
25542 11月前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
17272 1年前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
17013 11月前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
15184 1年前
刚刚!Cursor风控又加强了,可能是因为这个原因!
13714 12月前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
13646 11月前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
13468 1年前
字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
12138 9月前
Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
11430 1年前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Meta 发布全新大模型 Muse Spark:多模态是强项,编程是短板
2 Anthropic 疯狂一周:四天四连发,从封杀到自建生态
3 Claude 军师模式:Opus 幕后指导,成本降 11.9%
4 28 个 OpenRouter 免费 AI 模型 API 汇总:无需信用卡即可使用
5 Codex 插件系统详解:将 Skills、应用集成与 MCP 打包成可复用工作流
6 Gemma 4 开源实测:31B 参数跻身全球前三,oMLX + Mac Mini 打造高性价比 AI 底座
7 GLM-5.1 代码能力实测:SWE-Bench Pro 全球第一,长程任务可连续工作 8 小时
8 DeepSeek 网页版灰度测试双模式:快速模式基于 3.2,专家模式或为 V4 早期版本
9 GLM-5.1 技术报告:744B 参数开源模型,SWE-Bench Pro 58.4 分全球第一
10 Coze 2.5 发布:Agent 独立身份与网络架构详解
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联