10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

腾讯开源混元图像模型 3.0(HunyuanImage 3.0),免费开放使用!

1月前 AI最新动态 3284 0

混元图像3.0,来了,而且还是开源,直接免费开放使用!

腾讯开源旗下混元 3.0 模型(HunyuanImage 3.0),参数量 80B,据官方介绍说是目前效果最好的开源生图模型,整体效果和头部闭源模型相差不大。

原生多模态

据官方介绍中强调原生多模态,这指的是在技术架构上,通过一个模型完成文字、图片、视频与音频等多个模态的输入与输出,而非通过多个模型的组合实现图文理解、图片生成等任务。

这意味着,混元图像3.0不仅拥有生图模型的画画能力,还具备语言模型的思考能力和常识。它就像一个自带“大脑”的画家,可以利用智能去思考图像的布局、构图、笔触,利用世界知识去推理常识性的画面

作为原生多模态开源模型,混元图像3.0需要对模型整体架构进行重构,以支持多任务的训练,并实现多任务效果之间的相互促进。

混元图像3.0以Hunyuan-A13B为基础,基于50亿量级的图文对,视频帧,图文交织数据和6T的语料数据进行了多模态生成、理解和LLM的混合训练,使得模型能够充分融合多任务效果,实现超强的语义理解能力,能够响应复杂的长文本,生成长文本文字,同时具有LLM的世界知识,能够利用世界知识进行推理。

腾讯混元团队透露,混元图像3.0目前的版本仅开放了文生图能力,图生图、图像编辑、多轮交互等版本将于后续发布。

技术特点

  • 原生多模态架构:支持文本、图像、视频、音频的统一建模,而非模型拼接。

  • 语义与推理能力:可解析千字级复杂语义,具备LLM常识推理能力。

  • 图像生成质量:高美学质感,真实高质感画面,支持复杂长文本渲染。

  • 训练数据:基于 Hunyuan-A13B,使用 50亿图文对 + 视频帧 + 6T语料,进行多模态与LLM混合训练。

支持生成

  • 复杂文本类图片(带小字、长段文字的海报等);

  • 漫画/插画/表情包(如四格科普漫画、九宫格表情包);

  • 产品广告与高端摄影风格图片;

  • 创意艺术风格(插画、手账风格、时尚大片)。

使用体验

网页端直接打开 腾讯混元官网 -> 视觉生成即可进入(同时还支持小程序端,可以直接在微信搜索「腾讯混元」即可)

体验入口:https://hunyuan.tencent.com/visual

通过最新上线的这个入口进入就默认是「HunyuanImage3.0」模型了

测试一下官方推荐的提示词:你是一个小红书穿搭博主,请根据模特穿搭生成一张封面图片,要求: 1.画面左侧是模特的OOTD全身图 2.右侧是衣服的展示,分别是上衣深棕色夹克、下装黑色百褶短裙、棕色靴子、黑色包包 风格:实物摄影,要求真实,有氛围感,秋季酷感穿搭,看看生成效果:

复杂文字封面/海报提示词:封面设计,标题:AI 编程正在重塑产品经理,副标题:为什么 AI 编程最适合懂技术的产品经理,特写:一个产品经理正在思考AI编程工具,背景:各种AI编程工具如Cursor、Qoder、TRAE、CodeBuddy,要求:背景模糊处理,标题清晰醒目,用海报设计字体

生成九宫格人物手办:生成九宫格的9个系列盲盒手办,要求不同动作的,可爱蓝色的风格的设计感,Q版人物,每一款手办是不一样的造型,展示背景是一个温馨的桌面

加大难度,设计长文海报排版:

设计一张活动海报,分为两个视觉层次:「背景图」和「前景文字排版」。 文字排版风格:现代主义风格,使用清晰、无衬线字体,网格布局,具有层次感。 保持良好留白,文字不要遮挡关键图像区域。 内容如下(如果空白就你来补充,改成中文):活动主题:活动时间:活动地点:邀请嘉宾(用三个照片)

总结

测试完后,我总体感觉是整体能力有了非常大的提升和飞跃,现在只体验了文生图,像图生图,图片编辑还无法体验到,但开源的想象空间非常大!

80B的大模型自己部署 至少要 4 张 80GB的显卡,个人电脑肯定是跑不起来的,所以还是只能在线上体验了!

如果想要自己部署的话看下面:

Github:https://github.com/Tencent-Hunyuan/HunyuanImage-3.0

Hugging Face:https://huggingface.co/tencent/HunyuanImage-3.0

同时官方还有提示词手册,大家也可以参考一下

提示词手册:https://docs.qq.com/doc/DUVVadmhCdG9qRXBU

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:腾讯开源混元图像模型 3.0(HunyuanImage 3.0),免费开放使用!
#混元图像模型 #混元图像 #腾讯混元 #开源模型 
收藏 1
DeepSeek-V3.2-Exp模型正式发布,性能不变,API价格大幅下调50%
frontend-design skill:用了这套提示词,我的Claude Skills 生成专业设计感前端页面
推荐阅读
  • ChatGPT Atlas:AI浏览器时代的开端,Open AI 浏览器正式发布!
  • Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
  • Gemini CLI 大更新:多模态初露锋芒,音视频处理、Markdown 更强,开发者更顺手!
  • ChatGPT Search 上线,ChatGPT变身 AI 搜索引擎挑战 Google,网页、桌面、移动端全面开放(附 Chrome 插件)!
  • OpenAI GPT-4.1,新的AI编程新王者登场,百万 tokens、代码生成飙升 40%,Cursor 已更新免费使用!
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
20575 4月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
18664 6月前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
14460 8月前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
13205 11月前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
12686 6月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
11402 7月前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
10796 6月前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
10080 8月前
Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
9097 11月前
Trae Pro 来了,终于可以告别排队了!这价格真香
6789 5月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 破纪录!刚刚Cursor拿下23亿美元融资,火速接入GPT-5.1
2 Gemini 3 悄悄上线,美观和信息丰富的设计
3 OpenAi 刚刚在 ChatGPT 中试点群聊功能
4 GPT-5.1来了,这次小迭代GPT-5.1 Instant和GPT-5.1 Thinking该怎么选、怎么用
5 从存起来到用起来,ima2.0让知识流动起来
6 字节连放两个大招:Trae SOLO模式限时免费!Doubao-Seed-Code 接入Trae CN
7 Kimi K2 Thinking:开源里Agent能力领先,但“话多”会拉高成本与时延
8 Google AI 模式(AI Mode)全面开放
9 Trae 突发!即日起 Trae AI 下架所有 Claude 模型
10 谷歌确认今年内发布 Gemini 3,但时间可能顺延
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联