10+年产品经理专注分享AI 工具、AI 资讯、AI Coding、Vibe Coding与下一代产品创新,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI工具集合

本周 9 款 AI 新品盘点:豆包音频、LongCat-2.0、GPT-5.6、Claude Sonnet 5

1小时前 AI工具集合 13 0

本周各大厂在 AI 领域动作密集,一口气上新了 9 款产品,涵盖音频生成、大模型、漫剧制作、AI 设计、音乐生成、语音输入、多模态模型和图像生成。

豆包音频生成模型 1.0

字节在火山引擎 FORCE 大会上发布了豆包音频生成模型 1.0。输入一段提示词,它能把人声、音效、配乐、场景声一次性打包生成,有情绪有呼吸感,不会生硬也不会过度甜美。实测中多角色相声表现惊艳——女逗哏节奏快情绪外放,男捧哏稳中带冷幽默,连观众笑声等环境音都能自动配上。

单次最多生成 2 分钟,长文本有声书需要分段。声音不再是视频做完后贴上去的配件,而是从脚本阶段就能参与创作。

图片 1

体验地址:火山引擎豆包音频体验

LongCat-2.0

美团开源了 LongCat-2.0,总参数 1.6 万亿,每 token 激活约 480 亿。支持 1M 超长上下文,可以把整个代码库丢进去一次性读完并精准定位。引入 LongCat Sparse Attention 稀疏注意力机制,把长上下文注意力计算从平方级降到线性级。

这是业界首个在五万卡国产集群上完成万亿参数模型全流程训练与推理的模型,验证了非 NVIDIA 平台的可行性。

图片 2

体验地址:longcat.chat

WorkRally

腾讯视频推出的工业级 AI 漫剧制作平台,覆盖剧本解析、分镜生成、内容生产到资产管理与团队协作的完整生产链路。内置 S+ 级影视动漫技能库,包含构图、表演、动作、镜头四大方向的专业级知识库,能直接输出影视级质感画面,实现角色状态动态追踪与批量一致性管理。

图片 3

体验地址:workrally.qq.com

TRAE Work Design

字节 TRAE Work 推出的设计模式,通过自然语言对话直接生成 UI 设计稿,在画布中实时编辑修改。能解析 Figma 文件,自动提取设计系统,确保 AI 出图严格遵循品牌视觉规范。打通需求→设计→代码全链路,设计产物可一键导入 Code 模式生成前端代码。

图片 4

体验方式:打开 TRAE Work 桌面端或网页端,切换至 Design 模式

SeedMusic 1.0

字节的 AI 音乐生成模型,输入文本提示(情绪、流派、场景)或一句歌词,2-3 分钟内生成包含 AI 人声演唱与完整编曲的歌曲草稿。支持流行、嘻哈、电子、Lo-Fi、古风等多种风格切换,零门槛无需音乐制作经验。

图片 5

体验地址:即梦平台

千问输入法

阿里通义千问推出的独立 AI 语音输入法,主打"说得随意,写得漂亮"。不只是语音转文字,而是先理解内容,自动去除语气词、纠正口误,把散装口语整理成结构化书面文本。支持最快 300 字/分钟语音输入,9 种方言识别,中英混说也可。AI 指令模式下双击快捷键即可口头下达任务,大模型在悬浮窗里完成并返回结果。

图片 6

体验地址:ime.qianwen.com

GPT-5.6

OpenAI 最新一代模型,目前以"有限预览"形式向少数可信合作伙伴开放。首次采用天文学命名体系,推出三档型号:Sol(太阳)旗舰版、Terra(地球)均衡版、Luna(月亮)轻量版。核心能力聚焦编程、生物信息学和网络安全,支持 150 万 tokens 超长上下文。Terminal-Bench 2.1 得分 Sol 88.8%、Sol Ultra 91.9%。新增 Ultra 模式,通过多子 Agent 协作处理复杂任务。

图片 7

Claude Sonnet 5

Anthropic 发布的 Sonnet 系列最强智能体模型。能自己定计划、调浏览器和终端工具,然后自己跑任务。SWE-bench Pro 通过率 63.2%、Terminal-Bench 2.1 通过率 80.4%、OSWorld-Verified 通过率 81.2%,接近 Opus 4.8 水平但价格便宜不少。支持五个档位"努力度"调节(low/med/high/xhigh/max),按需平衡成本和输出质量。

图片 8

体验地址:claude.com

Nano Banana 2 Lite

谷歌的极速生图模型,定位明确就是速度快——4 秒生成单张图像,每千张收费仅 0.034 美元。适合电商素材批量生产、广告创意迭代、游戏影视概念设计等快速试错场景。图像风格偏向商业素材和标准摄影风。

图片 9

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:本周 9 款 AI 新品盘点:豆包音频、LongCat-2.0、GPT-5.6、Claude Sonnet 5
#AI新品 #行业动态 #产品盘点 #豆包 #LongCat 
收藏 1
Cherry Studio V2 内测开启:开源 AI 工作台全面升级
SGLang 团队把工程经验写进 Agent:3 个 Kernel PR 合并,B200 加速 2.75x
推荐阅读
  • 省钱又高效!6个免费容器部署平台让你的项目轻松上线
  • Claude Code Token 消耗太高?10 款开源工具帮你省 80%
  • 15款国内免费好用的AI写作神器合集,2025超干货! Ai写作工具推荐,支持论文长文
  • 本周 9 款 AI 新品盘点:豆包音频、LongCat-2.0、GPT-5.6、Claude Sonnet 5
  • WorkBuddy + ima 搭建个人知识库:自动收集优质内容的完整方案
评论 (0)
请登录后发表评论
分类精选
12款国内外最全AI绘画工具推荐,AI文生图工具深度测评与场景化对比
40655 1年前
2025开源AI数字人工具指南:8大免费开源神器带你免费解锁可商用的AI数字人
35493 1年前
15款国内免费好用的AI写作神器合集,2025超干货! Ai写作工具推荐,支持论文长文
30700 1年前
2025年普通人必须要知道的15个AI工具,可以让日常工作效率大幅度提升
24235 1年前
10 个主流 AI Agent Skill 市场平台横向对比:Clawhub、Skillsmp、SkillHub 哪家强?
21438 2月前
8 款 AI 翻译浏览器插件,沉浸式翻译助你轻松阅读网页
19601 1年前
谁会成为下一个Cursor的平替,盘点 8 款可用 Claude 4 的AI编程工具
14313 11月前
5款开源TTS,零样本声音克隆,克隆你想要的声音,快速本地部署(含一键包下载)
14269 1年前
8 款热门 AI 图片+视频生成工具:文生图、文生视频、图生视频
14005 1年前
2025年热门好用的 AI换脸工具大全,适合内容创作者、视频剪辑师、特效制作、AI 爱好者使用
13850 1年前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 本周 9 款 AI 新品盘点:豆包音频、LongCat-2.0、GPT-5.6、Claude Sonnet 5
2 盘点国内四款Work系列AI智能体:WorkBuddy、QoderWork、KimiWork、Trae Work对比
3 7款免费文本转语音工具盘点,效果堪比付费软件
4 10个视频处理小工具:批量截图、压缩、格式转换,点开就能用
5 20个值得收藏的Agent Skills合集:从安装到自己造,SKILL.md正成为Agent时代的npm
6 10 个开源 AI Skill 搭建内容创作流水线:从选题到分发的全链路指南
7 PP-OCRv6 实测:34.5M 专用模型打败 235B 大模型?三档 OCR 对比评测
8 实测11分钟到17分钟:四款主流桌面Agent做PPT,到底谁才是真王者?
9 PM-Skills:把产品管理方法论编码为 AI 工作流,GitHub 三月 1.6 万 Star
10 6 个 AI Skill 组合:从需求到 Demo,10 分钟完成产品开发全流程
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 产品经理导航 爱克硕儿 产品经理AI资讯 Axure元件库下载 申请友联