10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI产品百科

MirageLSD:AI视频革命,40毫秒延迟,这真的是“直播界的Sora”吗?

1月前 AI产品百科 768 0

相较于 Open AI 的 Agent 发布,我觉得昨晚最重要的发布的这个才是真的爆!

堪称AI视频领域的“核武器”:Decart发布MirageLSD:AI,实时直播40毫秒延迟,这下直播业和游戏业或遭降维打击!

这是一家叫 Decart 的小公司直接开挂般地发布了一个我觉得可能是“未来视频形态”的产品 —— MirageLSD:世界上首个实时直播视频模型,可以将摄像头的画面实时转换为其他风格和内容的视频。

这个产品能够让“AI视频生成”从炫技变成可以落地的体验。而且,它完全不是Sora那种“几秒钟视频+几分钟等候”的逻辑,它是实时生成、无限流畅、还能互动。

MirageLSD 到底做了什么?

简单说,它就是把摄像头画面,通过AI模型实时转化成另一个风格的世界,比如:

  • 40毫秒延迟响应:基本上就是"实时"的概念,比眨眼还快

  • 无限长度生成:不再受限于几秒钟的短片,可以持续进行

  • 24FPS流畅画面:看起来就像真实的视频流

  • 手势交互控制:用手遮住脸会自动变化特征,转动手中的笔会改变颜色和形状

我看到他们创始人在发布会上亲自演示,嘴里说着“狂野西部、宇宙、金色、罗马帝国”,画面直接就变成一场沉浸式的实时电影。而整个过程的延迟只有 40ms,基本和肉眼感知是同步的。

关键是:不限时长!24帧流畅直播! 这是目前其他AI视频生成模型根本做不到的事情,比如Runway、Pika Labs,虽然效果很棒,但都有一个致命问题:你需要等待。输入一个提示词,等个十几秒,然后得到一个几秒钟的视频片段,而且质量还不稳定。

两大核心突破

作为产品经理,我总是好奇这种"不可能"的产品是怎么实现的。Decart团队解决了两个关键问题:

第一个问题:错误累积 传统的AI视频生成就像接力赛,每一帧都基于前一帧生成。问题是,每一帧都会带来微小的错误,这些错误会像滚雪球一样越来越大,几秒钟后画面就会完全崩坏。这就是为什么之前的AI视频都很短。

Decart的解决方案是:历史增强(history augmentation):他们在训练时故意向历史帧中加入干扰,让AI学会预判和纠正自己可能犯的错误。这就像教一个人在走路时预判可能的绊脚石,从而避免摔倒。

第二个问题:计算速度 要实现40毫秒以内的响应,需要极致的性能优化。

为了将每帧的处理时间压缩到40毫秒以内,Decart采用了三管齐下的“暴力”优化策略:

  • 定制CUDA超级内核 (Mega Kernels):编写底层代码,为NVIDIA Hopper架构GPU量身定制执行方式,最大限度减少延迟。

  • 架构感知剪枝 (Architecture-aware Pruning):精简模型,剔除冗余参数,让模型更轻、更快,同时完美适配GPU硬件。

  • 快捷蒸馏 (Shortcut Distillation):训练一个小模型去模仿大模型的去噪轨迹,用更少的计算步骤实现同样高质量的输出。

这些技术细节听起来很枯燥,但效果是惊人的:比之前的模型快了16倍。

MirageLSD 是特效滤镜?

这不只是一个滤镜,刚开始我以为这只是一个高级的美颜滤镜,但深入了解后发现,这个产品的想象空间太大了。

对于内容创作者:想象一下,一个健身博主可以瞬间把自己的训练视频背景变成古罗马竞技场;一个游戏主播可以把《GTA》的画面实时转换成赛博朋克风格;一个网课老师可以让枯燥的会议室变成火星基地。

对于企业应用:视频会议可以有更丰富的虚拟背景;产品演示可以实时生成各种使用场景;培训课程可以让学员身临其境。

对于游戏开发:这可能是最让我兴奋的应用场景。传统游戏开发需要大量的建模、贴图、光影处理,但有了MirageLSD,开发者可以用文字描述直接生成游戏场景,实时渲染开放世界。

这款产品绝不只是做直播美化这么简单。Decart其实在构建一个类似“AI视频引擎”的平台能力开放后你可以做:

  • 直播:健身房直播直接变成古罗马角斗场

  • 视频会议:Zoom开会变成在太空舱里头脑风暴

  • 游戏直播:《GTA》画面秒切《赛博朋克2077》风格

  • 短视频创意:三十分钟从“手指变光剑”到“低成本大片”

  • 游戏开发:直接用文字Prompt创建游戏世界场景,无需建模

简单说:它不只是“生成内容”,而是实时接管视觉世界的入口,就像当年智能手机变成“计算平台”,Mirage也可能是“视频世界的iOS”。

写在最后

回顾这几年AI视频生成的演进,从Runway、Pika到Sora,我们看到了一个趋势:从“几秒短片”到“高质量内容”,但都还停留在“后期处理”阶段。

Decart的 MirageLSD 是我第一次看到的,真正能够做到 实时、可控、无限流畅、极低门槛的产品。

它让直播不再是“你看到我”,而是“我想象你看到的我”;让创意视频不再是后期慢慢剪,而是边演边变。

也许未来的“OBS”会变成“AI世界编辑器”,而我们只需要一句Prompt,一个动作,就能开启一场沉浸式的直播或游戏秀。

下一个10亿用户的入口,也许就在这40毫秒里。

MirageLSD 体验:https://mirage.decart.ai/

MirageLSD 技术报告: https://about.decart.ai/publications/mirage

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:MirageLSD:AI视频革命,40毫秒延迟,这真的是“直播界的Sora”吗?
#MirageLSD #Decart #AI直播 
收藏 1
Kiro爆了,现已需要内测申请和排队了,实操案例带你抢先体验Kiro(附安装包下载)
Google Opal:一句话搭出AI小程序?让不会写代码的人也能像调积木一样做App!
推荐阅读
  • Pixble: 一个使用人工智能来增强您的照片的在线照片编辑工具
  • 场辞:AI视频字幕制作软件,语音转变生成字幕
  • Bridgely:通用的翻译扩展浏览器插件,支持60多种语言、实时翻译信息
  • 国内白嫖 GPT-5?DeepSider:0 成本用上顶级大模型
  • GPT-SoVITS:一个强大的零样本语音转换和文本到语音WebUI
评论 (0)
请登录后发表评论
分类精选
Picarta:可以查找图片拍摄地点的AI识图软件,使用AI搜索照片拍摄的精确位置
10229 6月前
Noiz AI:AI语音克隆工具,一款TTS和视频配音神器
8632 6月前
Unscreen:在线视频和GIF背景抠除工具,不用绿幕轻松完成视频抠像
8303 1年前
Reecho 睿声:免费AI语音克隆与超拟真语音合成平台,用户只需提供一小段声音样本,完成声音的克隆
7346 10月前
BeArt:一款免费且无水印的的在线AI换脸网站,适用于照片、视频和GIF中实现精准换脸
6734 7月前
抖音即创AI: 一站式智能AI创作管理平台
6568 9月前
嘎嘎降AI:AIGCleaner论文降重工具网站,专门降低文章AI率、查重率的工具
5750 5月前
拍我AI:PixVerse国内版,重新定义AI视频创作的全民神器
5251 2月前
BibiGPT:音视频内容一键总结工具
4520 9月前
Saylo:免费AI角色故事聊天,沉浸式AI聊天、互动故事及角色扮演游戏平台
4479 6月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Google Opal:一句话搭出AI小程序?让不会写代码的人也能像调积木一样做App!
2 梯子AI:百度出品AI智能搜索工具,无广告的智能搜索体验
3 Clean Paste:一键清除AI生成文本中的水印和隐藏标识,绕过 AI 检测工具
4 Gamma:别只盯着 Kimi,看这款 AI 也能让你的 PPT 一秒变美学大师!
5 Belin Doc:高质量的免费AI文档翻译工具,轻松应对多语言挑战
6 Shipper:AI应用构建工具,快速构建MVP、网站、自动化流程等
7 Floww:AI加密货币分析交易代理,分析加密货币市场行情
8 Shotmatic:AI自动化视频创作工具,生成各种类型的视频内容短视频、UGC广告、AI 虚拟人物视频等
9 Chat Memo:告别信息迷雾,高效管理你的 AI 聊天记录
10 Pharmie AI:AI药房管理系统,帮助药剂师处方审核、合规性检查和报告生成
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
程序库 免费影视APP 花式玩客 免费字体下载 产品经理导航 Axure RP 10 免费Axure模板 Axure原型设计 Axure元件库下载 申请友联