10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI产品百科

Phenaki: Google开发的文本生成视频AI模型

9月前 AI产品百科 425 0

Phenaki是Google研究团队开发的一款能够从文本生成视频的AI模型,它可以根据用户输入的一系列文本提示,合成出逼真的视频画面。

这项技术在视频生成领域具有创新性和领先性,因为它能够应对多种挑战,例如高计算成本、可变视频长度、高质量文本视频数据的缺乏等。

Phenaki的主要组成部分有两个:一个是编码器-解码器模型,它可以将视频压缩为离散的嵌入或令牌,同时能够处理不同长度的视频;

另一个是变换器模型,它可以将文本嵌入转换为视频令牌,然后再解码为实际的视频。

Phenaki还利用了大量的图像-文本对数据和少量的视频-文本对数据进行联合训练,从而实现了对视频数据集之外的内容的泛化。

Phenaki目前已经能够根据开放域的时间可变文本或故事生成任意长度的视频,并且在空间-时间质量和每个视频的令牌数量上都优于目前文献中使用的逐帧基线。

特色功能

  • 从时间可变文本生成视频:Phenaki可以根据用户输入的一系列文本提示,按照时间顺序生成对应的视频画面。这些文本提示可以是任意主题、风格和情节的,只要它们能够描述出清晰和连贯的场景。
  • 生成逼真和多样化的视频:Phenaki可以生成高分辨率、高帧率、高动态范围和高色彩准确度的视频,同时保持画面的清晰度、稳定性和连续性。Phenaki还可以生成多样化和富有创意的视频,例如将现实中不存在或难以实现的场景呈现出来,或者将不同风格和元素进行混合和变换。
  • 支持交互式和迭代式生成:Phenaki支持用户与模型进行交互式和迭代式生成,即用户可以在任何时候修改、添加或删除文本提示,然后观察模型如何调整视频输出。这样用户就可以根据自己的喜好和需求进行创作和编辑,实现更高程度的个性化和定制化。

产品价格

目前,Phenaki还没有正式发布为商业产品,因此还没有公布具体的价格信息。不过,根据Google研究团队在其网站上发布的信息,Phenaki目前已经开放了部分示例视频供用户在线观看,并且计划在未来提供更多的视频样本和交互式演示。

此外,Google研究团队还表示,他们正在探索将Phenaki应用于不同的领域和场景,例如教育、娱乐、广告、游戏等,以及与其他的视频处理技术进行结合,例如超分辨率、风格迁移、视频编辑等。

官网地址:https://phenaki.video/

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Phenaki: Google开发的文本生成视频AI模型
#Phenaki #文本生成视频 #AI视频 
收藏 1
Artflow.ai: 基于人工智能的AI虚拟人视频生成平台
手把手教你开通 ChatGPT & Claude,无需信用卡,5 分钟搞定(100% 合规)
推荐阅读
  • ttsmaker马克配音: 免费在线TTS文本转语音AI配音工具
  • PDFMathTranslate:沉浸式翻译神器开源AI论文PDF翻译,让论文翻译变得如此简单
  • Ventrilo:AI智能写作助手,了解您的上下文并帮助您更有效地写作
  • DevChat:开源的支持多款大模型的AI编程助手,专为开发者打造的开源IDE插件
  • 匡优Excel:AI数据分析工具,AI帮你完成Excel数据处理、数据分析
评论 (0)
请登录后发表评论
分类精选
Picarta:可以查找图片拍摄地点的AI识图软件,使用AI搜索照片拍摄的精确位置
8494 5月前
Noiz AI:AI语音克隆工具,一款TTS和视频配音神器
7412 4月前
Unscreen:在线视频和GIF背景抠除工具,不用绿幕轻松完成视频抠像
7285 11月前
Reecho 睿声:免费AI语音克隆与超拟真语音合成平台,用户只需提供一小段声音样本,完成声音的克隆
6674 9月前
抖音即创AI: 一站式智能AI创作管理平台
6012 8月前
嘎嘎降AI:AIGCleaner论文降重工具网站,专门降低文章AI率、查重率的工具
5146 4月前
拍我AI:PixVerse国内版,重新定义AI视频创作的全民神器
4843 1月前
BeArt:一款免费且无水印的的在线AI换脸网站,适用于照片、视频和GIF中实现精准换脸
4293 6月前
BibiGPT:音视频内容一键总结工具
4134 8月前
Coze: 字节跳动推出的AI聊天机器人和智能体创建平台
4116 8月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Trickle:占据ProductHunt榜一的Vibe Coding 产品到底是什么来路!
2 Class Central:解锁超25万门优质在线课程,全球最大的MOOC在线课程搜索引擎和聚合平台
3 Raphael AI 2.0:这款AI画图工具免费做出商用级图像和编辑效果
4 LinkMind:AI内容助手一键搞定爆款素材,海外内容创作神器
5 Zread.ai:AI读码新体验,不仅读懂项目,还读懂背后的人和故事
6 WeaveFox:支付宝悄悄放出大招!1比1的还原效果图,生产级的代码质量
7 Google Stitch:告别繁琐设计流程,2分钟从想法变成Figma设计稿
8 Seko:从一句话到完整短片,一款AI短片创作智能体创编一体多模态短片创作Agent
9 MirageLSD:AI视频革命,40毫秒延迟,这真的是“直播界的Sora”吗?
10 Quoai:AI智能报价计算器,一键生成详细报价、优化项目成本和团队配置
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
程序库 免费影视APP 花式玩客 免费字体下载 产品经理导航 Axure RP 10 免费Axure模板 Axure原型设计 Axure元件库下载 申请友联