如同最近一年 DALL-E 2、Stable Diffusion 等文本生成图像模型发展一样,用文本来生成视频的 AI 工具也正变得越来越多。
继 Meta 的 Make-A-Video 之后,谷歌也接连发布了两款视频模型 Imagen Video 和 Phenaki。两者分别强调视频的质量和长度等不同功能。
日前,在人工智能活动上,首次发布了由 Imagen Video 和 Phenaki 一同生成的视频。该视频结合了 Phenaki 生成长视频能力和 Imagen 的高分辨率细节。
(来源:谷歌)
“我认为使用一系列提示,创造这样的超分辨率长视频令人难以置信,这是一种讲故事的新方式,”谷歌研究中心首席科学家兼谷歌大脑团队研究总监道格拉斯·埃克()在活动中分享说,“很期待电影人或视频故事讲述者如何利用我们的技术。”
在官方博客中表示,Imagen Video 和 Phenaki 的结合是一项重要突破,它正在努力打造领先行业、能生成高质量影响的工具。AI 驱动的生成模型有着无限的创造力,可帮助人们借助视频、图像工具,以他们之前无法做到的方式充分表达自身想法。
再分别简单介绍下 Imagen Video 和 Phenaki。
据了解,Imagen Video 基于级联视频扩散模型来生成高清视频。如输入文本提示后,基本视频扩散模型和多个时间超分辨率(Temporal Super-Resolution,TSR)及空间超分辨率(Spatial Super-Resolution,SSR)模型,分别以 40×24 像素和 3 帧/秒速度生成 16 帧视频、以 1280×768 像素和 24 帧/秒的速度采样,最终得到 5.3 秒的高质量视频。
关键词: 谷歌两款视频模型 两款视频模型 视频模型 人工智能活动视频模型 人工智能活动
凡注有"环球传媒网"或电头为"环球传媒网"的稿件,均为环球传媒网独家版权所有,未经许可不得转载或镜像;授权转载必须注明来源为"环球传媒网",并保留"环球传媒网"的电头。
- 2022腾讯科学WE大会十周年如期举行 希望助力基础科学普及
- 部分用户反馈Face ID出现问题 iOS 16又出新Bug?
- Intel处理器“内购”功能定名Intel On Demand 氪金解锁更多性能
- 疑似Navi 31大核心的RDNA3架构GPU"玉照"抢先曝光
- 老外不想看到它?三星Exynos 2300至今未露面
- 摩尔线程国产MTT S80游戏卡开卖:16GB GDDR6显存
- 正帆科技688596:截至9月底在手订单为31亿元 同比增长63.7%
- NVIDIA的GTX 1060占比达到7.62% 份额回升到了近几个月的最高点
- 中国联通、腾讯设立混改新公司 双方均未评论
- 小米索尼联合研发索尼IMX989 共同推动移动影像的进步
资讯
焦点
- 首次超过美国 全球最佳大学排行榜:338所中国大学上榜
- Meta市值缩水至2017年水平 扎克伯格身价排名跌出全球前十
- “双11”成立自营物流公司 菜鸟回应:消息不实
- 瑞信(CS.US)CEO发表备忘录 试图让市场相信其财务稳定性
- 财务大臣重申捍卫日元立场 日本央行9月政策会议摘要提及政策转向
- 英国迎来黄金抢购潮 新政府“迷你预算”刮起恐慌风暴
- 高盛:美国家庭和外国投资者将分别净抛售1000亿美元股票
- 违约概率飙升至至少10年来最高水平 百年银行巨头瑞信被传“爆雷”!
- 美联储在加息速度问题上已现分歧 市场Q4能否扭转颓势?
- 进一步加码全球黄油市场 威士兰乳业收购新西兰乳企Canary Foods