Phenaki 是一款人工智能工具,可以根据文本提示生成逼真的视频。 它使用新的因果模型来学习视频表示并将其压缩为可变长度视频的离散标记。 该工具可以根据开放域、时变提示生成视频,并且性能优于每帧基线。 它还可以处理少量的视频文本示例和更大的图像文本语料库。 这是第一次在论文中研究这种类型的视频生成。
AI智能翻译AI学习框架AI元宇宙AI商品图AI图像AI自动转录AI企业服务AI视频翻译AI机器人AI网站建站