谷歌公司近期揭晓了其视频生成技术的最新力作——Veo 2模型,这一创新成果在模拟现实世界的物理现象、人类动作及面部表情的细腻度上实现了质的飞跃,视频的整体观感有了显著提升。
Veo 2模型具备强大的视频生成能力,它能够创造出4K分辨率(4096 x 2160像素)且时长可达2分钟的视频内容。与OpenAI的Sora模型相比,Veo 2在分辨率上提升了整整4倍,时长更是达到了前者的6倍之多。然而,值得注意的是,在谷歌的实验性工具VideoFX中,Veo 2的使用受到了一定限制,分辨率上限为720p,时长也被限制在8秒以内。
Veo 2不仅能够根据文本提示生成视频,还能结合文本与参考图像,更逼真地模拟运动轨迹、流体动力学效应以及光线变化,为视频创作者打开了前所未有的创意空间。为了应对潜在的滥用问题,谷歌引入了名为SynthID的专有水印技术,该技术能在Veo 2生成的每一帧视频中嵌入难以察觉的标记,以便有效识别出由AI生成的内容。
据DeepMind产品副总裁Eli Collins透露,团队正积极收集用户反馈,并计划在未来数月内对Veo 2模型进行持续的优化与迭代。目前,Veo 2模型尚处于测试阶段,仅向部分用户开放。在此期间,用户仍可在Vertex AI平台上继续使用原始的Veo模型。谷歌方面表示,尽管Veo 2在减少错误方面已取得显著进步,但仍需进一步完善以达到最佳效果。