智谱技术团队近日宣布,已推出并开放源代码的最新版视频模型——CogVideoX v1.5,迎来了重大升级。这款新型模型在视频生成性能上有了显著提升,能够轻松产出高质量短片。
据悉,CogVideoX v1.5不仅能生成5至10秒长、768P分辨率、每秒16帧的流畅视频,更在I2V模型上支持了多种尺寸比例。这一改进显著提升了图像转视频的质量,同时增强了模型对复杂语义的理解能力。
新版模型还将登陆“清影”平台,并与新发布的CogSound音效模型携手合作。这一组合将为用户带来更加丰富的视听体验,标志着AI视频生成技术迈入了新的阶段。
升级后的“清影”平台展现了多项引人注目的新特性。在质量方面,无论是图像转视频的美学表现,还是运动合理性,乃至对复杂提示词语义的理解,都得到了大幅度的增强。
平台现在还支持生成长达10秒、4K分辨率、60帧的超高清视频,为用户带来了前所未有的视觉盛宴。同时,为了满足不同播放场景的需求,“清影”还提供了可变比例的视频生成功能。
在创作效率方面,“清影”同样表现出色。同一指令或图片现在可以一次性生成4个视频,极大地提升了创作者的工作效率。更为惊艳的是,新平台还能为视频匹配生动的音效,让每一部作品都更加栩栩如生。