字节新突破!X-Portrait 2模型亮相:一图生成“电影级”视频,表情神态全还原

   发布时间:2024-11-06 21:29 作者:钟景轩

字节跳动推出新一代单图视频驱动技术——X-Portrait 2,该技术仅需一张静态图片和一段驱动视频,便能生成高品质、“电影级”的视频内容。

X-Portrait 2技术的亮点在于,它不仅完美保留了原图的身份特征(ID),同时能够精准捕捉并迁移各种细致入微乃至夸张的表情和情绪。这一创新极大地简化了动作捕捉、角色动画以及内容创作的流程。

与以往依赖人脸关键点检测的技术不同,X-Portrait 2通过构建一个先进的表情编码器模型,并采用端到端的自监督训练框架,从海量的人像视频中自我学习,提取出与身份无关的运动隐式表征。

该技术进一步融合了强大的生成式扩散模型,从而能够生成出流畅且极具表现力的视频。在经过大规模高质量表情视频的训练后,X-Portrait 2在运动表现力和身份保持性上均显著超越了之前的技术。

业界专家表示,X-Portrait 2的推出将极大地推动视频创作领域的进步,为创作者们提供更为便捷高效的工具,同时也将为用户带来更加丰富多样的视觉体验。

感兴趣的用户和开发者可以通过访问项目地址:https://byteaigc.github.io/X-Portrait2/,了解更多关于X-Portrait 2的详细信息,并体验其强大的功能。

 
 
更多>同类内容
全站最新
热门内容
本栏最新