谷歌DeepMind推Genie 2,图像变3D可玩游戏世界,马斯克回应“酷”!

   发布时间:2024-12-05 17:43 作者:杨凌霄

近期,谷歌DeepMind团队公布了一项名为Genie 2的前沿技术,这是一项基础世界模型,能够从图像或文字描述中生成可供人类或AI智能体互动的3D环境。

据悉,用户只需提供一张由Imagen 3生成的图片及相应的文字说明,Genie 2便能迅速构建出一个可探索的3D世界。用户通过鼠标和键盘,可以在这个虚拟环境中自由行走,体验时长可达一分钟之久。

Genie 2不仅在生成环境的一致性上表现出色,还能在用户移动时精准呈现视野变化中的细节,确保体验的真实感。

谷歌进一步透露,Genie 2在生成过程中能够模拟物体的交互行为、动画效果、光照条件、物理反射以及NPC(非玩家角色)的行动。许多生成的场景在画质上接近3A级游戏水平,并且在物体视角一致性和场景记忆方面展现出了卓越的能力。

这一技术突破引起了广泛关注,有人惊叹于科技进步的速度,认为它预示着视频游戏的未来发展方向。甚至有人设想,随着技术的不断进步,一个完全虚拟化的世界模型将成为可能。

值得注意的是,在Genie 2发布后,DeepMind的CEO向特斯拉创始人马斯克发出了共同制作AI游戏的邀请。马斯克对此回应称:“Cool。”

谷歌研究人员Jack Parker-Holder通过实例展示了Genie 2的灵活性。他提到,当向模型输入不同的语言指令时,比如一张包含红门和蓝门的图片,可以生成通往不同方向的3D场景。用户可以选择走向红门或蓝门,探索不同的虚拟世界。

在更加复杂的场景中,比如包含三门的选择,Genie 2依然能够准确理解指令并生成研究人员期望的3D动画效果,展现了其强大的理解和生成能力。

 
 
更多>同类内容
全站最新
热门内容
本栏最新