OpenAI视频生成模型Sora测试现“翻车” 复杂场景挑战仍待解决

   发布时间:2024-03-01 13:43

【沃资讯】3月1日消息,近日彭博社对OpenAI的视频生成模型Sora进行了一次测试,结果却出现了一些不如人意的情况。

据报道,彭博社给OpenAI提供了一系列提示词,要求其使用Sora模型生成相应的视频场景。然而,在生成的视频中,却出现了多处不符合现实场景的动作和物体变形等问题。例如,在一段仅有10秒的视频中,一只鹦鹉在飞过猴子时翅膀会扭曲,而且视频中出现了多只鹦鹉,与提示语中的“一只鹦鹉”不符。此外,猴子的臀部似乎还出现了一条鹦鹉的尾巴,让整个场景显得非常诡异。

针对这些问题,OpenAI研究科学家Bill Peebles也承认了Sora模型在生成视频时存在一些奇怪的动作和物体相互穿过等问题。这些问题反映了Sora模型在理解和呈现物体的物理特性方面还存在一定的不足。

据沃资讯了解,Sora模型是一款文本转视频模型,采用了Diffusion transformer技术。它将视频内容分解成一系列patch(视觉编码块),并通过去噪技术从带有噪声的patch中预测出清晰的原始图像信息,最终合成为连贯的视频。虽然Sora模型在某些方面表现出色,但在复杂场景下仍会出现一些问题,如物理交互的准确性、对象状态变化的一致性等方面还有待提高。

此次测试的结果表明,Sora模型虽然在视频生成方面取得了一定的进展,但仍面临着一系列技术挑战和局限性。OpenAI表示,他们将继续努力改进Sora模型,提高其生成视频的质量和准确性。对于推新飞快的OpenAI来说,解决这些问题应该不会太久。

 
 
更多>同类内容
全站最新
热门内容
本栏最新