最大短板是“灵韵”
1分钟的视频并不长,但对于AI文字生成视频可以算是巨大飞跃。过去一年多,ChatGPT、Midjourney等现象级爆款应用横空出世,AI生成文字、生成图片技术的飞速发展让人兴奋,相比之下,AI生成视频领域虽有Runway、Pika、Meta、谷歌等多个明星公司入局,但因技术难度更大,发展仍处于早期,每次生成的视频只能达到十多秒的时长。而Sora将视频长度拉长到了60秒,这一突破意味着,由其生成的视频信息承载力更强,内容更丰富,达到了很多短视频平台的内容发布要求。Sora在细节处理、语言理解、视频扩展等方面的表现令人耳目一新,这也是它与其他AI生成视频模型能够拉开差距的重要原因。
Sora虽然能力惊人,但水平还不够“封神”。OpenAI称,它可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系的具体实例。此外,该模型还可能混淆提示的空间细节,例如混淆左右,并且可能难以精确描述随着时间推移发生的事件,例如遵循特定的相机轨迹。
短时期内Sora或许存在一定的硬性技术问题,但当这些问题被很好地解决以后,Sora就与艺术家们创作的影视作品完全相同了吗?本雅明在《机械复制时代的艺术作品》一书中提出了“灵韵”的概念,在他看来,灵韵是事物为彰显自身的独特性而散发的一种微妙的气质,艺术一方面宣称自身的独一无二,另一方面又与日常生活和普通事物保持一定的距离感。Sora能对影视场景进行大众化生产,但与“真人创作的影视作品”相比,缺失了独特性和距离感,这就导致了灵韵的消逝。
由此看来,即使技术升级的Sora能创作所谓的长篇影视作品,但这些作品和“真人创作的作品”最大的区别也是最后的区隔就在于灵韵的有无,Sora可以带来绚丽的画面、逼真的场景,可以“整合”经典电影场景,但可能永远无法为我们带来一个演员面对戏剧冲突时真人的“应激”表演。“真人”创造出的艺术作品是具有灵韵的,能让我们无比期待,Sora能做到吗?
(来源:齐鲁晚报) |