】 【打 印】 
【 第1页 第2页 】 
OpenAI新工具 文字可转60秒视频
http://www.CRNTT.com   2024-02-17 11:00:36


  中评社北京2月17日电/据大公报报导,综合法新社、《华尔街日报》、《麻省理工科技评论》报导:继推出热门聊天机器人ChatGPT之后,人工智能(AI)公司OpenAI在15日又有大动作,宣布推出全新的视频AI生成工具“Sora”。该工具能够根据文字输入,生成最长60秒的高品质视频,极具“爆款”潜质。Sora目前仍存在许多缺陷,包括无法处理比较复杂的题材,发生“左右不分”等等。由于生成视频的能力太过强大,该工具目前仍在测试阶段,在OpenAI完成风险评估前,暂时不会对公众开放。

  “在夜晚的城市中,霓虹灯光将街道点亮,身着皮衣的女子从行人中走出,墨镜上反射出街道上的斑马线”……乍一看,这段长达59秒的视频似乎是真实拍摄的,然而它其实是由OpenAI全新AI视频生成工具Sora凭藉寥寥数行输入的文字,一键输入、凭空生成的视频。

  美国当地时间15日下午,OpenAI正式宣布推出视频生成工具Sora,并发布了一系列该工具生成的演示视频。这些视频五花八门,题材包括猛犸象踏过雪原,淘金热时期的美国小镇、男子坐在白云上读书等等,画面生动逼真,令人瞠目结舌。

  “人人都可当导演”

  AI视频工具已成为业界的热门话题。Sora十分易用,用户只需输入文字描述自己想要的视频,AI就能输出一段最长60秒、细节丰富的影片,毋须拥有任何视频拍摄的设备与制作经验,相比于传统的视频制作,AI效率更高、成本更低,大幅降低视频门槛,几可实现“人人都可以当导演”。

  Sora使用的技术,与OpenAI旗下的图像生成AI工具DALL-E相似,使用“扩散模型”来训练AI将随机像素转变成视频。但是训练AI处理视频与以往的处理文字不同,因为视频并非由文字组成。研究人员要想办法,将视频切成像文字单词一样的“块”。最终,他们将视频按帧数划分,在空间和时间上也切割成“块”。如此一来,Sora内部的神经网络就能像处理语言文本一样,能够处理视频“块”。
 


【 第1页 第2页 】 


扫描二维码访问中评网移动版 】 【打 印扫描二维码访问中评社微信  

 相关新闻: