首段:Sara的震撼发布
世界模拟器Sara真的会颠覆人类文明吗?2024年2月15日,美国人工智能公司OpenAI突然就给了全世界一个网站,他们的文本转视频模型Sara终于宣布研发成功了。毫不夸张的说,Sara是AI领域发展的又一里程碑,其震撼程度完全不亚于2022年ChatGPT的横空出世。当皮卡和runway等AI视频工具都还在试图突破几秒内的连贯出事,当OpenAI开发出的Sara已经对其他模型造成了降维打击(注:原文“降维大计”保留),它不仅能生成长达一分钟的视频,而且可以保证整体的画面的程度。
技术突破:从工具到物理模拟器

Sara的独特之处就在于其融合了扩散模型和转换器架构,拥有着前所未有的视视频。程程程程说简单一点,如今的Sara已经能根据现实世界的物理规律进行推理以及一系列的自动拓展,随着时间的推移,能够预测场景的后续会发生什么,场景中的物体会怎样运动,出现怎样的轨迹,甚至于形状如何变化等等。
要知道,在这之前的视频生成工具,大多数的画质都比较一般,与用户的需求相差甚远,生成的视频时间也特别短。但如今只要能学会Sara,哪怕你是一名普通人,哪怕你根本不懂视频技术,但只要具备丰富的想象力,能将画面准确的描述出来,你甚至可以独立创作出一部高质量的电影。
实力展示与文明影响展望
没错,如今的Sara已经超出了工具的范畴,更像是一个物理世界模拟器,它以强大的创造力和想象力为我们展现出了一个充满无限可能的虚拟世界。接下来就让我们用一组提示词来看看Sara的实力究竟有多强。一位时尚的女性走在东京街头,街道上充满了温暖的霓虹灯和动态的城市标识。她穿着一件黑色皮夹克,一条长长的红色连衣裙,黑色靴子,手提着一个黑色的皮包,她戴着墨镜,涂着红色的唇膏,她步履自信,轻松自在的走着。街道是湿润的、反光的,创造出五彩缤纷的灯光镜面效果,很多行人都在街上走来走去。这段视频便是OpenAI在官网介绍视频模型Sara时所出现的第一组提示字。画面中的背景细节以及角色和动作的匹配几乎可以称得上完美。这段长达一分钟的视频,如果我不告诉你的话,你敢相信这是AI生成的吗?
此外,Sara在采样的灵活性、视频拓展和镜头语言等方面也远远领先于其他模型。但由于担心Sara可能被滥用,目前OpenAI还未向大众开放,只是给予小部分研究人员有限的访问权限,以便理解模型的潜在危害。不过OpenAI也并非完美,他们自己也发现了一些缺点,比如模型仍存在许多局限性,无法精确模拟基本相互作用的物理特性。但是这些缺点又如何呢?从人类文明出现以来,我们克服了一个又一个曾经认为难以逾越的鸿沟。从牛顿到爱因斯坦,从万有引力到相对论,从经典力学再到量子物理,经过几百年的不断发展,工业革命早已改变了一切,我们也终于成为了地球的主人。而如今AI的爆发式增长又将是人类文明的一大转折点,它势必会重新改变世界进程,甚至有机会完成文明的跨越。
未经允许不得转载:加法网 » AI文本转视频模型Sara:会颠覆人类文明吗?

微信关注,获取更多














