Sora技术革新:纯文字驱动下的视频生成技术,挑战传统CG水平


2月18日消息,近期,网络安全领域的知名人物周鸿祎针对最新的Sora视频模型技术表达了深度认可,他指出Sora生成的视频效果堪比传统CG,推翻了现有的3D建模及渲染依赖模式,这一创新无疑为视频AI生成领域带来了新的革命。

据周鸿祎介绍,Sora产出的视频片段给他留下了深刻的印象。其中最让人惊叹的一段是金毛犬在雪地中欢快打滚的场景。在这个画面中,可以清楚观察到狗狗的细腻动作和雪地的真切纹理,细至每粒雪花的飘动,都如实展现了非凡的真实感。周鸿祎评价说,这样的效果使用其他视频AI生成工具如Pika和Runway是难以实现的,因为这两者仅仅基于图像操作生成较为简单的计算机动画。

周鸿祎进一步分析认为,Sora所展现的优势不仅在于高密度的细节表现,其背后的技术突破可能源自三个方面。首先,Sora在模拟人类观察、描绘和表现世界的方式时做了出色的学习。正如人类艺术家笔下的场景,我们的大脑不需要3D建模便可以想象世界,并有效控制我们的创作。其次,Sora在学习过程中不仅吸收了大量视频和电影内容,还理解了其中蕴含的物理规律。基于OpenAI的recaptioning技术,Sora能够用文字描述每一帧画面,这同样模仿了人类如何理解和认知世界的方法。最后,周鸿祎认为OpenAI在3D内容方面也做了大量的努力,可能通过现代游戏引擎渲染了实时的3D模型,并训练Sora理解更深层的物理知识。

那么,Sora是如何实现这一技术的呢?它不依赖传统的3D建模和渲染流程,而是通过给出一些文本提示,依照这些指令生成逼真的画面。如果Sora也使用常见的3D建模技术,则无法显现其颠覆性质。Sora能够用纯文字输入,就把视频内容生成出来,其便捷性和创新性大大超越了现有技术。

周鸿祎提到,Sora作为纪录文生视频AIGC的工具,体现了AI对世界深层次的理解。此项技术不仅仅是图像的再现,更是从文字出发到图像的转化,再到理解并展现这个世界3D模型的深层过程。对于视频生成和编辑行业来说,Sora的出现无疑将成为一场颠覆,其动态生成的视频效果和对物理世界的深刻描绘引领了AI技术的全新方向。这不仅是对技术的挑战,更是对人类创造力的一种新启示。随着AI技术的不断进步,未来,我们或许可期待更多像Sora这样的突破平台,为人类的创意和沟通开辟全新的可能。

相关新闻