李飞飞团队研制出突破性空间智能模型，一张图即可生成交互式 3D 场景

讯知在线 • 2024年12月3日下午7:30 • 生活 • 0 views

突破性空间智能模型诞生：一张图生成交互式 3D 场景

人工智能领域先驱李飞飞带领的团队打造了一个突破性的空间智能模型，突破了人工智能技术与虚拟世界的界限，赋予 AI 想象创造 3D 场景的能力。

单图生成 3D 奇观

这项新技术通过单个静态图像即可生成可交互的 3D 场景。这些场景既逼真又可修改，打破了传统 AI 工具仅能将照片转换为 3D 模型和场景的局限性。World Labs，李飞飞团队创立的公司，声称他们的技术具有独创性，因为它产生的场景具有交互性和可修改性。

World Labs 在一篇博客文章中写道：“（我们的技术）让你可以走进任何图像，并以 3D 形式探索它。”

实时可交互和可修改

这些由 AI 生成的场景通过浏览器实时渲染，使用户能够使用箭头键或键盘 (WASD) 键移动，并通过单击和拖动鼠标实现交互。用户可以自由探索场景，调整摄像机位置和视野，更改对象颜色，创建聚光灯特效，甚至创建自动运行的动态效果。

空间智能的崛起

World Labs 的系统属于“世界模型”这一新兴人工智能类别，可以模拟游戏和 3D 环境。现有的许多模型存在伪影和一致性问题。World Labs 提出，预测 3D 场景比预测像素具有诸多优势，例如持久性，一旦生成场景，即使视线移开，它将继续存在。此外，用户可以实时控制和移动场景，细致观察花朵的细节或偷看角落里露出的物体。

改变内容创作格局

World Labs 表示：“大多数生成式 AI 工具生成的都是图像或视频等二维内容，而生成三维内容能够提升操控性和一致性。这将改变我们制作电影、游戏、模拟器以及物理世界其他数字呈现形式的方式。”

应用前景广阔

这项技术在各种领域拥有广阔的应用前景，从电影和游戏制作到建筑设计和虚拟现实体验。内容创作者已将这项技术融入他们的工作流程，例如，将角色布置和精确镜头调度变得更加容易。

重大投资和期待

World Labs 已从包括人工智能巨头 Geoffrey Hinton、Jeff Dean 和谷歌前首席执行官 Eric Schmidt 在内的投资者那里筹集了 2.3 亿美元的投资。该公司现估值超过 10 亿美元，计划在 2025 年推出其首款正式产品。

超越元宇宙？

尽管 World Labs 的愿景与昙花一现的元宇宙概念有一些相似之处，但其创始人认为，世界模型可以通过提供真正的互动内容来填补这一空白。

World Labs 的突破性空间智能模型标志着人工智能技术的一个重要里程碑，它将进一步推动人工智能的创新，并为虚拟世界和数字内容创作开辟新的可能性。

原创文章，作者：讯知在线，如若转载，请注明出处：http://mip.xzxci.cn/2024/12/03/27375.shtml