今天,World Labs 正式向所有人开放 Marble,这是一款首创的生成式多模态世界模型。
同时,Marble 的功能也大幅扩展,其中包括:
多模态 Marble:能够利用文本、图像、视频或粗略的 3D 布局创建 3D 世界;Marble 还允许用户交互式地编辑、扩展和组合这些世界。生成的 3D 世界可以导出为高斯斑点、网格或视频。
Marble Labs:艺术家、工程师和设计师们将展示创意、真实的工作流程以及游戏、视觉特效、设计、机器人等领域的全新可能性。Marble Labs 还提供深入的案例研究、教程和文档,为所有人提供学习、构建和分享他们自己的 3D 世界所需的工具。
Marble 世界模型
研究人员表示,世界模型应具有高度多模态性,能够将任何可用的输入信号提升到一个完整的三维世界中,并且能够随着新信息的出现而迭代更新其对世界的理解。
Marble 可以让用户根据简单的图像或文本提示快速创建完整的 3D 世界,也可以交互式地编辑 2D 和 3D 世界,将脑海中的世界构想变为现实。
Marble 可以根据单张图片或简短的文字提示创建完整的 3D 世界,生成各种场景类型和艺术风格的世界。图像提示功能也让 Marble 与其他 AI 工具的结合变得轻松便捷。
想要轻松创建更具创意控制力的世界,多图像提示是一种简单有效的方法。与文字或单图提示不同,在文字或单图提示中,Marble 必须自行想象提示中未提及的世界部分,而使用多图提示,您可以控制生成的世界从不同角度呈现的样貌。
Marble 还内置了 AI 原生世界编辑工具。编辑可以很小很局部:移除一个物体,修饰一个区域。也可以很彻底:交换物体,改变视觉风格,或者重构世界的大片区域。
AI 工具 Chisel
World Labs 还推出了 Chisel ,这是一款 AI 原生工具,可以直接在 3D 中雕刻大理石世界。
Chisel 是一种面向高级用户的全新实验性编辑模式,用于创建 3D 世界。用户可以使用粗略的 3D 形状来布局 3D 世界的粗略结构,或者将现有的 3D 资源导入到场景中。
后续还可以添加文本提示来描述场景的视觉风格,或者添加粗略布局中未包含的其他元素。
Chisel 将结构与风格分离。粗略的 3D 场景决定了世界的结构,而文本提示则控制了其整体风格。两者可以任意组合,为世界生成增添了全新的控制维度。
构建广阔世界
世界生成后,Marble 允许一步式扩展,使其更大。用户可以选择要扩展的世界区域,Marble 将创建更多内容来填充所选区域。
原本破碎成碎片的世界区域,在扩展后会变得清晰完整。扩展还可以用来为世界的特定区域添加细节。
使用 Marble 创建世界后,还可以选择多种方式将其导出。
高斯粒子是模拟大理石世界最高精度的渲染方式。用户可以使用 World Labs 与 THREE.js 集成的开源跨平台渲染器 Spark,在浏览器中渲染高斯粒子。
Marble 世界也可以导出为两种三角形网格:碰撞器网格和高质量网格。将世界导出为网格后,它们可以与许多行业标准工具兼容。
Marble 还可以增强导出的视频,增加细节、去除瑕疵,并为场景添加动态元素,同时保持像素级精准的相机控制,并符合生成的 3D 世界的结构。
World Labs 的相关人员表示,Marble 只是迈向空间智能征程中的一步。展望未来,交互性将是一个关键机遇。未来的世界模型将使人类和智能体能够以全新的方式与生成的世界进行互动,从而在模拟、机器人等领域解锁更多应用场景。
参考资料:
https://www.worldlabs.ai/blog/marble-world-model