现在,通过文本提示和一个 2D 边界框,我们就能在 3D 场景中生成对象。
机器之心 · 2024-01-24 14:31:00
AI 理解视频不能依靠在像素空间中预测。
机器之心 · 2024-01-24 11:11:00
人类有两只眼睛来估计视觉环境的深度信息,但机器人和 VR 头社等设备却往往没有这样的「配置」
机器之心 · 2024-01-24 11:07:00
性能与 Mamba 一样,但所需训练步骤数却少 2.2 倍。
机器之心 · 2024-01-24 11:00:00
给 VR 系统加了新维度。
机器之心 · 2024-01-24 10:56:00