当前位置: 首页 > news >正文

山东省住房和城乡建设厅网站响应式网站建设软文

山东省住房和城乡建设厅网站,响应式网站建设软文,网站优化平台,美丽寮步网站建设哪家好文章目录 摘要一、引言二、主要方法2.1 3D-aware Memory Bank2.2 三维分割的渲染与下游应用 三、实验消融实验应用: Scene Manipulation 地址#xff1a;https://www.gaga.gallery 标题#xff1a;Gaga: Group Any Gaussians via 3D-aware Memory Bank 来源#xff1a;加利福… 文章目录 摘要一、引言二、主要方法2.1 3D-aware Memory Bank2.2 三维分割的渲染与下游应用 三、实验消融实验应用: Scene Manipulation 地址https://www.gaga.gallery 标题Gaga: Group Any Gaussians via 3D-aware Memory Bank 来源加利福尼亚大学NvidiaGoogle 摘要 Gaga一个通过利用zero shot分割模型预测的不一致的2D mask来重建和分割开放世界的3D场景的框架。与之前严重依赖于视频物体跟踪的3D场景分割方法相比Gaga利用了空间信息并有效地关联了不同相机pose中的物体mask 。通过消除训练图像中连续视图变化的假设Gaga展示了对相机姿态变化的鲁棒性特别有利于稀疏采样的图像确保了精确的mask标签的一致性。此外Gaga适应了来自不同来源的二维分割mask并在不同的开放世界zero shot分割模型中表现出了稳健的性能增强了其通用性。 一、引言 有效的开放世界三维分割对场景的理解和操作至关重要。尽管2D分割技术有了显著的进步例如SAM和EntitySeg 将这些方法扩展到3D领域但遇到了确保多视图图像之间一致的mask标签分配的挑战。具体来说不同视图的mask可能有不同的mask id因为多视图图像是由二维分割模型单独处理的。简单地将这些不一致的二维掩模提升到3D中会导致模糊性导致三维场景分割效果较差。因此我们认为在将每个掩模提升到3D之前为每个掩模分配一个多视图一致的通用掩模ID是至关重要的。我们将此任务称为掩码关联。 先前的研究工作[9,26]建立在三维重建的高斯溅射[3DGS]试图通过将多视图图像数据集视为视频序列采用现成的视频对象跟踪方法[6]来解决这一任务。然而这种设计依赖于多视图图像之间的视图变化最小的假设这种情况在现实世界的3D场景中可能并不一致地存在。因此这些方法会与类似的物体或被遮挡的物体作斗争这些物体会不时地消失和重新出现如图2所示。 因此我们分析了三维mask关联和视频对象跟踪任务之间的基本差异对固有的三维信息的利用。具体来说不同视图的同一对象的mask应对应于同一组三维高斯。因此如果两组分散的三维高斯分布之间有很大的重叠我们可以从具有相同通用mask ID的不同视图分配两个mask。 基于这种直觉我们提出了Gaga一个框架将任何3D高斯进行分组并在不同视图中呈现一致的3D分割。给定一组假设的RGB图像我们首先使用高斯溅射法重建一个三维场景并使用开放世界分割方法提取二维掩模。随后我们迭代地构建一个三维感知存储库它收集和存储按类别分组的高斯数据。具体来说对于每个输入视图我们使用相机参数将每个二维掩模投影到三维空间中并在内存库中搜索与失投影掩模重叠最大的类别。根据重叠的程度我们要么将掩码分配给一个现有的类别要么创建一个新的类别。最后按照上述掩模关联过程我们利用一致的二维掩模学习每个高斯分布的特征进行渲染分割。 我们的方法Gaga能够1)合成新的RGB视图图像分割具有固有的三维一致性2)基于二维分割掩模对三维高斯分布进行分组为场景操作提供精确的三维实例分割3)适应任何二维分割方法不需要额外的掩模预处理。我们的贡献总结如下 我们提出了一个框架使用由开放世界分割模型生成的不一致的二维掩模来重建和分割三维场景。为了解决二维掩模跨视图的不一致性我们设计了一个3守护软件存储库收集相同语义组的高斯数据。然后使用这个内存库跨不同的视图对齐2D掩模。研究结果表明该方法可以有效地利用任何二维分割掩模使其易于适用于合成新的视图图像和分割mask。我们在不同的数据集和具有挑战性的场景上进行了全面的实验包括稀疏输入视图以定性和定量地证明所提方法的有效性 二、主要方法 高斯的图像像素渲染公式 身份编码。每个高斯分配一个16维特征通过分类器 L L L 解码为一个逐像素的分割mask ID m x , y m_{x,y} mx,y​的每个像素xy 产生的mask IDs 由 2D 分割masks监督。 2.1 3D-aware Memory Bank 给定带pose图像目标是重建一个具有语义标签的三维场景进行分割渲染。为此首先利用高斯溅射法进行场景重建。然后使用一种开放世界的二维分割方法如SAM [14]或EntitySeg [21]来预测每个输入图像的类未知分割。然而由于分割模型独立地处理每个输入图像所得到的掩模自然不是多视图一致的。为了解决这个问题[9,26]假设附近的输入视图是相似的并应用一个视频对象跟踪器来关联不同视图的不一致的2D掩模。然而这个假设可能并不适用于所有的3D场景特别是当输入视图是稀疏的时。 Gaga的灵感来自于跨多个视图的面具关联任务和视频中的跟踪对象之间的根本差异3D信息的整合。为了在不同的视图中可靠地生成一致的mask我们提出了一种利用三维信息的方法而不依赖于对输入图像的任何假设在不同视图中属于同一实例的mask将对应于三维空间中的同一高斯群。因此这些高斯分布应该被分组在一起并分配一个相同的 group ID。 我们首先将每个二维分割mask与其相应的三维高斯分布关联起来。具体地说给定每个输入图像的pose将所有三维高斯splat到相机帧上。随后对于图像中的每个mask识别出哪些三维高斯被投影在该mask中。这些高斯模型应该被识别为3D mask的表示并作为关联不同视角的mask的指导。 值得注意的是mask通常描述了在当前相机pose下的前景物体的形状。然而如图4 (a)所示很大一部分高斯对二维分割mask的像素没有贡献因为它们代表了位于后面的对象。为了解决这个问题我们选择最接近相机帧的三维高斯的前x%作为mask对应的高斯。x是一个超参数根据场景的性质进行调整。如图4 (b)行1所示基于整个mask选择对应的高斯不能准确地表示大的mask的形状且不能将不同像机pose的mask关联起来。为了解决这个问题我们提出了一种策略将图像划分为32个×32个patch将每个patch内最接近像机帧的三维高斯的前x%的集合识别为mask m m m的对应高斯记为G (m)。如图4 (b)行2所示这种简单的策略有效地提高了不同视图间关联掩模的一致性。 3D-aware Memory Bank用于收集并分组三维高斯用来关联不同视图中的mask给定一组图像先将第一张图像中每个mask的相应高斯分储到一个group中并使用一个group ID来初始化3d感知记忆库。对于后续图像的二维mask首先找到对应的高斯然后将其分配给内存库中的已有group如果它们与内存库中的现有group没有相似之处则建立一个新的group。 通过高斯重叠来分配Group ID。这里我们通过共享高斯的百分比来定义两组3DGS的相似性。具体来说给定二维mask m m md 对应的3DGS记为 G ( m ) G(m) G(m) 和Memory Bank中的group i i i记为G_i的3DGS计算共享高斯(利用索引) G ( m ) ∩ G i G(m)∩G_i G(m)∩Gi​的重叠的比例 如果group i i i在Memory Bank的所有组中与mask m m m 的重叠最高且大于阈值则 2.2 三维分割的渲染与下游应用 在分配group ID之后由同一组3DGS投影的mask应该在不同的视图中具有相同的ID。与Gaussian grouping]类似使用这些mask作为伪标签并通过训练身份编码将它们提升到3D。由于已经预训练过3DGS所以只修复其他属性例如位置、不透明度等 三、实验 数据集。使用了一个场景理解数据集LERF-Mask [26]以及两个室内场景数据集Replica[23]和ScanNet [8]。LERF-Mask是基于LERF数据集[12]并由[26]的作者用任务和地面真相进行了注释。它包含了3个场景figurines, ramen,和 teatime。对于每个场景选择6-10个对象作为文本查询并使用Grounding DINO [17]从渲染的分割中选择mask ID。Replica[23]和ScanNet使用了8个场景每个场景包含180张训练图像和相同数量的图像用于测试。在ScanNet中使用了7个场景每个场景包含超过300张训练图像和大约100张测试图像。请注意所有注释的分割mask在训练期间都是不可用的。 评估指标。使用mIoU和边界IoUmBIoU对LERF-Mask数据集进行评估。Replica和ScanNet使用真实全光学分割不考虑类别信息。为了处理预测的和真实mask标签之间的差异我们计算了基于IoU的最佳线性分配。此外以IoU 0.5为标准我们报告了精度和召回率。 表1与表2 实验细节。我们使用SAM [14]和Entity[21]来分割2D掩码通过对置信度较高的mask排序分低于0.5的mask被丢弃。先训练30K原始高斯溅射然后冻结其他参数训练10K的身份编码选择最接近相机帧的前20%三维高斯函数作为mask对应的3D高斯。新的group ID的重叠阈值设置为0.1。为了公平比较我们训练高斯分组[26]进行40K迭代所有用于训练三维高斯的参数的身份编码与[3DGS]和[Gaussian grouping]相同。 消融实验 Gaga对训练图像数量变化的鲁棒性分别对replica数据集按比例0.3、0.2、0.1和0.05的副本稀疏采样效果如表3 与GaussianGrouping相比Gaga对训练图像数量减少的敏感性较低这可以从IoU下降值较小得到证明。可视化结果如图7所示。只有5%的训练数据Gaga仍然可以提供准确的分割掩模而高斯分组由于不准确的跟踪无法为很大一部分物体提供掩模。 应用: Scene Manipulation Gaga实现了高质量、多视图一致的3D分割有利于Scene Manipulation任务因为我们可以准确地分割3D对象的高斯分布并编辑它们的属性。利用预先训练的具有身份编码的三维高斯模型我们使用经过身份编码训练的分类器来预测每个三维高斯模型的掩模标签。随后我们选择与目标对象共享相同mask标签的三维高斯并编辑它们的属性如对象着色、删除和位置移动 其他消融实验
http://www.w-s-a.com/news/220032/

相关文章:

  • 四川成都网站制作公司wordpress 获取某个分类的文章
  • wordpress 编辑器推动门户网站建设不断优化升级
  • 做游戏网站的前景温江区建设局网站
  • 济南做微网站推广做网站seo优化总结
  • 巢湖网站建设电话长沙大型互联网公司
  • wordpress站群主机海南人
  • 云南网站建设维护商业网站建设教程
  • 云南省滇中引水工程建设管理局网站jsp个人网站设计
  • 网站建设 域名业务 邮箱互联网装饰网站
  • 建设厅技工在哪个网站上查询有了网站模板 还要怎样做
  • 城市联盟网站怎么做百度云网站建设视频教程
  • 织梦cms 官方网站网页视频如何下载到电脑
  • 查询建设公司业绩网站国外外链平台
  • 搭建直播网站需要怎么做做石材网站步骤
  • 移动网站如何做权重wordpress 统计字数 插件
  • 编写网站的软件百度指数教程
  • 网站改版建议策划书做设计什么兼职网站
  • 北京做兼职网站文创产品设计流程
  • 南阳做玉器网站wordpress 图片被缩小
  • 自己做网站卖衣服cms做网站容易不
  • 安徽安搜做的网站怎么样手机网站商城建设答辩问题
  • 分析不同网站的优缺点房产网站定制
  • 深圳工业设计大展2021论坛与网站做优化哪个更好
  • 什么网站做招聘比较好网络营销渠道管理
  • 网站建设选择什么模式淘宝网站可以做轮播吗
  • 山西免费网站制作乌市高新区建设局网站
  • 公司网站建设费用会计处理手机app免费下载
  • 网站的做网站的公司网站有些什么内容
  • 网站新类型wordpress 随机文章
  • 电商网站建设会计分录朝阳市网站公司