伊犁哈萨克自治州网站建设_网站建设公司_Django_seo优化
2026/1/10 3:07:15 网站建设 项目流程

2026.1.9

该研究提出了一种名为CvDd-Net的体积医学图像分割模型,通过利用多视图切片先验,并引入差异感知形态强化(DaMR)和依赖感知信息聚合(DaIA)模块来有效捕获视图间的差异和依赖性,从而显著提升了在全监督和半监督任务中对小目标分割的鲁棒性和准确性,尤其在数据有限的情况下表现出色。

Title题目

01

Cross-view discrepancy-dependency network for volumetric medical image segmentation

用于体素医学图像分割的跨视图差异-依赖网络

文献速递介绍

02

医学图像分割对临床应用至关重要,但手动勾勒3D图像工作量巨大且需专业知识。尽管深度学习方法在3D医学图像分割中取得进展,但面临数据稀缺的挑战。现有的补丁(patch-based)策略难以捕获长距离上下文信息,而仅使用单视图切片图像的方法忽略了其他两个视图的空间信息以及切片间的连续性。多视图学习虽被应用,但大多集中于结果层面的融合,忽视了不同视图间的差异和依赖性,限制了多视图先验的潜力。本文提出CvDd-Net,旨在通过多视图切片先验辅助体积表示学习,并探索视图差异和视图依赖来提升性能。

Aastract摘要

02

深度学习在体积医学图像分割中面临数据有限的挑战,现有方法通过多视图切片表示体积,但常牺牲层间空间连续性。为解决此问题,本文提出了一种跨视图差异-依赖网络(CvDd-Net),利用多视图切片先验辅助体积表示学习,并通过探索视图差异和视图依赖来提升性能。具体而言,该网络设计了一个差异感知形态强化(DaMR)模块,通过挖掘形态信息(如物体边界和位置)有效学习视图特定表示。同时,开发了一个依赖感知信息聚合(DaIA)模块,充分利用多视图切片先验来增强各视图表示,并基于跨视图依赖进行集成。在甲状腺、宫颈、胰腺和胶质瘤四个医学图像数据集上进行的广泛实验表明,该方法在全监督和半监督任务中均表现出显著的有效性。

Method方法

03

CvDd-Net包含两个编码器、一个差异感知形态强化(DaMR)模块、一个依赖感知信息聚合(DaIA)模块和一个解码器。首先,通过预训练的切片模型获取多视图切片表示作为先验。DaMR模块通过残差上下文映射(RCM)捕获相邻切片间的边界信息,并通过坐标注意力(CA)编码视图特定表示的位置信息,以增强视图差异。DaIA模块首先通过跨维度依赖感知关系(CdDR)将多视图切片先验(即Sa, Ss, Sc)整合到体积表示中,通过空间和通道维度上的相关性增强各视图的表示。然后,通过跨视图依赖感知关系(CvDR)利用自注意力机制,建模不同视图特征间的长距离关系,特别是强调轴向视图信息,实现多视图信息的有效聚合。

Discussion讨论

04

外部验证结果(使用额外的宫颈癌患者CT扫描)进一步证明了CvDd-Net在全监督和半监督设置下均具有出色的泛化能力,这得益于其对多视图互补信息的有效利用。通过t-SNE可视化特征,表明模型能良好地分离前景和背景像素,实现类内紧凑和类间分离。参数分析显示,CdDR和CvDR中的可学习权重(w1-w5)能根据不同数据集自适应调整,优于固定权重设置,这对于提高模型对新数据集的适应性很重要。复杂度分析表明,CvDd-Net在实现高性能的同时,参数数量和FLOPs相对较少,表明性能提升主要归因于多视图切片表示的高效利用而非模型复杂度的增加。这些结果共同支持了CvDd-Net在体积医学图像分割领域的有效性和潜力。

Conclusion结论

05

本文提出了一种用于体积医学图像分割的CvDd-Net,该网络利用多视图切片先验,并通过差异感知形态强化(DaMR)模块学习视图特定表示,通过依赖感知信息聚合(DaIA)模块整合多视图信息。在四个数据集上的广泛实验证明了该方法在模型尺寸相对较小的情况下仍能有效提升性能,尤其在小目标分割中表现出色。同时,CvDd-Net在半监督任务中展现出比现有方法更高的性能,凸显了多视图学习在数据有限应用中的潜力。

Results结果

06

在甲状腺、宫颈、胰腺和胶质瘤四个医学图像数据集上的实验结果表明,CvDd-Net在Dice系数、Jaccard指数和95%Hausdorff距离等指标上均优于其他主流的3D骨干网络、多视图分割方法和任务特定网络。定性比较显示,CvDd-Net能更准确地勾勒物体边界,并生成更平滑、连续的分割结果。消融研究证实了DaMR模块中的RCM和CA组件、以及DaIA模块中的CdDR和CvDR组件的有效性,它们对增强视图差异和整合多视图信息至关重要。研究还发现,CvDd-Net在不同3D骨干网络下均能保持竞争力,并且在有限数据量的半监督任务中,CvDd-Net也显著优于现有的半监督方法,显示出对数据稀缺的鲁棒性。

Figure

07

图1. CvDd-Net的流程图。它由一个用于特征提取和预测图生成的编码器和解码器(蓝色)组成。此外,它还包括:(a) 一个用于多视图切片表示学习的切片编码器(绿色),(b) 一个用于视图特定表示学习的差异感知形态强化(DaMR)模块,以及(c) 一个用于多视图表示融合的依赖感知信息聚合(DaIA)模块。

图2. 差异感知形态强化模块的示意图。RCM:残差上下文映射;CA:坐标注意力。

图3. 依赖感知信息聚合模块的示意图。CdDR:跨维度依赖感知关系;CvDR:跨视图依赖感知关

图4. 所有竞争方法在甲状腺(顶部)和宫颈(底部)数据集上一些代表性病例的可视化结果。第一行和第三行中的蓝色和橙色线条分别表示预测图和真实值的边界。最后一列名为GT表示原始图像及其真实值。

图5. 所有竞争方法在胰腺(顶部)和胶质瘤(底部)数据集上一些代表性病例的可视化结果。第一行和第三行中的蓝色和橙色线条分别表示预测图和真实值的边界。最后一列名为GT表示原始图像及其真实值。

图6. 所有半监督方法在甲状腺、宫颈、胰腺和胶质瘤(从上到下)数据集上一些代表性病例的定性比较。分割结果来自使用50%数据训练的模型。蓝色和橙色线条分别表示预测和真实值的边界。最后一列名为GT表示原始图像及其真实值。

图7. 来自四个数据集的t-SNE可视化,用于验证CvDd-Net的表示学习直觉。

图8. CvDd-Net中间层特征图的可视化。从左到右依次为 (a) 带GT的原始图像,特征图 (b) 编码器之后(RCM之前),(c) RCM之后(CA之前),(d) CA之后(CdDR之前),(e) CdDR之后(CvDR之前),以及 (f) CvDR之后(解码器之前)。

9. 不同数据集上自适应权重(CdDR中的w1和w2,以及CvDR中的w3、w4和w5)的定性结果。

图10. 使用25%数据训练的CvDd-Net中间层特征图的可视化。从左到右依次为 (a) 带GT的图像,(b) 轴向视图的表示,(c) 矢状视图的表示,以及 (d) 冠状视图的表示。具体而言,来自不同视图的三列特征(从左到右)分别为:(1) 切片表示,(2) CA之后(CdDR之前)的特征图,以及(3) CdDR之后(CvDR之前)的特征图。

图11. 不同模型在四个数据集上的复杂度分析。横轴和纵轴分别表示模型的参数数量和Dice相似系数,圆形的大小表示模型的FLOPs。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询