基于梯度的快速准确头部运动补偿方法在锥束CT中的应用|文献速递-基于深度学习的病灶分割与数据超分辨率
Title
题目
This paper presents a gradient-based strategy for high-speed and precise head motion compensation in cone-beam CT imaging.
基于梯度的快速准确头部运动补偿方法在锥束CT中的应用
01
文献速递介绍
锥束计算机断层扫描(CBCT)系统在灵活性方面明显优于固定式的多排螺旋断层扫描(MDCT)设备。虽然MDCT系统具有固定的结构特征,在接收检查时必须将患者从护理站转运至医院其他区域的影像设备位置上,在紧急情况下如急性缺血性脑卒中病例中有70%以上可能会出现不良反应风险。此外,在这种情况下完成转运不仅耗时而且还需要医护人员陪同操作。因此专门设计的便携式CBCT系统可作为直接护理点成像的理想替代方案例如特别适用于头部影像检查同样适用于急性脑卒中患者的头部检查由于任何因转运至MDCT系统而导致的时间延误都将对患者的预后产生严重不利影响对于急性缺血性脑卒中患者而言及时开展血管内治疗至关重要症状出现150分钟后每延迟一小时无功能障碍恢复的概率将下降10%到20%程度如果能够将患者直接转运至血管造影室并立即完成CBCT检查则可在不延误的情况下启动血管内手术这一做法有望显著缩短工作流程时间并提升患者的预后状况
然而,在医院危重病患或中风患者在ICU床旁实施成像工作的临床工作流程中集成CBCT系统仍然面临诸多挑战。其中一个重要原因是患者出现明显运动状况时容易导致重建图像质量严重下降。与现代MDCT扫描仪相比其扫描时间通常会延长至每次约4至30秒相比之下长时间扫描使得非自主运动对重建过程的影响更加显著甚至可能导致图像质量完全失真。研究表明在310名因急性中风症状紧急送医并在血管造影室接受非增强CBCT检查的患者中有51%会出现明显的运动伪影现象而其中11%由于成像质量严重退化无法完成临床解读任务。由此可见为了成功实现CBCT系统的可靠集成至危重患者的临床工作流程上亟需开发一种能够有效抑制运动伪影干扰的技术方案
Aastract
摘要
Cone-beam computed tomography (CBCT) systems, showcasing their flexibility, demonstrate a significant potential for real-time medical imaging, particularly in critical situations such as acute stroke assessment. However, integrating CBCT into clinical workflows presents challenges primarily due to extended scan times, which result in patient motion during scanning and subsequently degrade image quality in reconstructed volumes. This paper presents an innovative approach to CBCT motion estimation utilizing a gradient-based optimization algorithm tailored for cone-beam CT geometries. By leveraging generalized derivatives of the backprojection operator, we formulate a fully differentiable target function that enhances the quality of motion estimates during reconstruction. Our method achieves a remarkable acceleration in motion estimation, offering a 19-fold improvement over current techniques. Additionally, we explore the architecture of networks used for quality metric regression and propose autoencoder-like structures that better predict voxelwise quality maps compared to contracting architectures. This modification leads to more efficient gradient flow and improved accuracy in motion estimation. The proposed method is rigorously tested through realistic experiments on head anatomy, demonstrating reduced reprojection errors from an initial average of 3 mm to 0.61 mm after motion compensation and consistently outperforming existing approaches. The analytic Jacobian for the backprojection operation at the core of our method is made publicly available. In conclusion, this paper advances CBCT integration into clinical workflows by introducing a robust motion estimation approach that balances efficiency and accuracy while addressing critical challenges in time-sensitive scenarios.
锥束计算机断层扫描(CBCT)系统因其适应性而著称,在现场医疗成像领域具有特殊的应用价值。尤其是在急性中风评估等关键场景中发挥着重要作用。然而,在临床工作流程中集成CBCT系统面临诸多挑战:长时间扫描可能导致患者移动现象严重出现,并由此引发图像重建质量下降的问题。本研究提出了一种新的CBCT运动估计方法:通过引入基于梯度优化的技术,并结合锥束CT几何模型中反投影算子的广义导数特性来构建目标函数框架。在此基础上开发了一个完全可微的目标函数模型:用于评估当前运动估计效果的质量指标并实现精确计算。我们成功实现了运动估计过程速度的显著提升:相较于现有方法实现了19倍加速效果明显提升效率并大幅降低计算复杂度。此外我们还创新性地提出了用于质量度量回归的新网络架构并构建了预测体素级质量分布图这一改进优化了梯度流动过程显著提升了运动估计精度和可靠性保证了计算效率的同时能够精准捕捉图像细节特征以满足临床应用需求。在头部解剖结构真实实验验证表明该方法能有效实现头部重投影误差从初始平均3毫米降至0.61毫米水平并且显著优于现有同类技术方案在性能上具有明显优势并能在复杂病例中表现稳定可靠地支持CBCT系统的临床应用需求
Method
方法
CBCT重建过程中,从不同方向测量得到的线积分被转换为X射线衰减系数的空间分布图。该过程本质上依赖于精确理解扫描几何学知识,并明确描述了X射线源、平面探测器和平板患者之间的三维关系。通常情况下,在扫描期间假设患者是静止的。在此情况下,在特定投影视角下可以唯一地由校准投影矩阵将三维世界坐标系中的任意一点映射到平面探测器坐标系中的相应点。当投影矩阵与实际投影数据一致时,则存在多种解析和代数算法可以用于解决重建问题。患者移动会导致校准投影矩阵与实际投影数据之间出现不匹配现象。在重建过程中此不匹配现象会导致最终图像中出现 artifact。
在CBCT重建过程中,在不同方向上所获得的测量线积分值被转换为具有空间分辨率特性的X射线衰减系数图像数据。这一过程主要依赖于对扫描几何参数组态的精确掌握程度,并用于描述X射线源、平板探测器以及受检者之间的三维关系。通常情况下,在实际应用中我们都会假设受检者在整个扫描过程中始终保持静止状态。在此前提下,在这种固定假定下若采用可重复运行的标准圆形扫描轨迹,则可以通过一组标准投影矩阵集合来进行唯一性表征;这些标准投影矩阵则能够将处于3D世界坐标系中的任一具体点对应映射到其特定投影视图下的探测器坐标系中的相应位置点上。与之对应的精确投影矩阵组,则提供了多种解析解和代数算法方案来进行相应的图像重建工作
患者的运动可能会导致校准投影矩阵与采集到的投影数据之间存在不一致。在图像重建的过程中,这种不一致将导致生成的图像中出现伪影效果。
Conclusion
结论
In this paper, a differentiable approach to CT reconstruction is expanded to incorporate cone-beam geometry parameters, making it more effective for motion compensation in real-world clinical applications. When combined with an enhanced measurement standard, we observe the full benefits of the proposed gradient-based method: a notable decrease in computational time alongside highly accurate and reliable motion compensation performance. Ultimately, this advancement may enable streamlined point-of-care CBCT head imaging by addressing unavoidable motion artifacts efficiently and dependably.
本文发展了CT重建可微分公式的应用范围,并将其拓展至锥束几何参数设置下,在真实临床场景中实现有效的运动补偿功能。基于优化后的质量评估指标体系,在不牺牲算法性能的前提下充分挖掘了该方法的优势:不仅大幅提高了运行效率(运算速度),而且能够保证精确性和稳定性的同时有效消除由于运动引起的图像模糊现象。最终该方法有望为现场CBCT头部成像提供基础支持,在提升成像质量的同时有效消除由于运动引起的图像模糊现象。
Results
结果
All motion compensation experiments are performed onthe same 30 patients from the test set for quality metricmodel training. A random motion pattern is sampled for eachpatient with an amplitude of 5 mm for translation and 5 ◦ forrotation which is kept constant across different methods andoptimization algorithms. The motion estimation itself runs ongrids of size 128 × 128 × 128 with a 2 mm spacing for thereconstructed signal, but the image-based results are computedon higher resolved signals with 256 × 256 × 256 voxels ofsize 1 mm for the final motion-compensated reconstruction.For the evaluation we rigidly register all motion-compensatedreconstructions to their respective ground truth reconstructionin 3D. All box plots in this paper show the median andinter-quartile range as well as the minimum and maximumvalues. Outliers are highlighted by cross markers. Values of theinitial metrics before motion compensation are shown by thegray box. Additionally, we apply our method to two clinicalcone-beam CT head scans that are affected by real patientmotion. Since the motion patterns underlying these scans areintroduced by the patients during the scanning procedure, aquantitative analysis is not possible in this case, but qualitativeresults are presented in section IV-D.
所有运动补偿实验均在同一测试集中的30名受试者身上实施,并用于构建质量度量模型。每位受试者都会随机生成一个统一的运动模式,在不同方法与优化算法中保持一致性。该模式经由平移量设定为5毫米并配合旋转幅度设定为5度来模拟真实场景下的运动变化。随后将该模式应用于运动估计过程运行于128×128×128的空间网格中完成处理,并基于图像结果计算更高分辨率的空间信号以提升估算精度。最终实现的空间分辨率达到每个体素1毫米,并共计包含256×256×256个独立体素单元
在评估过程中, 我们通过刚性配准将所有经过运动补偿处理后的重建结果与各自的3D真实重建结果进行对比。本文中的所有箱线图分别展示了中位数和四分位距, 以及最小值和最大值, 其中异常值以叉号标记。运动补偿前的初始度量值以灰色框形式表示。此外, 在分析具有患者实际运动影响的两例临床锥束CT头部扫描数据时, 我们采用了该方法。由于这些扫描中的运动模式是在 scan过程中由患者引入的未知因素所致, 并且无法进行定量分析, 在第IV-D节中展示了定性结果。
Figure
图

Fig. 1: Rigid motion compensation is achieved through addressing an optimization problem to determine the motion patterns from the measured data. A reconstruction that compensates for motion is then performed in accordance with the determined motion patterns to compute the compensated volume.
图1:随后通过求解一个数学优化模型从测量数据中推导出运动模式参数。接着应用估计的运动模式进行刚性变换校正操作以确定空间区域的度量结果。

Figure 2 illustrates the proposed approach for rigid motion estimation in cone-beam computed tomography (CBCT). The three fundamental components consist of (1) a motion学 model, (2) a backprojection module with end-to-end optimization capability, and (3) a quality prediction module capable of estimating anisotropic spatial characteristics.
图2展示了我们提出的方法用于CBCT刚性运动估计的研究框架概述。本研究设计了以下三种关键组件:(1) 基于深度学习设计的一种可微分反投影技术;(2) 基于端到端梯度流优化的核心算法;(3) 经过严格训练以评估图像质量的质量评估指标,这些组件共同构成了完整的解决方案系统

图3: 与总变分(TV)、黄等人[6]提出的网络基质量度以及Ko等人[40]提出的一图像一步方法进行比较
图3对比现有研究中的质量度量。其中总变差(TV)被采用作为基准指标。Huang等人提出基于网络的质量度量[6]。Ko等人的基于图像的单步方法[40]则作为另一类对比基准。在具体评估指标方面采用运动补偿重建体积上的均方根误差(RMSE),其值呈下降趋势;同时结合结构相似性指数(SSIM)及其显著提升;此外视觉信息保真度(VIF)也有所提升。

Fig. 4: A comparative analysis of the proposed quality metric against the total variation measure (TV) and an existing network-based approach developed by Huang et al. reveals distinct performance characteristics in evaluating motion parameters. The upper panel (4a) depicts the mean absolute error (MAE; ↓), indicating reduced errors for planar motion parameters such as tx, ty, and rz compared to other metrics, while the lower panel (4b) illustrates similar trends for non-planar motion parameters including tz, rx, and ry.
图4对比展示了所提出的质量度量与现有方法之间的差异。上图中的(4a)和(4b)分别展示了平面内运动参数(包括tx, ty, rz)和平面外运动参数(包括tz, rx, ry)的平均绝对误差(MAE值随时间下降的趋势),具体来说,这里的平面指的是源物体旋转所在的平面。

Fig. 5: Analysis of the proposed quality metric against total variation (TV) and the network-based quality metric developed by Huang et al. [6]. The figure illustrates Reprojection error, RPE (↓), which quantifies the distance between points after forward projection onto detector planes, highlighting significant discrepancies between expected and actual projections to emphasize measurable deviations.
图5对比当前研究中常用的总变差(TV)以及Huang等人的网络基质量度量方法

Fig. 6: Qualitative reconstructions were performed for two example patients, each showing an axial slice in the upper section and a sagittal slice in the lower section within the volume. A threefold magnification of the region of interest was incorporated. The gray values were windowed within a range from −1200 to 1500 Hounsfield units.
图表6展示了两个病例的定性重建结果。
对于每位受检者,在上部区域显示各患者的纵向切片。
在下部区域展示各患者的横断面。
对所关注区域进行了×3倍放大显示。
所有灰度值窗口范围为−1200 HU至1500 HU

_Fig. 7: 图 7: 属于图 6 示例 1 的运动模式在获得投影的基础上绘制而成作为函数随投影的数量变化而变化。上部与下部分别描述了平面上的运动参数(tx ty rz)与空间中的运动参数(tz rx ry),涉及源旋转所在的平面。干扰源的真实运动模式由十个样条节点参数化而恢复得到的所有运动模式则由30个样条节点参数化。图6中初始受运动影响的重构结果是从零初始化的曲线开始绘制的
图7所示的是与图6中示例1相对应的运动模式,在其投影变化过程中被表示为函数形式。其中所指之图形分为上下两部分:上部图形展示了平面内参数(tx、ty及rz)的变化趋势;下部图形则展示了平面外相关参数(tz、rx及ry)的变化情况。值得注意的是,在此分析中所提及之"平面"即为源旋转所在的那个空间。真实扰动状态采用10个样条节点进行参数化描述,在此过程中观察到的现象具有良好的一致性特征;而恢复后的各种状态则采用了30个样条节点来进行描述,并通过对比分析得到了较为理想的匹配结果。在图6中展示的是初始状态下的受扰动重建过程,并采用了零初始化的方法来模拟该过程。

_Figure 8 presents a comparative analysis of runtime comparisons between the proposed methodology and alternative quality metrics under both gradient-based and gradient-free optimization frameworks.] Each bar in this visualization represents the average runtime across all test samples involved in motion estimation, with exclusion of the final full-resolution motion-compensated reconstruction step.
第8页图中,在基于梯度和无梯度优化设置下对比分析了所提方法与现有其他评价指标在运行时间上的表现。各个柱形图分别展示了不同测试样本群组在运动估计任务中的平均计算时长,并未包含最终阶段的高分辨率运动补偿重建过程。

Figure 9 presents qualitative reconstructions for two example patients using real motion-affected clinical cone-beam CT scans. For each patient, an axial slice is displayed in the upper row and a sagittal slice in the lower row, both passing through the examined volume. A ×3 magnification of a region of interest is incorporated into the visualization.
图9:两个病例患者的准确运动轨迹对临床锥束CT扫描的质量有着重要影响。对于每位患者,在显示截面中分别采用轴向切片和矢状切片进行观察,并通过×3倍放大图清晰展示感兴趣区域的细节信息。

_Fig. 10: A comparison between the recovered motion patterns of clinical examples 1 and 2 in Fig. 9 to their corresponding observable motions in projection images. The upper plots represent the vertical pixel positions of anatomical landmarks identified via manual annotation in these projection images. The lower row illustrates the recovered motion curves, which include rotations and translations. The motion parameter exhibiting the highest amplitude is emphasized in orange, specifically rx for example 1 and tz for example 2.
比较图9中临床案例1(左侧)和案例2(右侧)所呈现的投影图像中的运动模式恢复情况。上部图表展示了通过手动标注确定的解剖标志在其投影图像中的垂直像素坐标位置。下部绘出了各案例恢复后的旋转和平移运动轨迹,并用橙色线条突出显示具有最大的幅值变化程度的部分:其中案例1对应于rx轴旋转轴线的变化趋势,案例2则对应于tz轴平移方向的最大位移量测量结果。各病例对应的解剖标志在其投影图像上的移动轨迹与各自最大幅值变化趋势的高度吻合
Table
表

TABLE I: The table presents the average quantitative measures across a variety of metrics and motion compensation techniques optimized using gradient descent. Only image-based metrics can be computed for the method developed by Ko et al., as it does not explicitly calculate motion patterns.
表1展示了采用梯度下降优化的所有研究标准及其运动补偿方法的平均定量结果。然而,Ko等人并未明确地估计运动模式,因此仅能基于图像信息进行评估
