Advertisement

多视图CAD检测系统乳腺X线摄影基于案例的检测性能优化

阅读量:

多视图CAD检测系统乳腺X线摄影基于案例的检测性能优化

介绍

通常乳腺肿块的检测基于双视图乳腺摄影,医生在阅片是会将所有可用视图的信息组合在一起,他们比较MLO和CC视图,寻找不对称性并评估相对于先前乳房X线照片的变化(放射科医生比较两个同侧乳房X线照片视图,以决定是否存在可疑病变。),如果一个视图中的可疑区域具有与另一视图中的可疑区域相同的某些特征,则该区域是真实病变的概率较高(和单视图双侧乳腺肿块的检测不一样),出了可以检测是否是肿块,还可以检测异常(因为异常可以通过重叠腺体组织在一个投影中(部分地)模糊。)。通常,基于相对于乳头的位置和区域相似性(进行视图的配准),使用监督分类来计算一对乳腺中对应于相同的真阳性区域(TP)的可能性。本研究的目的是使用扩展的连接方法来匹配MLO和CC视图中的相应区域,以提高我们的单视图CAD系统的质量检测性能。具体来说,我们调查多视点分析如何更有效地提高基于案例的性能。为此,我们使用来自我们的链接方法的类概率和包含对应特征来研究CAD系统的学习规则的修改。之前的CAD系统可以发现CC和MLO之间的对应关系,但是基于病例的效果没有改善。提出基于病例的检测方法。致力于肿块检测和结构失真的检测。

评估方法

FROC

特色

Bootstrappingwas used for statistical analysis.

统计分析中用了自学习的方式

备注

1.论文[1] - [3]研究了MLO和CC视图中相应区域的匹配

在计算完成后,在区域内确定其对应的分数后即可将来自两个视角的信息进行融合。文献[4]指出,在每个图像内部对各个单视角及其对应的分数进行排序,并随后取其平均值。

3. 在常规情况下(常规情况),排名方案的表现欠佳(表现不佳),因为即使在常规情况下赋予其高排名也会导致大量误报(假阳性)。 最近的研究聚焦于结合相似特征、神经网络架构以及贝叶斯网络等技术(融合方案)。 这些研究显著提升了病变检测性能(检测性能),同时,在病例数据上的性能表现保持一致(保持一致)。

在这些研究中取得显著提升的同时

4. 在这些研究中取得显著提升的同时

基于病变和基于病例的检测性能的区别

该方法在两个视图中识别出区域可能会带来一定的优势,并且研究表明,在两个视图中标注区域会使得读者更容易地执行相关的操作。

该团队由郑等人[8]发起多视图CAD系统的研发工作。该系统旨在以保持与病例相关的检测灵敏度一致为目标设计,在同一侧视图中提高检出质量数量。研究表明多视点方法降低了假阳性(FP)检出率至23.7%,同时确保了与病例相关的检出灵敏度维持在74.4%。

在本研究中, 我们采用了单视图检测方案, 其包含以下几个步骤: 图像分割以及预处理过程, 对可疑图像位置进行初步识别, 然后依次开展区域分割并最终实现单视图分类任务(见图1)。这些步骤已在相关文献[9]-[11]中进行了详细阐述

在该方案中作为第一步,在乳腺X线图像处理中将乳腺组织进行精确分割,在MLO视图情况下区分胸肌与背景区域,并对背景像素利用阈值结合形态学算子序列进行分类处理[12]。随后将胸部肌肉分为两个步骤从乳房区域分离:第一步采用基于改进型霍夫变换的直线估计方法(如Karssemeijer[12]所述),而第二种方法则需考虑胸肌边缘通常呈现微弱弧度的特点

这一步骤中,在第二个阶段中,通过在动态规划方法初始估计值附近进行相关区域内的最佳路径搜索来精确地确定边界。

在这些步骤之后,应用厚度均衡算法来增强乳房的周边[13]。

同样的算法被用来识别径向梯度向量的模式而非径向刺孔并在质量损伤中心区显示出了强响应

9. 软组织例如乳房的大的非线性变形使得配准极其困难。

基于电弧理论或机制的方法主要依赖于这样的基本假设,在乳房受压过程中乳头与病变区域之间的间距维持相对恒定

这一现象可以通过将乳房X射线摄影术用于从胸壁移除乳腺组织以实现精确定位的事实来解释。

总结

已有研究表明,在考虑CC与MLO的相关性时能够显著提升病变检测效率。然而,在病例水平上的性能并未得到明显提升。本研究提出了一种基于案例研究的双视图结合乳腺肿块检测方法;首先构建单视图病变检测系统及其分类器;随后针对不同区域对及相关特征进行分类分析。其中分类器输出将作为多视图CAD系统的输入模式进行偏置选择(即作为输入)。本方法主要应用于恶性肿块与结构失真联合诊断。实验采用乳腺X线摄影技术获取了4个不同的视角图像,并确保至少一个视角包含恶性病变区域。

由于较高的假阳率,CAD系统的检测性能不及人工。

双侧视图结合降低假阳率的原因

放射科专家在阅片时会依据多种不同的影像学视图进行分析,在同侧MLO和CC视图中(识别肿块形态的变化以及与之前检查结果的差异)能够发现潜在的病变。

当两个不同的影像切片中出现的可疑区域在某些共同特征上相同时,则其病变的可能性显著增加。

  1. 双模图像在提高异常检出机会方面具有显著优势。由于在其中一个投影切片中,异常区域与腺体组织存在部分重叠并呈现模糊特征,在另一个投影切片中则能够呈现更为清晰的特征。通过对比分析这两种不同的投影结果可以有效识别出潜在的病变区域。

4.双视图的整合能够使那些在正常乳腺组织内部的不同解剖结构之间产生的重叠区域也被识别出来,并减少了假阳性率。

已有诸多研究者致力于身体同侧双视图结合的乳腺肿块检测技术的研究工作,在这一领域中, 单侧视图中发现的可疑肿块区域间的精确匹配具有重要意义。文献综述中提及, 许多研究集中在MLO (中期乳头外板观察) 和CC (中心切迹) 相关区域的匹配问题上(而非对整个视图进行匹配)

一般情况下,在分析乳头位置及相互间的相似度(涉及这两个方面的具体数值计算)时

在临床实践场景中依据病例特征进行诊断具有更高的准确性 即当采用单一观察视角或同时观察两个视角的情况下 进行病变识别 另一方面是因为诊断时需要综合考虑更多因素 这种复杂性使得基于病例特征的检测方式相较于单纯依赖肿块识别更具挑战性

在配对过程中, 若某一侧肿块与另一侧的病变图形匹配较为明显, 则该区域出现病变的可能性显著增加。具体而言, 在匹配对中更为显著的真阳性率几乎不受另一侧投影轮廓的影响。即,在一个匹配对中, 若某区域的真阳性率较高,则其不会受到另一视图的影响;反之,若某区域相对于另一视图而言具有较低的真阳性率,则其容易受到另一高灵敏度视图的影响而出现误判(小概率受影响,大概率不受到影响)。

(在此处真阳性指的是肿块的存在,在这种情况下),当出现假阳性时,这种情况下它成为肿块的可能性会减少。

尽管该分类器的表现已经达到较高水平, 但通过采用多视图分析方法, 可以进一步显著提升病例诊断的准确性

和真阳不同,假阳在另外一个视图中没有相匹配的区域。

本研究旨在采用扩展连接方法以实现MLO与CC图像中对应区域的匹配目标,并对CAD系统进行了优化。具体而言,在我们提出的方法基础上结合类概率模型提取对应特征。

初步

单视图检测方案包含一下几步:

分割以及预处理

目的:

分割为乳腺组织,

胸肌分为两阶段:第一阶段采用广义霍夫变换进行直线识别,并发现其识别出的胸壁边缘呈现一定的弧度;第二阶段应用动态规划策略优化初始估计路径以获取最佳轨迹。经过上述步骤后,通过厚度均衡算法强化乳房轮廓以提高后续分析效果。同样地,在MLO图像中运用类似的技术平衡胸部区域的亮度分布以便于更准确地识别胸部边界附近的病变。

背景:阈值分割+形态学操作

乳头的定位

基于皮肤轮廓上CC视图或MLO视图下胸肌最大距离的点来估算该处的位置

可疑图像位置的初始化检测(单视图中肿块区域的检测)

基于直线基于弧线的在另外一个视图中进行对应区域的匹配

在初始检测阶段中,在识别出多个候选位置后,在定位的过程中会赋予模式一些属性特征。这些设定对于后续分类工作至关重要

从图像中每隔1.6毫米取样一次,并在每个取样点提取五个特征参数(包括识别孔状结构与肿瘤)

该方法采用多尺度技术基于乳腺摄影图像中的纹理取向统计分析以提取特征信息 采用同样的算法能够有效识别模式中的径向梯度矢量方向而非传统的径向刺孔方向 在肿块病变区域呈现高响应

5个具有相似结构的神经网络模型,在独立的小测试集中进行训练,并利用这些特征对规则网格上的像素进行分类。5个神经网络模型输出结果的概率表明肿块的存在及其结构异常的可能性。似然图中的局部最大值超过设定阈值的位置被视为候选关键点位置,并通过这种方法获得大量值得进一步研究的关键点位置。该方法中所设定的阈值固定不变,在不同图像中初始关键点数量会发生变化。为了尽量减少因过高的灵敏度导致的小范围病变被误判为真阳性的情况发生(即尽量避免假阳性),我们选择了较低阈值来进行实验筛选工作:在我们的实验中发现,在每幅图像中平均提取20个候选关键点

区域分割

在上一步骤所得的局部极大值被确定为区域分割的关键起始点后,我们运用了一种极性重采样与动态规划结合的方法进行处理。该方法相较于其他现有技术展现出显著的优势与更好的性能表现。为了全面表征区域特性,在计算过程中我们主要关注以下几个关键指标:包括乳腺组织中的对比度、边界轮廓的粗糙度、线性纹理特征等;此外还考虑了肿块之间的相对位置关系、轮廓平滑度以及肿块大小等因素;此外,在初始检测阶段识别出5个中心肿块以及刺状特征也被用于单视图区域分类工作

在另外一个视图确定了位置后获取对应的区域(点到区域的获取)

单视图分类

特征提取:提取双视图对应的匹配位置的特征,作为分类器的输入

分类器设计

在研究中采用的神经网络架构包括一个隐藏层和单个输出单元构成输出层。在像素分类初阶阶段设置了5个隐藏单元,在分类阶段则采用了12个隐藏单元。通过反向传播算法配合sigmoid激活函数进行模型训练。其中将病变模式将被映射至接近1.0的数值区域而正常模式对应数值接近0.0。对输入数据进行归一化处理使其均值归零且方差达到1。为了防止过拟合我们采用独立测试集自适应地调整模型迭代次数以确保最佳泛化性能

方法实现

同侧视图区域匹配

在X射线摄影中,由于乳房内部结构被压缩,从而减少了对乳房施加X射线剂量.因此,在MLO图像中发现潜在的乳房肿块时难以将其与CC图像中的相应位置联系起来.如同乳房这样的柔软组织体积较大且发生非线性形变,在配准过程中面临诸多挑战.因此,在匹配过程中通常会依赖于多个特征点作为基准.病变体形测量的方法主要包括两种类型:一种是基于几何曲线的方法,另一种是基于直线几何的方法.

基于弧线的匹配方法

思想原型:基于X射线乳腺成像技术的原理,在进行胸部组织的精确成像时, 医生会将乳腺从胸壁中分离出来。因此, 在这种情况下(即乳腺被压迫时), 乳头与病变组织之间的相对位置得以保持较为稳定。

为了实现肿块可疑区域与另一影像切片中的对应配准过程,在完成测量后确定目标点间的几何关系时会遇到一些挑战。具体来说,在完成测量后确定目标点间的几何关系时会遇到一些挑战

基于直线的匹配方法

思想原型:普遍认为(也就是这样一个常识问题),胸壁承担着乳腺压缩过程中发生的形变,并导致乳腺中的各个点都向下方并向前移动同样的距离。

具体实现:在CC或MLO视图中分别绘制出分别与 chest 壁或 muscle 平行的一条基准线,在这种方法中要求这些关键结构都必须被精确识别出来。观察到在CC视图中绘制出的 chest 壁表面已经呈现出与图像边界呈平行状态的特点。因此,在CC视图中观察到的 chest 壁表面与图像边界呈现平行关系。通过计算机辅助诊断系统(CAD),利用霍夫变换算法能够自动识别 MLO 视图中的肌肉区域。

匹配:一个视图中的可疑肿块区域与另外一个视图中的对应区域

为了准确测量从乳头到其在中心线上的投影点之间的距离, 首先确定一条垂直于胸壁并通过乳头的中心线. 接着, 将该投影距离转换至另一视图中的基准线. 从而确定了一条与胸壁平行的新直线. (这条新直线将用于后续定位操作), 计算潜在区域与该直线之间的垂直距离作为特征值来识别区域. 基于计算出的距离信息进行精确定位操作. 那么关键是如何准确获取肿块中心的位置(在规则图像中易于确定中心),过去的方法依赖于像素数量来评估距离.

采用优化策略计算最佳搜索范围的方法,在调节搜索窗口大小的基础上实现病变占总病例的比例判断;具体而言,在单对图片分析时需明确病变是否存在这一明确指标,在较大样本量下则需统计424例样本中病变出现与未出现的比例数据

基于弧线的搜索宽度

我们设定 search width 为 48 units to ensure all pairs can be matched. The absolute radial differences between the breast region and the distances between nipple and lesion in two views are found to be significantly correlated. By setting the search window independent of the breast region, we vary the window width within a range of 40-48 units, which effectively reduces the number of false positive candidate regions.

基于直线的搜索宽度

需要的搜索宽度更小为37

相似性特征的计算

定义对压缩和位置不敏感的特征向量,定义的相似性特征有:

间距差异: d是基于弧线计算出乳腺边缘与病变之间的间距差异;而直线距离则代表病变至放射线路径的最短距离;w值用于确定搜索区域的宽度。

像素相关性:在之前的区域匹配中已广泛应用于像素相关性,在此处同样采用该方法实现CC与MLO对应区域的匹配。然而,在两个投影视图之间存在角度旋转的情况下该方法显得过于简单(尽管在先前的研究中已取得成效,在此处仍可采用同样的方法)。

在MLO和CC投影中确定的目标区域与暂时配对的目标区域之间存在显著差异。由于乳房在各个方向上的压缩程度不一,并且形状会发生变化。为了缓解这种差异带来的影响(暂时配对的像素相关性较低而身体同侧双视图的相关性较高),从而能够引用现有的像素相关性研究结果(需减少CC与MLO之间的相关性),我们对其相关的计算方法进行了优化。首先以每个目标区域的几何中心点作为基准点执行极坐标变换(极坐标变换必须基于一个明确的目标中心点),然后在此转换后的区域内计算两组数据的相关系数,并采用该固定直径D,并结合CC相对于MLO设定的角度旋转参数来实现这一目标。

熵:平均信息含量用于衡量图像纹理均匀程度,在两幅视图对应的区域中计算其熵值绝对差可作为不相似性指标

直方图的关联度:直方图可用于相似性的量化评估;然而由于图像采集过程中的差异可能导致其数值结果受到显著影响;因此我们采用了非参数化的直方图匹配方法进行处理。在每个观察视图中以病变区中心点为基础设定一个半径为2.5毫米的圆形窗口;在每个窗口区域内均能获取到相应的累积分布函数;通过将目标区域累积分布函数与原区域累积分布函数建立映射关系(即直方图表征规范化)从而实现灰度变换的应用;将此变换关系应用于目标区域后能够有效减少因曝光不足和压缩失真所带来的影响;尽管如此分割后的病变区依然存在各自的独特性:因为真阳病灶的最大直径约为1.5厘米远大于我们所采用圆形窗口范围;为此我们计算了两个不同区域的双直方图相关特征DHC(dual histogram correlation);为了实现这一目标首先需要使用两个独立模板分别获取目标区和原区对应的二维灰度值统计信息进而构建完整的双直方图表征数据集

肿块发生可能性:单侧CAD系统输出反映某一区域内的肿块发生可能性大小,并由此可提取出三个相关特征:MLO切片上发生的病变概率、在CC怀疑区域内观察到病变的概率以及两幅切片上病变概率的差异程度(当差异程度较小时,则表明两处切片描述的是同一病变情况)

紧致性差异:紧凑性表示对象的边界相对于其面积的粗糙度。

线性纹理差异:反映了在分割区域内线性结构的存在。
该差异被采用的原因在于正常组织与肿块组织之间的纹理特征存在显著差异。
因此将这种差异作为两个相应区域之间相似性的度量依据。

采用K-近邻(KNN)方法对单视图分类结果进行融合后得到四个类型:具体分为四个类型:真阳性对真阳性(TP-TP)、真阳性对假阳性(TP-FP)、假阳性对真阳性(FP-TP)、假阳性对假阳性(FP-FP)。定义该分数作为该区域最能反映两个真阳的可能性大小。经过实验验证发现当k取值为27时具有最佳分类效果。较大的k值有助于提高估计精度。单视图CAD系统检测到的候选区域与同侧视图区域之间通过最大匹配分数实现与之关联建立。因此不同区域之间可能存在多对一的关系,在这种情况下我们并不认为这是一个缺点而是期待利用与其他视图的相关性来提升各区域的可能性评估进而将其他信息作为辅助数据源而避免寻找严格的解集

双视图分类

采用匹配算法后,在基于新的模型对单侧视图检测出的所有区域执行进一步处理时,并从另一个视图获取补充信息以增强结果准确性。为了构建这一目标体系,在训练新神经网络的同时确保其具备与单目视觉系统类似的配置结构;具体而言,在此过程中我们利用来自单一CAD系统的相关特征数据,并结合由连接算法计算出的可能性分类结果作为输入数据使用,并结合由连接算法计算出的可能性分类结果作为输入数据使用,并结合由连接算法计算出的可能性分类结果作为输入数据使用,并结合由连接算法计算出的可能性分类结果作为输入数据使用

在一些病例中缺乏相应的匹配区域,在同侧视图中未能找到潜在的候选者区域(因为两个对应区域之间的相似度不够高),因为只有当对应分数超过特定阈值时才能进行配对。如果未能找到匹配的区域,则可采用单侧视图分类器的输出结果作为该区域的可能性判断依据;然而这一做法并未充分考虑未能找到匹配区域本身所提供的关于肿块性质的信息。放射科专家在两个视图中均未发现病变征象,在解剖学分析和临床判断方面存在一定的复杂性。致密组织中的病变通常会被腺体组织所遮盖(即被吸收),这种情况极为常见于该组织类型中。为确保能够处理双侧视图中的所有区域,在本研究中我们采用了以下方法:当无法建立一个区域与其相对应的另一个区域时,则1)将其相似性特征赋值为零;2)将其与TP-TP连接的可能性置零;3)其余三个类别可能性均设为1/3;通过这种方式,在训练阶段以及测试阶段均可利用双侧视图分类器来处理无法建立连接的区域

为了选择双视图分类器的特征,我们使用了顺序浮动前向选择算法。

我们选择特征、评估双视图分类器的交叉验证程序在评估模块。

本节重点阐述了特征扩展的具体实现方案,并详细探讨了双视图分类器的数据输入与输出机制。同时,在未找到匹配区域时的处理方案也得到了充分讨论。经过上述基本组件的设计与实现后,则可完成基于案例学习的过程。

基于案例的学习

采用双视图分类器的思想基于以下原因:当某一区域与另一视图中的候选区域具有相同的特征时,则该区域的安全性会有所提高。(两者的相似度越高,在该特定视图中的肿块安全性越大),这一方法在乳腺X线摄影实践中同样适用:放射科专家通过比较两个不同的影像来识别病变情况。如果在两个影像中均观察到病变,则癌症的风险会显著增加。由于在另一侧未发现明显相似的安全区域而仅发现了假阳性的情况下(假阳性对应的恶性评分应为一个独立值),这种假阳性所对应的恶性评分将会相对较低(此评分值反映了真实阴性的可能性大小)。这也是我们在双视图分析过程中所期望模拟的效果。然而,在应用双视图分析后连接到另一侧正确位置的真实阴性区域TP-FP之间的连接将会导致较低程度的恶性评分。(这一结果看似是意料之内的效果),但其对连接至另一侧正确位置的真实阴性的积极影响已被消除了

为了提高基于病例水平的检测性能,在本研究中我们引入了一种新的神经网络架构。该神经网络采用了与现有双视图分类器相同的配置参数,并通过一种自适应的学习策略优化了其性能表现。具体而言,在训练阶段我们设计了一种特殊的算法框架来处理这一问题:通过设置两个不同的阈值对数据进行筛选处理,并在此基础上实现了对异常情况的有效识别与排除机制。我们的目标是通过这种改进方法,在保证诊断准确性的前提下显著提高模型的整体效能表现:一方面能够更好地识别复杂的医学影像特征;另一方面则能够在一定程度上减少误诊的可能性。

实验和结果

材料

乳腺病变X线摄影:共包含454个病例组(共1816张影像学图像),其中63例为接受过筛查检测或间期癌的早期癌前检查的既往检查。

正常乳腺X线摄影:483个病例(1932张图片)

经检测,在发现后两年内正常的乳腺影像均无癌变;所有病变病例至少在一个检查切片中显示出可见肿块或结构异常(此结构异常的具体检测方法尚未明确),且经病理学检查确认为恶性;对于部分患者而言,在之前的检查中即可完成初步筛查。所有乳腺影像均首先在50微米像素水平下采集,并进一步优化至200微米分辨率;肿瘤特征在经过严格验证后由专业放射科医生进行详细标注;这些标注结果作为后续诊断的重要参考依据。用于构建初始分类系统的训练数据集选取了302幅独立样本

评价

FROC和5重交叉验证检测性能

不引入偏置的数据集建立方法

通过交叉验证后的五个测试数据集的所有区域恶性程度的数据进行汇总,并计算两种类型的FROC曲线:一种类型是基于病变检测率(即被检测到病变的数量与实际存在的病变数量的比例),另一种类型是基于病例检出率(若在一个或多个视角中至少检出一个真实阳性,则计为一个阳性发现;阳性发现数量与真实阳性数量的比例即为检出率)。假设被评估的目标结构中心落在标注区域内,则判定其为正确识别。为了综合评价模型的整体性能并得出统一的标准值——平均真阳分数(MTPF)。

使用辅助方式确定单视图和双视图分类器检测性能的统计显著性。

使用两种方式获得的恶性分数计算FROC,然后计算MTPF的差异。

在之前的匹配过程中,并非总是一对一匹配;在另一个视图中最多包含8个候选区域;最终将通过设定参数来选择似然值超过0.5的所有连接

乳头的定位已经有比较好的算法,双视图联立的重点在对应区域的匹配。

全部评论 (0)

还没有任何评论哟~