【医学影像】《Dermatologist-level classification of skin cancer with deep neural networks》论文笔记...
这篇关于皮肤癌分类的文章重点在于分类器,在《自然》杂志上由斯坦福大学的研究团队发布。竟然发表在《自然》杂志上让我感到惊讶又钦佩。虽然在方法上有一定的创新性,但论文本身的价值却非常显著,特别是这篇文章自发表以来已经获得了超过1300次引用,令人钦佩且值得学习。
出发点
论文核心
论文贡献
论文贡献
论文贡献
2.设计一套分类算法,对收集的图像进行详细的分类
基于InceptionV3模型,在经过ImageNet预训练后,在皮肤癌图像上的微调能够取得非常良好的效果。
让我来为您详细阐述这三个要点内容,请特别关注第一项内容。这项工作量相当大,在我的研究中占据核心地位,并被视为文章的主要贡献。
1.数据
过去所采用的皮肤癌分类系统的数据量相对较小, 通常规模在1000张以下. 然而, 本研究团队通过网络渠道收集整理了大量样本, 其中总计获取了129450张医学影像数据. 这些样本中包含3374张来自皮肤镜成像的数据(注: 皮肤镜是临床工作中由专业皮肤科医生运用的手持设备, 用于辅助诊断)
在这些图像中总共涵盖了2032种疾病,在训练分类器的过程中,默认输出类别被归纳优化至757类这一操作即本文第二项主要贡献所在的具体实现方法即本文第二项主要贡献在于通过一种系统化的方法实现了对复杂度较高的分类任务的有效管理论文研究还特别提供了这一过程的具体说明其中展示了一个层次分明的树状结构其中每个具体的疾病都被明确标注为叶子节点随后通过层层聚合形成了更为广泛的分类范畴

数据集是如何划分的呢,127463张图像作为训练集和验证集,1942张作为测试集。
2.分类算法
该分类算法的基本思路较为直接,在决策树构建的过程中从根节点出发进行遍历操作。具体而言,在每一步操作中都需要计算当前处理到某个决策点时所对应的实例属于哪一类别所拥有的图像数量。为了更好地理解这一过程,请考虑以下示例:选取一个Benign类型的决策点作为研究对象,则其图像数量等于其子树所有叶子层图像的数量之总和。如果这一数值超过预先设定的最大允许值(如本研究中取值为1000),那么就需要对每个子决策点逐一进行递归处理;反之,则认为当前决策点已经达到了可接受的标准范围,并将其标记为用于训练的具体分类类型之一。整个流程大致如此,在实际应用中这种清晰而有条理的设计仍然能够展现出很强的实际效果与适用性。

3.网络

实际上,在网络上并没有多少新意
本文所用的网络架构基于inceptionV3模型设计。在另一篇关于眼科疾病分类的文章中同样采用了inceptionV3架构。实际上,在深度学习领域中广泛使用的分类器通常是resnet系列模型。值得注意的是,这两篇重量级且高质量的研究文章均采用了inceptionV3架构令人感到不解。
网络生成了757个类别,请参考如图所示的部分。这些类别涵盖了不同层次的皮肤区域划分。接着,请根据个人需求选择关注的重点区域。将各个输出的概率相加即可得到更为粗粒度的概率分布。
论文中对于这一问题提供了一个更为直观的可视化说明。其中绿色节点代表了757个具体的输出类别而红色节点则属于更为粗粒度覆盖范围更广的分类体系。值得注意的是大类的概率则是所有子类概率之和

实验结果

定量评估方面而言,在本文中我们采用了灵敏度与特异性曲线这一方法。具体而言,在这种情况下我们关注的是正样本召回率与负样本召回率之间的关系:当正样本召回率增加时(即达到1),负样本召回率将随之下降(至0)。从图表中可以看出,在诊断准确性方面本研究的表现明显优于专业医生。

这些红色标记点代表了皮肤科医生的专业水平,在分类器性能曲线下方几乎找不到符合标准的表现,在经过不同规模的数据集以及各类别数据进行评估时均能达到91%以上的准确度。然而这实在令人感到不满的是
总结下,这绝对是有重要贡献的好文章,赞!
