论文阅读:Cardiologist-Level Arrhythmia Detection with Convolutional Neural Networks
Expert-Level Arrhythmia Identification Using Convolutional Neural Networks
Abstract
我们开发了一种新型算法系统,在利用单导联可穿戴设备采集的心电图数据中进行心律失常识别时展现出显著优势。该系统基于大量病例的数据集进行训练,并采用了深度学习模型设计了一个34层的卷积神经网络架构。实验表明,在一批ECG信号处理过程中,该模型能够将一批ECG信号映射到节拍类别中。此外,在针对测试集的标准评估框架下进行评估后发现,在敏感度和精确度这两个关键指标上均有明显优势。
Introduction
我们研发了一款新型医疗诊断系统,在分析单导联心电图信号方面表现出色,并能更精准地分析单导联 ECG 数据来识别不规则 心律模式。该系统不仅能够帮助医生快速诊断各种 心律失常(即所谓的 arrhythmia),而且其关键优势在于采用深度卷积神经网络技术。通过将大量 ECG 样本输入模型进行训练学习,系统能够实现对新类型 心 rhythm 注释的快速识别与分类,并显著提升了整体诊断效率。此外,在数据量方面也实现了突破性进展——新构建的数据集规模较之前同类研究大两倍以上。
该系统构建了一个包含34层卷积神经网络(CNN)的架构来实现对任意长度ECG时间序列的心律失常检测能力,并且能够在不同长度的时间序列中进行准确检测。图1展示了模型输入的具体示例被展示为模型输入的示例

图 1. 所训练的卷积神经网络模型通过单导联非侵入式的心脏监测装置准确识别窦性心律 (SINUS) 和心房颤动 (AFIB).
除了对噪声和窦性心律进行分类外,在单导联心电图信号上采用200Hz的采样率进行端到端模型训练的同时也会识别并划分不同的心律失常类型。通过引入残差连接和批量标准化技术来提升模型优化的效率以增强其对复杂模式的学习能力和每一步决策所依赖的历史信息范围。
Model
Problem Formulation
ECG心律失常检测系统被视为一个序列到序列的学习体系;该体系基于ECG信号X=[x₁,…,x_k]并生成一系列预测结果r=[r₁,…,r_k]。其中每个预测结果r_i都属于m个预设类别中的一种;所有输出结果共同覆盖了整个输入序列。针对训练集中每一个实例;我们优化交叉熵损失函数以提升模型性能。

其中 p(·) 是网络分配给第 i 个输出值 r_i 的概率。
Model Architecture and Training
我们采用了卷积神经网络来处理序列到序列的任务。 网络架构在图2中展示。将原始ECG时间序列作为输入,并生成一系列标签预测值。长度为30秒的ECG信号采用200Hz的采样率捕捉。每隔一秒模型会生成一个新的预测结果值。本研究设计了一个架构包含33层卷积层之后接一个全连接层和一个softmax激活函数

如图2所示的网络架构中, 其中首层与末层具有特殊性, 这些特性均源自预活化残差模块的作用。总体而言, 该网络体系包括了总计33个卷积层, 其后紧跟一个全连接层以及一个softmax模块
为了简化这种网络的优化过程使其易于处理 我们遵循残差网络架构中的设计模式来引入快捷连接。 神经元间建立快捷连接有助于促进信息在深层神经网络中的高效传递 从而优化整个系统的训练过程。为了避免干扰影响后续计算步骤 在对输入进行归一化处理前 我们应用归一化策略对其进行标准化处理。
Data
Training
我们获取了基于29,163名患者的64,121条心电图记录的数据集,并进行了详细标注。 ECG数据通过高频采样器(200Hz)采集,并由Zio Patch单导联、非 invasive 和连续监测系统捕获;该系统具有长达两周的维护周期。每个 heart record 持续时间为30秒,并可能包含多种节律类型。每位 cardiologist expert 对每条 record 执行了精确的分析和分类;他们识别关键特征并将其归类到预定义的十四种节律类别中。
为该工作开发了一款基于网络的心电图注释软件系统,在30秒的标准测试记录上实施标注操作。一批经过系统培训的专业人员负责标签注释部分,并且这些完成者的身份包括:曾接受完整的心律失常检测培训、并持有Cardiovascular Credentialing International认证的心电图专业技师。在开始标注ECG数据前,请技术人员通过操作界面获取必要的指导信息。对于条带中的每一项节律特征,在各自起始点至偏移处均进行了标注操作,并以此实现了对输入ECG数据的全面分割处理。特别地,在确保不同注释器之间的一致性基础之上制定了专门的节奏转换规则
我们将数据划分为training set和validation set。training set占用了90% of the data. 为了确保 training set, validation set (as well as the test set mentioned below)之间无患者重合, 我们进行了数据划分.
Testing
从具有独特性的328位患者那里收集来的测试集包含了共计336条真实数据样本信息
Result
表 1 列出了不同心律类别的心脏病专家及模型的具体得分分布情况。 在大多数节律类别中,该模型的表现均优于心脏病专家的平均得分。 显著高于AV Block综合征患者的心脏病专家水平。 其中包含了Mobitz I(文克巴赫型)、Mobitz II(AVB型)以及完全性心脏传导阻滞(CHB)。

表 1 显示了专家与模型在序列与集合指标上的 F1 得分对比分析;综合测试集的数据进行汇总分析,则涉及序列与集合指标的具体精度、召回率以及 F1 值计算结果展示
表 1 还进一步比较了模型与心脏病专家在总精度、召回率及F1值方面的差异,并将其与基于事实注释的方法进行了对比。 心脏梗死(心梗)患者的总得分是通过取各心脏梗死患者的评分平均值得出。 该模型在精确性和灵敏度方面全面超越了心脏梗死患者的平均水平。
Analysis
在处理序列数据以及参数配置方面表现更为卓越的情况下(...),该模型的表现超越了心脏病领域专家所获得的平均得分。 图4则直观地呈现了测试集上的模型预测结果。 大量心律失常症状容易被误认为是窦性心律的问题。 我们推测这一部分结果可能是由于心电图记录过程中无法精确捕捉到某些心律的确切起始时间和偏移量。

图 4. 测试集上模型预测的混淆矩阵。
模型偶尔出现的一些错误是可以理解的现象。例如,在某些情况下人们可能会误将Wenckebach与AVB Type2相混淆这一现象是有其合理性的原因在于这两种节律通常呈现出高度相似的心电图特征。同样地当人面对室上性心动过速(SVT)和心房颤动(AFIB)时也常常会将其与其他类型的失常如心房扑动(AFL)搞混这并非毫无道理因为这些不同的心律都属于房性失常范畴有着相似的基本病理机制。值得注意的是有时候室性心动过速(IVR)会被误认为是室性心动过速(VT)这种情况也是有一定道理的原因在于两者虽然仅在心率幅度上存在细微差别但在接近100次/分钟时由于难以精确鉴别而产生混淆
最常见的混淆点包括异位心房节律(EAR)和窦性节律。主要鉴别依据在于它们是否具有异常的P波形态。尤其是在P波幅度较小时或信号叠加有噪声的情况下,可能导致难以准确识别。
Conclusion
我们构建了一个系统,在单导联心电图数据中实现了多种心律失常的精准检测。这一系统的优势主要得益于利用了大量高质量标注数据集和一种深度卷积神经网络结构。通过这种架构设计,在对多个ECG样本进行分析时,系统能够精确分类为不同的心律失常类型。
