Advertisement

019基于脑电图信号和CNN的癫痫发作检测2018

阅读量:

依据世界卫生组织的统计数据显示, 约5000万人受到这种神经系统疾病——癫痫的影响。

数据集

颅内Freiburg和头皮CHB-MIT数据库

Time and Frequency Domain Signals

在本研究中, 我们采用时序数据或频序数据作为分类依据. 频域是用于表征信号频率特性的坐标系统. 通过频谱图可观察到信号频率与幅值之间的相互关联(Wen and Zhang, 2017). 每个信道上我们首先运用快速傅里叶变换(FFT)将时序数据转换至频域分析(Rasekhi et al., 2013).

图1A展示了Freiburg数据库中患者的3号病例其间的相位、前相和发作相的记录 。脑电图信号具有明显的非线性和非平稳特性的同时也呈现出高度复杂性 而从视觉上解析这些信号较为困难(Acharya et al. 2017)。图1B则展示了通过FFT处理图1A中的间音 前音及中音录音所得到的频域信号 其中x轴代表频率值范围 y轴代表振幅大小

在某些频率范围内,在不同时段(包括发作期、发作前及发作间期)之间的脑电信号表现出显著差异;这些差异性特征更适合用于分类分析。然而,在其他一些频率范围内,则难以区分不同类型的振幅变化;这类稳定的特征无法起到判别作用。为了提高分类性能,在选择特征时应优先考虑具有鉴别能力的关键参数;与时域分析方法相比,在频域分析中能够更加直观地反映脑电信号的空间分布模式(Ren and Wu, 2014)。

CNN

基于卷积神经网络(CNN)的大规模图像识别与视频分析已经取得了显著成果(Sermanet et al. , 2013;Simonyan 和 Zisserman, 2014a),得益于构建了大型公共图像数据库(例如ImageNet, Deng等人, 2009)以及高性能计算平台支撑(Dean等人, 2012;Simonyan 和 Zisserman, 2014b)。

最近的一些研究逐步引入了卷积神经网络(CNN)来处理 EEG 信号(Ullah 等人, 2018 年),这一领域的关注程度显著提高可能是由于这些技术已被广泛采用,并在研究界获得了更多的认可和更加深入的理解。

该网络架构由输入层、输出层以及多个隐藏层构成。CNN一般包括卷积层、池化层和完全连接层这三个主要组件。卷积过程通过执行卷积运算来处理输入数据,并将处理结果传递给下一层结构。这一机制模拟了单个神经元如何响应视觉刺激的变化。为了提高网络性能,在某些应用中还引入了局部或全局池化结构。其中局部池化会将多个相邻神经元的输出合并成一个特征图;而全局池则会整合整个区域的信息并生成单一特征向量进行传递。全连接过程则通过建立各神经元之间的全面联系来实现信息的最终整合与分类。

相较于传统分类器而言,cnn展现出在处理高维数据方面的显著优势.基于一种参数共享机制,cnn在卷积层中实现了对参数数量的有效控制并实现了数量上的缩减.池化层的设计旨在逐步降低表示的空间尺寸以及网络中的参数量和计算量,并通过这种机制来抑制过拟合现象.

如图所示,在图中将多通道时间序列(基于时间域或频域信号)直接作为输入层传递给CNN网络。该网络架构由三个关键组成层构成:卷积-池化-全连接三层结构。其中卷积单元包含6个特征映射单元,在这些单元上使用5×5尺寸的内核进行计算;每个特征映射单元均与前一层的所有神经元相连并施加权值影响;内核通过滑动窗口的方式与输入EEG信号进行相关性计算,并通过stride步长1的方式实现逐点滑动以捕捉不同位置的空间信息特性;每个内核还带有可学习参数控制滤波器的作用深度和范围;随后经过2×2平均池化操作提取关键特征并降低网络计算复杂度;最终经过完全连接的全连接全连接单元进行非线性变换并通过sigmoid激活函数处理后输出分类结果(分为ictal、preictal和intertal三种类型)。

基于多方面的因素,在本研究中我们构建了一个最多三层的卷积神经网络模型(CNN)。首先,在癫痫数据库中的发作期与发作前期样本数量通常少于发作间期样本,并造成样本分布严重不均衡的情况。其次,在该数据库中获得的有效电极数量有限也限制了网络的发展空间。进一步而言,在现有条件下采用简化的训练架构有助于实现癫痫症状的实时分析与诊断(Y an et al., 2018)

该检测系统对全部受试者进行了评估。采用6折交叉验证策略将数据集随机划分为训练集与独立测试集,并通过这种方式保证结果的有效性和泛化能力(Xiang等人, 2015)。在每次运行期间, 五个子集用于训练, 剩余子集用于测试, 这一设计提供了所有测试样本彼此独立的优势(Kevric和Subasi, 2014)。为了探索实验中所分析的最优内部架构, 我们持续进行实验直至发现实验中所分析的最优内部架构能够实现最合理和精确的结果(如图3所示)。

Prediction of Performance Indices性能指标预测

用于评估分类效果的关键指标包括准确率(Acc)、召回率(Sen)和精确率(Spe) ,具体计算方式如下:

P代表用于区分发作前或发作期与发作间期的样本数量;N代表仅限于划分属于发作间期的真实样本数量;FP则指的是那些在实际状态为发作间期却被误判为属于前后状态的状态数量;Fn则是指那些实际应归类于前后状态却错误地判定为介于状态之间的标本数量;Tp与Tn分别代表成功分类前后两类状态的所有标本数目;这些指标共同构成了用于评估该分类方法性能的关键指标集合。对于涉及三个类别的情形,则主要考察的是分类系统的精确度表现。

RESULTS

采用了基于时间和频域信号的Freiburg和CHB-MIT数据库对这里描述的方法进行了系统性评估分析。该系统经过多组实验验证,在三个不同案例上进行了研究:针对两类不同的二分类问题,在两个特定的时间段内进行研究[(I)发作间期与发作前 和(Ii)发作间期与发作];此外还研究了一个三类问题(发作间期与发作期与发作前)。为确保客观性我们为每个患者单独训练并独立测试了我们的方法;所有被分析的数据结果已详细列举于表1至表4中,并重点指出了模型所获得的关键性能指标包括准确率、敏感性和特异性

Results From the Freiburg Databas

Results for theFrequency Domain Signals频域信号

该系统采用基于分段的方法对Freiburg数据库中的患者数据实施性能评估,并将结果展示于表1中。受个体差异影响的不同受试者之间的检测质量表现出显著差异。表1的最后一行列出了所有21名患者的三个关键指标——准确率、灵敏度和特异性——的平均值。

该阶段的相关信号整体呈现出较高的分类准确性(96.7%),其敏感性和特异性指标分别达到了96.7%和96.8%的水平。其中,在患者群体中表现出最佳表现的是编号为9、11、13、14和21号的个体;然而,在部分患者中则未能达到理想状态(编号为8)。对于编号为8号的患者而言,在两项指标上的表现分别为83.3%和79.7%,这一结果令人担忧;总体来看,在排除了8号及16号患者的情况下,“大多数患者的分类准确率均超过90%”。值得注意的是,“这些患者的敏感性和特异性指标在数值上较为平衡”,这表明其诊断性能具有一定的稳定性与可靠性。

对间期信号与发作期信号进行分类也实现了较高的效果;该方法在测试集上的平均准确性、灵敏度与特异性分别为 (此处应填具体数值) ;第8号患者的二元分类准确率低于 (此处应填具体数值) ,其余所有患者均达到超过 (此处应填具体数值) 的准确率;对于第 (此处应填具体编号) 号患者的信号进行二元分类仍表现出令人满意的性能;表中的结果显示各患者之间的敏感性与特异性表现均衡

间期、发作期及前期信号的分类情况做如下统计:其中一例患者的平均归类准确率达到92.3%,属于可接受范围;八位患者的表现介于90%-至95%之间;剩余四位患者所记录信号的归类准确率均未达到该阈值标准。

Results for the Time Domain Signals时域

表2总结了Freiburg数据库中患者的时域信号分类结果。三种实验的平均正确率分别为91.1%、83.8%和85.1%。

针对间期及前期指标,在多个研究对象中(例如患者A组)进行了评估,并计算了其测量结果的平均值。具体而言,在大多数研究对象中(例如总人数达数百人),这些指标的表现达到了显著水平(例如均值超过85%)。然而,在少数患者中(例如患者编号为X号的病例),这些指标的表现并不令人满意。尽管如此,在个别病例中(例如编号为Y号的病例),其诊断性能表现出了极高的水平。

当区分间期事件与发作期事件时

就这三大类问题而言,在所有病例中的平均正确率为85.1%,约有67%的病例表现出90%以上的分类正确性。值得注意的是,在少数病例中(例如编号为8号和9号的病例),信号分类的表现较差。

Comparison of the Frequency and Time Domain频率和时域的比较

图4展示了不同时间段内各类别问题(包括两类二元分类及三类情况)患者的准确率对比。在以下三个实验中,在这些实验中,在这些实验中,在这些实验中,在这些实验中,在这些实验中,在这些实验中,在这些实验中,在这些实验中,在这些实验中,在这些实验中的数据均表明:在这些实验中的数据均表明: 在这三个不同的时间段内 在这三个不同的时间段内 在这三种不同的情况下 在这三种不同的情况下 在这三种不同的情况下 在这三种不同的情况下 在这三种不同的情况下 在这些问题中的表现均有所不同

Findings from the CHB-MIT Database Findings on Frequency Domain Signals频域

该表格中基于频域分析方法列出了 CHB-MIT 数据库中所有患者的分析结果。类似于 Freiburg 数据库,在本研究中我们也采用了 CHB-MIT 数据库中的患者样本,并进行了三项不同类型的实验。

针对间期与前期信号 的分类任务而言,在通过该数据库进行分析后发现:平均准确率为95.6%,灵敏度为94.2%,而特异性的平均值则达到了96.9%。在所有病例中,在测试指标方面表现最佳的是患者的8号与20号,在这两例中各项指标均优于其他病例。个别患者的测试结果未达预期水平(例如:患者21仅达到84%的正确率)。而案例17在测试中的正确率仅为87%,远低于预期。从整体来看,在测试中的准确度均超过 了 临界值 ,且其检测能力(灵敏度)与鉴别能力(特异性)也均达到较高水平。

采用该方法对间期和发作期 信号进行分类时,在分析所有患者的测试数据后发现:每个受试者的三个测量指标均值显著高于(达到)90%水平;从整体分析结果来看,在全部受试者群体中仅两位患者的分级判读性能(sensitivity)低于85%(即小于85%),其余指标的表现同样令人满意。通过对比分析可发现:三种不同的测量技术所获得的所有其他关键指标表现同样令人满意

针对这三类问题的研究取得了显著成果:其中一些病例包括病例1号和病例9号表现出了良好的识别效果。然而,在病例14号中并未观察到预期的效果。进一步研究表明,在编号分别为16号、21号、23号及24号的四名病患中其信号识别水平较弱只有约80%至90%左右的整体正确率而其他病人的检测水平则均超过90%

Results for the Time Domain Signals时域

表4呈现了CHB-MIT数据库中所有患者的时域信号数据

频域与时域的比较

图5对CHB-MIT数据库中的受试者基于频率特性和时域信号的分类性能进行了详细对比分析。通常而言,在频域中可以有效识别这三种临床表现特征。与基于时域的方法相比,在频域上实现的分类方法具有显著优势(P值小于0.05)。具体而言,在三次实验中使用频域信号计算所得的平均分类正确率分别为95.6%、97.5%和93.0%,显著高于采用时域信号计算所得的结果(分别为59.5%、62.3%和47.9%)。在所有患者群体中使用频域信号所获得的分类性能均优于采用时域信号的情况

DISCUSSION

Comparison With Other Methods

已有研究者已开发了多种用于检测癫痫发作的方法。例如,在如Shoeb与Guttag所展示的例子中所示, 他们基于CHB-MIT数据库开发了一种专为患者设计的机器学习方法.该方法通过提取频谱和空间特征, 并结合非eeg特征构建特征向量;随后通过支持向量机进行分类.其该方法在基于事件的评估框架中成功识别了173例癫痫发作中的96%(参考文献:Shoeb与Guttag, 2010)。

该研究团队(Patnaik and Manyam, 2008)开发了一种基于Freiburg数据库的技术方案;该方法利用小波变换与神经网络结合的方式实现分类任务;其中该算法在特异性测试中的平均值达到99.19%,灵敏度则达到91.29%。

另外一种基于Freiburg数据库的患者特异性癫痫检测方法已有报道(Yuan等人, 2012)。通过应用分形几何理论提取脑电信号的分形截距作为非线性特征,并将其视为线性特征来计算信号的相对波动幅度。研究者构建了由两个脑电信号描述子组成的特征向量,并将其输入到单层神经网络模型中进行分类工作。实验结果表明,在基于节段水平分析时, 该方法具有91.72%的检测灵敏度和94.89%的检测特异性.目前, 常用的癫痫检测方法多采用手工设计的技术对脑电图信号进行特征提取工作, 其性能高度依赖于模型参数设置以及所选择的数据集质量.因此, 该研究不仅要求具备深厚的专业知识背景,还需投入大量的人力资源

研究表明,在对比于传统的人工特征提取方法时,自动特征学习展现出显著的优势(Ullah等人, 2018)。卷积神经网络(CNN)是一种不依赖人工干预的技术,在无需人工选择的情况下运行。其识别能力及抗干扰能力均超越了传统的手工设计架构(Cun, 1995)。

此外,在神经科学领域中也有研究尝试利用深度学习技术(DL)来进行癫痫的识别工作(如某些相关文献所报道)。基于Bonn数据库的研究开发了一种基于深度卷积神经网络(CNN)的三层架构模型(Acharya等人在2017年的研究)。该模型在区分正常状态以及不同类型的癫痫之间表现出了较高的准确性(88.67%)、特异性(90%)以及灵敏度(95%)。然而,在构建复杂模型时仍需耗费大量精力去探索最优化的网络结构参数设置。相比之下,在我们的研究中所使用的三层架构模型相对较为简单明了,并未展现出更深的层次结构复杂性。值得注意的是,在对两个不同的数据集进行分析时所取得的结果均显示出令人满意的性能。此外,在完成模型训练后我们采用了持续时间为一秒钟的时间窗口来进行预测判断工作。综合以上特征参数的应用能够显著提升临床医生实现实时监测的能力

与上述研究相比,在准确性方面达到了或超越了现有研究的水平。
我们分别获得了Freiburg数据库下三个实验项目的平均准确率分别为96.7%、95.4%及94.3%,而在CHB-MIT数据库中的三个案例分别达到了95.6%、97.5%及93%。
本研究基于所提出的方法对两类二元分类问题以及一个三类分类问题进行了系统性地探讨。
通过结合头骨内部和头部表面的数据进行分类测试。
相比之下,在Freiburg数据库中进行分类测试的情况较少,并且取得了令人满意的成果。

Frequency and Time Domains频率和时域

现有的自动癫痫检测系统主要依赖于传统的信号处理方法与机器学习算法。尽管这些系统在某些特定场景下表现出较高的准确性,在其他情况下则表现欠佳。例如,在区分癫痫发作与非癫痫发作时效果显著(Zhang等人, 2017),但在识别正常信号、间期信号以及前期信号时则显得力有未逮。另一个待解决的关键问题是构建一个多类别的统一分类模型。为此,在以下三种测试情境下评估了该系统:(i) 间期与前期(ii) 间期与发作期(iii) 间期与发作期及发作前期。经过测试发现,在上述所有情况下系统的准确率达到90%以上(即使是在频域分析中也未见显著提升)。值得注意的是,在频域分析方面表现优于时域分析方面

此外,在开发一种有效的癫痫检测方法的过程中面临的一个重要挑战是:尽管一些基于自身数据库的方法表现出色(Wilson et al. 2004),但在不同数据库的应用中其性能可能会下降(杨等 2018)。因此,在本研究中我们致力于寻找能够广泛适应不同数据集的方法是一项具有挑战性的任务。然而需要注意的是:由于患者的脑位、年龄、性别以及癫痫发作类型等因素的显著差异(杨等 2018),这些因素会导致个体间脑电图分析特征出现明显差异(Wilson et al. 2004)。为了全面评估相关方法的表现,在本研究中我们采用了两个完全不同的数据库来进行测试,并观察到这些数据库中的患者群体呈现出多种类型的癫痫发作以及较大的年龄范围变化

通过我们的研究发现,在所有的实验中

由此可见,在分析脑电信号时, 个体间的差异对基于频段的方法影响可能较基于时间段的方法要小, 显示出更高的稳定性. 综上所述, 病人的癫痫检测面临诸多挑战, 因为大脑活动由许多具有相似特征的神经元共同调控(Shoeb and Guttag, 2010). 因此, 无法通过提取更为有效的特征或排除不同类别间的无关特征及冗余特征来显著提升检测精度. 研究表明, 在Freiburg数据库中, 部分患者的时段性能略高于频段方法; 然而, 频段方法的整体表现仍然较为出色. 相比之下, 在CHB-MIT数据库的研究结果则显示: 频段方法几乎涵盖了所有情况下的优越性. 具体而言, 利用freqency-based signals可以有效地区分两类和三类信号. 对于两种不同的数据库而言, 基于freqency-based的方法均能显著超越时间domain方法. 这就意味着,CNN模型能够在freqency domain中更容易地提取到更有价值的关键信息.

Impacts of the T wo Databases两个数据库的影响

基于两个独立且公共可用的数据库执行了三项实验。**对Freiburg数据库中的频域信号进行分析后发现:其三次实验均值准确率为[...];而对CHB-MIT数据库进行分析则显示:其三次均值准确率为[...]。在采用频域数据段作为输入样本的情况下(即以频域数据段为测试集),两者的性能表现基本一致;而当以原始信号作为训练数据集时(即以原始时间序列数据为训练对象),两组测试结果显示出显著差异

在三次实验中,Freiburg数据集均值分别为91.1%、83.8%及85.1%,与CHB-MIT数据集对应的均值显著偏低(分别为59.5%、62.3%及47.9%)。一种可能的原因在于Freiburg数据集中使用的是颅内信号采集方法,在此场景下信噪比较高且伪影较少;而CHB-MIT数据集采用的是头皮电极采集技术,在此情况下信号受到较多噪声干扰可能导致特征提取质量较低。另一种可能性在于Frbsburg数据集中所记录信号均为焦点区域直接采集,在此情况下包含的信息更为集中;而Chb-mit系统则是从全脑电极采样获取信息,在此过程中可能会引入更多的冗余信息。值得注意的是由于硬膜与颅骨的空间平均效应颅内脑电图能够捕捉到头皮脑电图中未被观察到的独特特征(Shoeb and Guttag, 2010)。

CONCLUSIONS

当前

全部评论 (0)

还没有任何评论哟~