Direct Training for Spiking Neural Networks: Faster, Larger, Better

阅读量：

摘要

我们开发了一种神经元正则化技术以实现神经元分立的调整，并构建了一种直接有效的训练算法用于深层SNN的研究。通过优化速率编码窗口尺寸和将LIF模型转换为精确迭代版本的方法，我们开发了PyTorch版本的方法用于训练深度SNN，并显著提升了速度。

准确的LIF迭代模型

原来的LIF模型是这样的变化模式

其中 $u$ 是膜电压， $t$ 代表时间， $I$ 代表外部输入， $u_{reset}$ 代表重置电压。

更换成迭代模式变成如下图

其中，在 $t + 1$ 时刻输入的信息由 $o^{(t),n + 1}$ 进行表示，在 $t + 2$ 时刻则由 $o^{(t + 2),n + 2}$ 进行具体表示。
最终输出的具体表现为 $u^{(t + 2),n + 2}}$ , 其中该值代表膜电压的状态。
而$o^{(t + 2),n + 2}}的具体表现为是否存在动作电位（即是否有脉冲）。

正则化

随着网络层数的加深，目的是为了避免脉冲消退或者爆炸。

整体训练部署

为了构建一个有效的误差度量工具L，在集成预测结果与标签向量Y之间计算平均平方差的均值；此方法适用于时间范围或时间段T内的数据处理场景。

该变量 $o^{t,N}$ 表示最末一层在时刻 $t$ 处的投票决策。 $M$ 是一个固定投票矩阵。
基于详细推导出的迭代LIF模型可以看出：不仅在层间传递时域信息，在时域上也会对神经元状态产生影响。
这表明，在计算梯度过程中需要同时考虑两个不同的领域。

实验

从两个方面：
1.训练加速，
2.应用准确性

网络结构

表1和表2提供加速分析和准确度评估。

pytorch支持训练速度显著提升，并且在三个不同的数据集上均表现出色。这种性能得益于pytorch对卷积操作的优化设计。为了进一步验证这些改进效果的具体表现，请参考图4中的实验结果。随着网络规模的增长，snn模型的精度呈现明显的提升趋势，并且这一趋势与人工神经网络的表现一致。

模拟长度

为了精确模仿神经元的动力学行为和信息编码功能,SNN必须进行足够的模拟步骤才能实现这一目标。假设设定的时间步数为T，则需重复执行推理逻辑T次以确定脉冲发放频率。由此可知网络功耗可被建模为O(T)的增长关系;对于较深层的SNN架构而言,即使前期工作量高达数百至数千个时间步骤（time steps）——亦即每个时间步骤所需的操作开销——仍能达到令人满意的精度水平。(如Sengupta等人,2018所示),这导致了显著的能量消耗与最初的目标背道而驰。值得庆幸的是，在本文所提出的编码架构下,能够大幅减少时间步骤数量而不影响准确性

仅需少量步骤（4至8个），即可达到较为理想的效果。
值得特别注意的是，在仅执行一步的情况下，该方法仍能实现一个尚可接受的结果，并使反应速度和功耗显著降低。
确保在响应时间和能源消耗方面受到严格限制的应用情境下实施此方法。
例如，在火星探测器和依赖太阳能电池板支持的卫星系统等场景中应用该方法可获得良好的效果。

结论

在这个研究中, 我们开发出一种可以直接训练SNN的方法. 为此, 我们设计了一种新的神经元正则化技术. 此外, 我们还改进了速率编码策略, 并将原始连续LIF模型成功转换为精确迭代的形式. 最后, 通过数十倍训练加速以及更大规模网络的应用, 在神经态数据集上实现了最优精度;同时, 在传统的人工神经网络体系中也达到了相当高的准确性. 从目前掌握的情况来看, 这一技术有望推动SNN在主流机器学习框架中的应用和发展

全部评论 (0)

还没有任何评论哟~

Direct Training for Spiking Neural Networks: Faster, Larger, Better

摘要我们提出一种神经元正则化技术去调整神经元分立，而且发展了一种直接的训练算法对于深层SNN. 通过缩小速率编码窗口和转换LIF模型到精确的迭代版本，我们提出了基于pytorch版本的手段去训练深度...

Spatio-Temporal Backpropagation for Training High-performance Spiking Neural Networks笔记

《SpatioTemporalBackpropagationforTrainingHighperformanceSpikingNeuralNetworks》笔记 ABSTRACT STBP:Spati...

Spiking Deep Convolutional Neural Networks for Energy-Efficient Object Recognition

论文名：SpikingDeepConvolutionalNeuralNetworksforEnergyEfficient ObjectRecognition 中文名：脉冲卷积神经网络做高效的目标识别 ...

【论文阅读笔记】（1）Spiking PointNet: Spiking Neural Networks for Point Clouds

DayongRen,ZheMa,etal.“SpikingPointNet:SpikingNeuralNetworksforPointClouds.”ConferenceonNeuralInforma...

Training Deep Convolutional Neural Networks for Gait Re

作者：禅与计算机程序设计艺术 1.简介 2019年,随着人工智能和机器学习技术的迅速发展，以及在科技行业蓬勃发展，当前的人机交互、虚拟现实、医疗等领域都在发生着翻天覆地的变化。基于人类动作数据的生物识...

Training Deep Convolutional Neural Networks for Gait Re

作者：禅与计算机程序设计艺术 1.简介传统的人体姿态识别方法依赖于人类专门设计的特征提取器、分类器等技术，这些模型在训练上耗时长，且难以迁移到新数据集。近年来深度学习技术带来的高效训练能力，使得传统...

【CLR】《Cyclical Learning Rates for Training Neural Networks》

WACV2017 IEEEWinterConferenceonApplicationsofComputerVision 文章目录 1BackgroundandMotivation 2RelatedWo...

Bag of Freebies for Training Object Detection Neural Networks

Abstract 与大量为了得到更好的图像分类模型的研究相比，研究人员在目标检测训练上的研究会由于它的普遍性与普及性的影响少得多。由于复杂多的网络结果，优化目标，许多训练阶段与pipline是专门为检...

Theory and tools for the conversion of analog to spiking convolutional neural networks

ANN2SNN的转化摘要深度卷积神经网络已经展现了巨大的潜力对于真实世界，但是CNN在实时处理方面依然存在挑战。我们之前已经证明了传统的CNN可以转化为SNN，SNN表现出了相近的争取率，但是推理...

Convolutional Neural Networks for Direct Text Deblurring论文阅读

ConvolutionalNeuralNetworksforDirectTextDeblurring 1\.论文的研究目标与实际问题 2\.论文的创新方法及优势 2.1核心思路 2.2关键公式与模型 ...

是否确定退出登录?

Direct Training for Spiking Neural Networks: Faster, Larger, Better

摘要

准确的LIF迭代模型

正则化

整体训练部署

实验

网络结构

模拟长度

结论

全部评论 (0)

相关文章推荐

Direct Training for Spiking Neural Networks: Faster, Larger, Better

Spatio-Temporal Backpropagation for Training High-performance Spiking Neural Networks笔记

Spiking Deep Convolutional Neural Networks for Energy-Efficient Object Recognition

【论文阅读笔记】（1）Spiking PointNet: Spiking Neural Networks for Point Clouds

Training Deep Convolutional Neural Networks for Gait Re

Training Deep Convolutional Neural Networks for Gait Re

【CLR】《Cyclical Learning Rates for Training Neural Networks》

Bag of Freebies for Training Object Detection Neural Networks

Theory and tools for the conversion of analog to spiking convolutional neural networks

Convolutional Neural Networks for Direct Text Deblurring论文阅读