Learning Accurate Low-Bit Deep Neural Networks with Stochastic Quantization

阅读量：

本文提出了一种使用随机算法量化网络的方法。

这种方法与INQ采用相同的方法将权重划分为可量化和全精度部分，并逐步提高可量化权重的比例直至全部量化完成。两者的区别主要体现在对权重的选择上：INQ采用由大到小的选择策略而我们则根据量化误差的程度来选择

这里Wi是某通道权重的全精度值，Qi是其量化后的值。作者定义一个函数：

该作者基于所述函数设计了四种量化策略：第一种策略规定概率值应设为1/m（其中m代表权重通道的数量），第二种策略则采用线性的数学模型进行计算

3：softmax函数

4：sigmoid函数

就这一研究而言，在分析多种算法后发现它们的输出结果大体相当；然而由于线性函数最为简单易懂的原因，在此情况下表现最为出色。就这一现象而言，在评价不同因素后得出结论：核心在于随机划分机制而非指示函数。

概率计算算法确定后，划分算法如下：

整个训练算法如下：

权重更新公式为：

在更新时，分别使用量化后权重和全精度权重的梯度更新对应的权重。

随后作者做了多组对照实验：

单个元素量化与各通道量化之间进行比较时，在表现上会更加突出的是各通道量化的效果。其原因在于，在进行单个元素量化的过程中会对各元素之间的相互作用产生较大的作用

该文采用了基于概率的方法来选择量化的通道，在这一过程中也被称为随机量化技术的原因就在于其采用的是非确定性选择的方式。然而这一方法是否真的是最优的选择呢？为此作者提出了两种不同的优化方案：第一种方案是按照从小到大的顺序依次优化各个通道的量化误差；第二种方案则是在初次训练时就设定好各通道的优化概率，并在此之后始终保持这一设定不变的状态进行后续训练。最终实验结果表明随机化量化策略能够获得最优性能，在这种情况下作者认为这是因为随机算法本质上是一种正则化手段（通过不总是选取性能最优的通道来防止过拟合）。

量化比例的选择：在每次量化过程中, 作者引入了一个超参数r, 用于决定多少权重会被量化, 其值会随着训练过程逐步增加. 为了探索一种合理的增长模式, 作者提出了三个具体策略: 依次包括100%、75%、87.5%和50%, 这些策略被称作指数增长方案（INQ中同样采用了这一策略）；另一种则是20%到100%, 被称为平均增长模式. 前两种策略均基于从零开始训练, 因此作者提出了微调策略（fine-tune）. 实验结果表明, 指数增长模式表现最优. 不过这可能是因为作者在小型网络上的实验结果如此, 在大型网络上采用微调策略（包括后向量化）可能会取得更好的效果.

全部评论 (0)

还没有任何评论哟~

Learning Accurate Low-Bit Deep Neural Networks with Stochastic Quantization

本文提出了一种使用随机算法量化网络的方法。它的思路类似INQ，都是将权重划分为被量化的和全精度部分，然后逐次增加量化的比例，直到百分百。不同之处在于量化权重的选取：INQ是按照从大到小的顺序进行量化...

Two-Step Quantization for Low-bit Neural Networks

这篇文章的动机是：作者认为，低位量化时如果同时对权重和激活值进行量化，因为量化是一个阶梯函数，那么在使用SGD训练时，梯度的微小变化并不能很好地反应到量化的参数上。因此激活值梯度的方差就会很大，导致S...

DEEP COMPRESSION: COMPRESSING DEEP NEURAL NETWORKS WITH PRUNING, TRAINED QUANTIZATION AND HUFFMAN

深度压缩：采用修剪，量子化训练和霍夫曼编码来压缩深度神经网络学习模型压缩知识，记录此论文ICLR2016的bestpaper学习过程。论文链接：<https://arxiv.org/abs/151...

LQ-Nets: Learned Quantization for Highly Accurate and Compact Deep Neural Networks 论文阅读

摘要虽然权重和激活量化是深度神经网络（DNN）压缩的有效方法，并且具有很多利用bit操作来提高推理速度的潜力，但在量化模型和完整模型之间的预测精度方面仍存在明显差距。为了解决这个差距，我们建议联合训...

Learning to Quantize Deep Networks by Optimizing Quantization Intervals with Task Loss

本文提出了一种可学习的量化间隔QuantizationIntervalLearning,QIL方法。它的思路类似TSQ，都是分两步进行量化，但与TSQ不同，它在每一步里都同时对权重和激活值进行处理。

Neural Networks for Weather Prediction: Enhancing Accuracy with Deep Learning

1.背景介绍气象预报是一项对于人类生活和经济发展至关重要的科学。传统的气象预报方法主要包括观测、数据处理、数值预报和预报分析等。随着计算能力和数据量的增加，人工智能技术，尤其是深度学习，在气象预报中...

Learning From Noisy Labels with Deep Neural Networks: A survey

这是2020年关于NoisyLabel的一篇综述，简要的做一记录。文章链接： <https://arxiv.org/abs/2007.08199 Background 为什么要解决NoisyLabe...

Simultaneous Feature Learning and Hash Coding with Deep Neural Networks

SimultaneousFeatureLearningandHashCodingwithDeepNeuralNetworks 论文下载地址自从2014年中山大学潘炎老师讲deephash搬上舞台以来...

Weighted-Entropy-based Quantization for Deep Neural Networks

论文：WeightedEntropybasedQuantizationforDeepNeuralNetworks 论文链接这是CVPR2017的一篇文文章，是用基于weightentropy做深度学...

Neural Networks and Deep Learning week2 Logistic Regression with a Neural Network mindset

该实验作业的主要目的 1.通过该实验指导完成对猫图片的识别 2.在此过程中需要a初始化参量b计算代价函数c使用连续梯度算法你可能对以下参考文献感兴趣 <http://www.wildml.com/2...

是否确定退出登录?

Learning Accurate Low-Bit Deep Neural Networks with Stochastic Quantization

全部评论 (0)

相关文章推荐

Learning Accurate Low-Bit Deep Neural Networks with Stochastic Quantization

Two-Step Quantization for Low-bit Neural Networks

DEEP COMPRESSION: COMPRESSING DEEP NEURAL NETWORKS WITH PRUNING, TRAINED QUANTIZATION AND HUFFMAN

LQ-Nets: Learned Quantization for Highly Accurate and Compact Deep Neural Networks 论文阅读

Learning to Quantize Deep Networks by Optimizing Quantization Intervals with Task Loss

Neural Networks for Weather Prediction: Enhancing Accuracy with Deep Learning

Learning From Noisy Labels with Deep Neural Networks: A survey

Simultaneous Feature Learning and Hash Coding with Deep Neural Networks

Weighted-Entropy-based Quantization for Deep Neural Networks

Neural Networks and Deep Learning week2 Logistic Regression with a Neural Network mindset