深度学习：（三）向量化在梯度下降中的应用

阅读量：

向量化

在处理向量之间的点乘时，默认思路是采用 for 循环遍历的方法。然而这种 for 循环的方式运行速度较慢。实际上，在 Python 中可以通过采用向量化的操作（即批量化处理）来显著提高计算效率。

其核心原理是：第三方库numpy能够充分运用多线程处理技术来提高计算效率，并行化的SIMD指令在CPU和GPU上均被支持。

复制代码

    import numpy as np
    c = np.dot(a,b) # 向量点乘

关于 numpy 中 dot 函数的使用，可参考上的博客：

复制代码

关于 numpy 中其他内置函数的使用，可参考上的博客：

复制代码

示例：

复制代码

    import numpy as np
    import time
    
    a = np.random.rand(1000000) # 随机成一个维度一百万的向量a
    b = np.random.rand(1000000) # 随机成一个维度一百万的向量b
    c = 0
    
    # 向量化版本
    tic = time.time() # 查询时间（单位s）
    c = np.dot(a,b) # 向量点乘
    toc = time.time() # 查询时间（单位s）
    print ("Vectorized version:" + str(1000*(toc-tic)) +"ms") # 打印向量化版本的计算时间
    
    # for循环版本
    tic = time.time()
    for i in range(1000000):
    c += a[i]*b[i]
    toc = time.time()
    print(c)
    print("For loop:" + str(1000*(toc-tic)) + "ms") # 打印for循环版本的计算时间
    
    ——————————————————————————————————————————————————————————————————————————————————————————————————————
    # 输出结果为：
    Vectorized version:1.0004043579101562ms
    249690.94904401066
    For loop:309.94439125061035ms
    249690.94904401703
    # 精确到小数点后8位，则无误差

按照经验法则，在神经网络的训练过程中，尽量避免在可能的情况下显式使用 for 循环结构。

向量化逻辑回归的一次梯度输出

去除内部for循环：

在这一计算步骤中， dw 累加运算等于 x 向量与 dz 向量按元素相乘后的结果之和。其中变量 dw 与输入样本特征向量 x 均为 n 维空间中的元素。这等价于将输入样本中的每一个特征维度与其对应的梯度值相乘后累加至目标变量 dw 的过程。

此时，dw=[dw1,dw2,...,dwn]。

去除外部for循环：

这里的 b 被定义为一个实数。然而，在将该向量与这个实数相加时，Python会自动地将这个实数转化为满足维度要求的一个行向量。

→ 这在 python 中叫做“广播 ”（broadcasting）。

接着：

最终化简为：

转化成代码，最终代码为：

复制代码

    import numpy as np

    
    # 定义σ函数
    def sigmoid(x):
    z = np.exp(-x)
    sig = 1 / (1 + z)
    return sig
    
    # 开始一次梯度下降法
    Z = np.dot(w.T,x)+b # 小x,且这里b被广播了
    A = sigmoid(Z)
    dz = A-Y
    dw = (1/m)*np.dot(X,dz.T) # 大X
    db = (1/m)*np.sum(dz) # 大X
    w = w-α*dw
    b = b-α*db

向量化逻辑回归的多次梯度输出

一次梯度输出可以通过向量化消除 for 循环，但多批次梯度输出仍然需要在外层使用一层 for 循环。循环次数代表了 w 和 b 被更新的次数。

————————————————————————————————————————————————————————

上一篇博客	下一篇博客
计算图及其应用，以及梯度下降法的初版程序	python中的广播

全部评论 (0)

还没有任何评论哟~

深度学习：（三）向量化在梯度下降中的应用

向量化对于向量之间的点乘，最开始会想到用for循环遍历，但是for循环速度很慢。可以在python中可以使用向量化（批量化处理）代码来实现快速的计算：其原理为：第三方库numpy能充分利用并行化来...

梯度下降在量子机器学习中的应用

我理解了您的要求。作为一位世界级的人工智能专家、程序员和软件架构师,我将以专业的技术语言和清晰的结构,为您撰写这篇题为梯度下降在量子机器学习中的应用的技术博客文章。我会遵循您提出的各项约束条件,确保文...

深度学习（三）梯度下降法

课程链接梯度下降法中的几个问题学习率如果过大会导致损失函数卡住无法下降，甚至上升，学习率如果过小则会导致收敛过慢。 Adagrad Adagrad是选择学习率的一种常用方法。

深度学习(三）1.梯度下降

一、梯度下降 1.梯度下降是什么梯度下降（GradientDescent）是深度学习中一种至关重要的优化算法，其核心目的是寻找最佳模型参数或权重，从而最小化损失函数。

机器学习 -- 梯度下降法（Ⅵ 线性回归中梯度下降法的向量化）

一.改为向量化公式上节中我们求得梯度下降的计算公式如下：对上式子进行向量化处理。（1）首先将第0项和其他项进行统一：（X0恒等于1）进一步化成矩阵的乘法：（2）最后转置得梯度为：二.修改梯...

深度学习：（七）梯度下降法在神经网络中的应用

梯度下降法在神经网络中的应用事先规定：用n表示个数（维度）: n^[0]=nx，表示单个训练样本x的元素个数； n^[1]表示隐藏层1的单元（节点）个数； n^[1]表示…… 梯度下降法公式： ①...

梯度下降算法原理及其在深度学习中的应用

梯度下降算法原理及其在深度学习中的应用作者：禅与计算机程序设计艺术 1\.背景介绍机器学习和深度学习是当今计算机科学和人工智能领域最热门和最活跃的研究方向之一。其中,梯度下降算法作为最基础和最常用...

深度学习的优化：梯度下降法

深度学习的优化：梯度下降法作者：禅与计算机程序设计艺术 1\.背景介绍深度学习是机器学习领域近年来发展最为迅猛的分支之一。深度学习模型通常包含大量的参数需要学习优化,而梯度下降法作为一种最基础和常...

深度学习---梯度下降&反向传播

梯度下降对模型进行训练最常用的一种算法对误差函数进行求导，来不断更新权重W，最终是误差达到最小值。我们可以看出，梯度下降是是当前最优的解（局部最优解），有点类似于贪心法，如图所示，我们最终的解...

全批量梯度下降法在机器学习中的应用

文章目录数据集代码参考数据集 < 代码代码已经做了详细的注释，且可以正常。

是否确定退出登录?

深度学习：（三）向量化在梯度下降中的应用

向量化

向量化逻辑回归的一次梯度输出

向量化逻辑回归的多次梯度输出

全部评论 (0)

相关文章推荐

深度学习：（三）向量化在梯度下降中的应用

梯度下降在量子机器学习中的应用

深度学习（三）梯度下降法

深度学习(三）1.梯度下降

机器学习 -- 梯度下降法（Ⅵ 线性回归中梯度下降法的向量化）

深度学习：（七）梯度下降法在神经网络中的应用

梯度下降算法原理及其在深度学习中的应用

深度学习的优化：梯度下降法

深度学习---梯度下降&反向传播

全批量梯度下降法在机器学习中的应用