机器学习入门（4）——逻辑回归（Logistic Regression）

阅读量：

分类问题（Classification）
假设陈述（Hypothesis Representation）
决策界限（Decision Boundary）
代价函数（Cost Function）
简化代价函数与梯度下降（Simplified Cost Function and Gradient Descent）
多元分类：一对多（Multiclass Classification_ One-vs-all）

分类问题（Classification）

在分类问题中，要预测的变量 y是离散的值。逻辑回归 (Logistic Regression) 的算法是目前最流行使用最广泛的一种学习算法，它算法的性质是：输出值永远在0到 1 之间。
逻辑回归算法实际上是一种分类算法，它适用于标签 y取值离散的情况。

假设陈述（Hypothesis Representation）

我们引入一个新的模型，逻辑回归，该模型的输出变量范围始终在0和1之间。逻辑回归模型的假设是： $h_{\theta}(x)=g\left(\theta^{T} X\right)$ 。其中：X代表特征向量，g代表逻辑函数（logistic function)，是一个常用的逻辑函数为S形函数（Sigmoid function），公式为： $g(z)=\frac{1}{1+e^{-z}}$ 。
该函数的图像为：

python代码实现：

复制代码

    import numpy as np
    
    def sigmoid(z):
    
       return 1 / (1 + np.exp(-z))
    
    
    python

对模型的理解：
$h_{\theta}(x)$ 的作用是，对于给定的输入变量，根据选择的参数计算输出变量=1的可能性（estimated probablity）即 $h_{\theta}(x)=P(y=1 \mid x ; \theta)$ 。例如，若对于给定的x，通过已经确定的参数计算得出 $h_{\theta}(x)$ =0.7，则表示有70%的几率y为正向类，相应地y为负向类的几率为1-0.7=0.3。

决策界限（Decision Boundary）

在这里插入图片描述

代价函数（Cost Function）

对于线性回归模型，我们定义的代价函数是所有模型误差的平方和。理论上来说，我们也可以对逻辑回归模型沿用这个定义，但是问题在于，当我们将 $h_{\theta}(x)=\frac{1}{1+e^{-\theta^{T} x}}$ 代入到这样定义了的代价函数中时，我们得到的代价函数将是一个非凸函数（non-convexfunction）。
这意味着我们的代价函数有许多局部最小值，这将影响梯度下降算法寻找全局最小值。
在这里插入图片描述
将构建的Cost $\left(h_{\theta}(x), y\right)$ 简化如下：Cost $\left(h_{\theta}(x), y\right)=-y \times \log \left(h_{\theta}(x)\right)-(1-y) \times \log \left(1-h_{\theta}(x)\right)$ 代入代价函数得到： $J(\theta)=-\frac{1}{m} \sum_{i=1}^{m}\left[y^{(i)} \log \left(h_{\theta}\left(x^{(i)}\right)\right)+\left(1-y^{(i)}\right) \log \left(1-h_{\theta}\left(x^{(i)}\right)\right)\right]$
Python代码实现：

复制代码

    import numpy as np
    
    def cost(theta, X, y):
    
      theta = np.matrix(theta)
      X = np.matrix(X)
      y = np.matrix(y)
      first = np.multiply(-y, np.log(sigmoid(X* theta.T)))
      second = np.multiply((1 - y), np.log(1 - sigmoid(X* theta.T)))
      return np.sum(first - second) / (len(X))
    
    
    python
    
    
![](https://ad.itadn.com/c/weblog/blog-img/images/2025-07-14/q870CzolNvYKbhXLUduQ6px24BFr.png)

在得到这样一个代价函数以后，我们便可以用梯度下降算法来求得能使代价函数最小的参数了。算法为：
Repeat { $\theta_{j}:=\theta_{j}-\alpha \frac{\partial}{\partial \theta_{j}} J(\theta)$ (simultaneously update all ) }
求导后得到：
Repeat { $\theta_{j}:=\theta_{j}-\alpha \frac{1}{m} \sum_{i=1}^{m}\left(h_{\theta}\left(x^{(i)}\right)-y^{(i)}\right) x_{j}^{(i)}$ (simultaneously update all ) }
在梯度下降算法之前，进行特征缩放依旧是非常必要的。

简化代价函数与梯度下降（Simplified Cost Function and Gradient Descent）

最小化代价函数的方法，是使用梯度下降法(gradient descent)。这是我们的代价函数： $J(\theta)=-\frac{1}{m} \sum_{i=1}^{m}\left[y^{(i)} \log \left(h_{\theta}\left(x^{(i)}\right)\right)+\left(1-y^{(i)}\right) \log \left(1-h_{\theta}\left(x^{(i)}\right)\right)\right]$
梯度下降算法：
$\theta_{j}:=\theta_{j}-\alpha \frac{1}{m} \sum_{i=1}^{m}\left(h_{\theta}\left(x^{(i)}\right)-y^{(i)}\right) x_{j}^{(i)}$ ，来同时更新所有 $\theta$ 的值。

因此，即使更新参数的规则看起来基本相同，但由于假设的定义发生了变化，所以逻辑函数的梯度下降，跟线性回归的梯度下降实际上是两个完全不同的东西。
监控线性回归的梯度下降法以确保其收敛的方法，也可以用在逻辑回归中，来监测梯度下降，以确保它正常收敛。
线性回归中的特征缩放，也适用于逻辑回归。若特征范围差距很大的话，应用特征缩放的方法，可让逻辑回归中梯度下降收敛更快。

多元分类：一对多（Multiclass Classification_ One-vs-all）

在这里插入图片描述
多类别分类问题的基本的挑选分类器的方法，选择出哪一个分类器是可信度最高效果最好的，那么就可认为得到一个正确的分类，无论i值是多少，我们都有最高的概率值，我们预测y就是那个值。

全部评论 (0)

还没有任何评论哟~

机器学习入门（4）——逻辑回归（Logistic Regression）

分类问题（Classification）假设陈述（HypothesisRepresentation）决策界限（DecisionBoundary）代价函数（CostFunction）简化代价函数...

机器学习：逻辑回归(Logistic Regression)

机器学习：逻辑回归LogisticRegression LogisticRegression. 本文目录： 1.逻辑回归模型 2.Logistic函数 3.交叉熵损失 4.梯度下降法 5.核逻辑回归 ...

【机器学习】逻辑回归（Logistic Regression）

从本质上讲：机器学习就是一个模型对外界的刺激（训练样本）做出反应，趋利避害（评价标准）。 1\.什么是逻辑回归？许多人对线性回归都比较熟悉，但知道逻辑回归的人可能就要少的多。从大的类别上来说，逻辑回...

机器学习-logistic Regression（逻辑回归）

logisticRegression逻辑回归线性边界方程（θ为特征值参数，x为自变量）公式意义：计算某个事件发生的可能性，可以把跟这个事件相关的所有特征加权求和，可以看做是类别分界线（最佳拟合线...

机器学习——逻辑回归（Logistic Regression）

逻辑回归一、理论 1.1线性回归 1.1.1线性回归的原理 1.1.2线性回归的数学推导 1.1.2.1模型设定 1.1.2.2求解参数\\mathbfw 1.1.2.2.1损失函数 1.1.2.2...

机器学习—逻辑回归Logistic Regression

8.逻辑回归 8.1逻辑回归的实现 8.1.1什么是逻辑回归逻辑回归又称LogisticRegression，其本质是一种广义的线性回归模型，常用于解决二分类问题。在前面的多元线性回归中，有，其中...

机器学习——逻辑回归（Logistic Regression）

目录一、简介二、逻辑回归的原理 2.1逻辑回归模型的执行流程 2.2逻辑回归模型的算法原理： 2.2.1sigmoid函数 2.2.2似然函数 2.2.3损失函数三、梯度下降法 3.1介绍 3....

机器学习11：逻辑回归-Logistic Regression

目录 1.计算概率 2.损失和正则化 2.1逻辑回归的损失函数 2.2逻辑回归中的正则化 3.参考文献 1.计算概率许多问题需要概率估计作为输出。逻辑回归是一种极其有效的概率计算机制。

机器学习之逻辑回归（Logistic Regression）

逻辑回归是工业界使用频率最高也是最受广泛使用的一种机器学习算法，它是基于线性回归在一些分类问题上由于噪音样本的存在使拟合的直线偏离真实的太大的一种改进，将线性函数的值映射到（0,1）区间范围内，也可以...

机器学习之逻辑回归（logistic regression）

概述逻辑斯蒂回归实质是对数几率回归（广义的线性回归），是用来解决分类问题的。其中sigmoid用来解决二分类问题，softmax解决多分类问题，sigmoid是softmax的特殊情况。数学建模...

是否确定退出登录?

机器学习入门（4）——逻辑回归（Logistic Regression）

分类问题（Classification）

假设陈述（Hypothesis Representation）

决策界限（Decision Boundary）

代价函数（Cost Function）

简化代价函数与梯度下降（Simplified Cost Function and Gradient Descent）

多元分类：一对多（Multiclass Classification_ One-vs-all）

全部评论 (0)

相关文章推荐

机器学习入门（4）——逻辑回归（Logistic Regression）

机器学习：逻辑回归(Logistic Regression)

【机器学习】逻辑回归（Logistic Regression）

机器学习-logistic Regression（逻辑回归）

机器学习——逻辑回归（Logistic Regression）

机器学习—逻辑回归Logistic Regression

机器学习——逻辑回归（Logistic Regression）

机器学习11：逻辑回归-Logistic Regression

机器学习之逻辑回归（Logistic Regression）

机器学习之逻辑回归（logistic regression）