机器学习算法：k近邻法（k-NN）

阅读量：

分类与回归算法，多分类。

三个基本要素：K值的选择，距离度量，分类决策规则。

1 k近邻算法（分类）

最近邻居分类器：在单个邻居的情况下（k=1），该方法将训练数据中与实例点x最接近的类别作为其类别。换句话说，在输入实例点x（特征向量）的情况下，在训练数据集中找到与之最接近的一个实例，并将其类别赋予给该输入实例点x。

k近邻法不涉及明显的学习过程。（"懒惰学习"：在训练阶段仅需存储训练样本，在接收测试样本后进行处理。）

1.1 k近邻模型

1.1.1 模型

在三要素确定的情况下，根据每个训练实例点

，对特征空间进行划分。

（对每个训练实例点

，距离该店比其他店更近的所有点组成的区域叫做单元）

1.1.2 三要素

1.1.2.1 距离度量

由不同距离度量所确定的最近邻点是不同的。

1.1.2.2 k值的选择

k值过小，模型越复杂，近似误差较小，估计误差增大。越易过拟合。

k值过大，模型越简单，近似误差越大，估计误差减小。

在应用中，k值一般取一个比较小的数值。

1.1.2.3 分类决策规则

常用多数投票法来确定输入实例所属类别；具体而言，在输入实例的所有k个最近邻训练实例中，属于同一类别的样本数量占多数。

误分类率：

为了将分类错误率降到最低水平，并使其等于经验损失的最低水平，多数投票规则实际上等同于实现了经验损失的最低化。

1.3 k近邻法的实现：kd树

如何对训练数据进行快速k近邻搜索？

（1）线性扫描：计算输入实例与每个训练实例的距离。不可行。

（2）kd树方法

1.3.1 构造kd树

kd树是二叉树，表示对k维空间的一个划分。

1.3.2 搜索kd树

假设实例点呈随机分布，则采用kd树进行搜索可获得平均时间复杂度为O(logN)的结果；相比于其他方法，在数据维度远小于实例数量的情况下（即当空间维数低于训练数据规模时），kd树算法表现出显著的优势。

当空间维数接近训练实例数时，它的效率会迅速下降，几乎接近线性扫描。

2 k邻近算法（回归）

在回归算法中常用均值法来处理问题，在这k个样本中取其实际输出值的算术平均数作为预测结果。此外还可以根据样本间的远近程度来进行加权计算，在这种情况下离得较近的数据点会被赋予更高的权重。

参考文献：

【1】统计学习方法，李航

【2】机器学习，周志华

全部评论 (0)

还没有任何评论哟~

机器学习算法：k近邻法（k-NN）

分类与回归算法，多分类。三个基本要素：K值的选择，距离度量，分类决策规则。 1k近邻算法（分类）最近邻算法：k=1的k近邻法。即对于输入的实例点x（特征向量），最近邻法将训练数据集中与x最邻近点的...

机器学习：K近邻算法（K-NN）

K近邻（KNearestNeighbor,KNN）是一种最经典和最简单的有监督学习方法之一，它非常有效而且易于掌握。 1K近邻算法概述一个样本与数据集中的k个样本最相似，如果这k个样本中的大多数属于...

k近邻（k-NN）算法

k近邻算法的基本概念，原理 K最近邻kNearestNeighbor，KNN分类算法，是一个理论上比较成熟的方法，也是最简单的机器学习算法之一。 K近邻算法原理即是给定一个训练数据集，对新的输入实例，...

K-NN(k近邻算法)

初识KNN（kNearestNeighbor）：KNN（k近邻算法）是一种常用的监督学习方法，其工作机制非常的简单：给定测试样本，基于某种距离度量找出训练集中与其最靠近的k个训练样本，然后基于这k个“...

机器学习系列（3）——k近邻法（k-NN）

本文介绍k近邻法（knearestneighbor,kNN）和kd树算法。 0x01、k近邻法简介 k近邻法是基本且简单的分类与回归方法。k近邻法的基本做法是：对给定的训练实例点和输入实例点，首先确定...

机器学习基础算法 (六)-k 最近邻算法（k-Nearest Neighbors, k-NN）

目录 1.k最近邻算法原理 2.Python实现k最近邻算法 3.模型评估与调优 4.总结在机器学习领域中，k最近邻（kNearestNeighbors,kNN）算法以其简单、直观且易于理解的特点，...

K最近邻算法（K-NN）

KNN是什么？ K最近邻算法是一种简单但目前最常用的分类算法，也可用于回归。 KNN没有参数（不对数据潜在分布规律做任何假设），基于实例（不建立明确的模型，而是通过具体的训练实例进行预测），用于监督学...

机器学习-交叉步之k-NN＜k近邻法＞

KNearestNeighborkNNK近邻法 Atypeoflazylearning Overview kNN算法是一种简单，直观的分类与回归方法，这里主要讲述kNN在分类问题中的运用。

k-近邻算法实现(k-NN)

算法思想：计算目标与样本库中所有样本的距离，根据计算出来的距离将所有样本由近到远进行排序，取出前k个样本，将这k个样本中出现次数最多的类型作为目标的类别。

K-NN(k近邻算法)基础

对于二维数据集，可以画出所有可能的测试点的预测结果，根据平面中每个点所属的类别，对平面进行着色，这样可以查看决策边界。即算法对类别0和类别1的分界线：用下面的代码分别将1、3、9个邻居三种情况的决策...

是否确定退出登录?

机器学习算法：k近邻法（k-NN）

1 k近邻算法（分类）

1.1 k近邻模型

1.1.1 模型

1.1.2 三要素

1.1.2.1 距离度量

1.1.2.2 k值的选择

1.1.2.3 分类决策规则

1.3 k近邻法的实现：kd树

1.3.1 构造kd树

1.3.2 搜索kd树

2 k邻近算法（回归）

全部评论 (0)

相关文章推荐

机器学习算法：k近邻法（k-NN）

机器学习：K近邻算法（K-NN）

k近邻（k-NN）算法

K-NN(k近邻算法)

机器学习系列（3）——k近邻法（k-NN）

机器学习基础算法 (六)-k 最近邻算法（k-Nearest Neighbors, k-NN）

K最近邻算法（K-NN）

机器学习-交叉步之k-NN＜k近邻法＞

k-近邻算法实现(k-NN)

K-NN(k近邻算法)基础