机器学习：距离度量

阅读量：

距离度量是数据分析、机器学习和模式识别中用于衡量不同数据点之间相似性或差异性的关键概念。距离度量的选择直接影响着模型的效果，尤其是在基于距离的学习算法（如 K 最近邻算法）中。以下是一些常见的距离度量方法的概述：

1. 欧几里得距离 (Euclidean Distance)

定义: 欧几里得距离是二维或多维空间中两点之间的直线距离，公式为：
$d = qrt{um_{i=1}^{n}^2}$

其中 p 和 q 是两个数据点，n 是特征的数量。

特点:
常用且直观，适用于数值型数据 。
对于高维数据，可能受到“维度诅咒”的影响，即表现差的距离度量。

2. 曼哈顿距离 (Manhattan Distance)

定义: 曼哈顿距离是计算两点之间在各个维度上绝对差值之和 的距离，公式为：
$d = um_{i=1}^{n} |p_i - q_i|$

特点：
也称为“城市街区距离”，因其模拟一条条街道的移动方式。
对于某些数据集或特征值较大时比欧几里得距离更具鲁棒性。

3. 切比雪夫距离 (Chebyshev Distance)

定义: 切比雪夫距离是基于最大差 异来衡量的距离，公式为：
$d = ax_{i}$

特点:
适用于棋盘问题中，表示在水平、垂直方向上的最小步数。
有助于了解最坏情况下的距离。

4. 闵可夫斯基距离 (Minkowski Distance)

定义: 闵可夫斯基距离是一个通用的距离度量，可以看作是欧几里得距离和曼哈顿距离的推广。其公式为：
$d = eft^{1/m}$

其中 m 是一个参数，决定了具体的距离类型：
当 m = 1时，变为曼哈顿距离；
当 m = 2时，变为欧几里得距离。

5. 余弦相似度 (Cosine Similarity)

定义: 余弦相似度用于衡量两个向量之间的夹角大小，主要用于文本数据处理中的相似性衡量 ，公式为：
$ext{cosine} = rac{p dot q}{p q} = rac{um_{i=1}^{n} p_i dot q_i}{qrt{um_{i=1}^{n} p_i^2} qrt{um_{i=1}^{n} q_i^2}}$

特点:
其值在 -1 到 1 之间，值越接近 1 表示越相似。
常用于文本分析和信息检索。

6. 杰卡德相似性 (Jaccard Similarity)

定义: 杰卡德相似性用于衡量两个集合的相似性，计算公式为：
J = rac{|A ap B|}{|A up B|}

特点:
适用于二元数据（如特征存在与否），反映了两个集合的相似程度。

7. 汉明距离 (Hamming Distance)

定义: 汉明距离衡量两个等长字符串之间不同字符的数量，适用于分类和编码理论。

特点:
计算两个字符串或向量之间的位置上不同的元素总数，尤其常用于离散数据或二进制数据。

8. 总结

距离度量作为机器学习及数据分析的重要基础，选择合适的距离度量方法对于提高模型性能至关重要。在实际应用中，选择距离度量时应考虑数据的性质、特征类型和目标任务的要求。

全部评论 (0)

还没有任何评论哟~

机器学习：距离度量

距离度量是数据分析、机器学习和模式识别中用于衡量不同数据点之间相似性或差异性的关键概念。距离度量的选择直接影响着模型的效果，尤其是在基于距离的学习算法（如K最近邻算法）中。

【机器学习】各种距离度量

在机器学习中，会经常与各种距离打交道。于是，在这篇文章中，我们来简单总结一下常见的距离以及其计算方式。首先定义两个向量\veca=x1,x2,\ldots,xn,\vecb=y1,y2,\ldots...

机器学习之距离度量方法

常见的距离度量方法及相关函数、图示如下： 1\.欧几里得距离（EuclideanDistance）函数公式：对于两个n维向量\mathbfx=x1,x2,\cdots,xn和\mathbfy=y1,...

向量的距离单位（深度学习，机器学习）

受我导师启发，他给推荐了个很好用的工具网站，从这个网站上找到了多种距离单位。 <https://pythonot.github.io/all.html 主要看ot.dist这个方法，该方法里面有个参数...

matlab 韩明距离_机器学习——几种距离度量方法比较

1\.欧氏距离EuclideanDistance 欧氏距离是最容易直观理解的距离度量方法，我们小学、初中和高中接触到的两个点在空间中的距离一般都是指欧氏距离。

机器学习--相似度/相异度度量--距离公式

目录一距离性质 1非负性 2同一性 3对称性 4三角不等式二距离度量公式 1闵可夫斯基距离 1）曼哈顿距离（城市距离） 2）欧式距离 3）切比雪夫距离 2标准欧式距离（加权欧式距离） 3马氏距离 ...

四个数据欧几里得距离_机器学习中的度量—— 向量距离

机器学习是时下流行AI技术中一个很重要的方向，无论是有监督学习还是无监督学习都使用各种“度量”来得到不同样本数据的差异度或者不同样本数据的相似度。良好的“度量”可以显著提高算法的分类或预测的准确率，本...

求两个点的欧氏距离_机器学习中的八大距离度量

点击菜单栏“粉丝福利” 拿小度，兑手机！作者：张家豪来源：人工智能学习圈机器学习中往往要考虑向量之间的距离，此时曼哈顿距离，欧式距离，马氏距离等等接踵而至，帮助机器学习模型处理各种各样不同种类的数...

21 | 机器学习中常见距离度量及实现

文章目录机器学习中常见距离度量及python实现 1\.欧式距离 2\.曼哈顿距离ManhattanDistance 3\.切比雪夫距离ChebyshevDistance 4\.闵可夫斯基距离Min...

机器学习中距离和相似性度量方法

在机器学习和数据挖掘中，我们经常需要知道个体间差异的大小，进而评价个体的相似性和类别。最常见的是数据分析中的相关分析，数据挖掘中的分类和聚类算法，如K最近邻（KNN）和K均值（KMeans）等等。根...

是否确定退出登录?

机器学习：距离度量

1. 欧几里得距离 (Euclidean Distance)

2. 曼哈顿距离 (Manhattan Distance)

3. 切比雪夫距离 (Chebyshev Distance)

4. 闵可夫斯基距离 (Minkowski Distance)

5. 余弦相似度 (Cosine Similarity)

6. 杰卡德相似性 (Jaccard Similarity)

7. 汉明距离 (Hamming Distance)

8. 总结

全部评论 (0)

相关文章推荐

机器学习：距离度量

【机器学习】各种距离度量

机器学习之距离度量方法

向量的距离单位（深度学习，机器学习）

matlab 韩明距离_机器学习——几种距离度量方法比较

机器学习--相似度/相异度度量--距离公式

四个数据欧几里得距离_机器学习中的度量—— 向量距离

求两个点的欧氏距离_机器学习中的八大距离度量

21 | 机器学习中常见距离度量及实现

机器学习中距离和相似性度量方法