Mean shift 算法

阅读量：

常用的聚类算法除了K-means外，还包括MeanShift和AP算法。在此基础上，我们来系统地介绍MeanShift的基本原理和应用。

Mean shift基本思想

Mean shift将特征空间视为满足某种概率分布的概率密度函数这一假设，则输入样本点被视为服从该分布的一组独立样本点。这种情形下，在特征空间中数据最密集的区域对应着概率密度最大的区域范围，并且该区域内概率密度的质心位置即为该区域的概率密度函数的局部最优解，也就是我们所求取的聚类中心位置。

对于每个样本点x_i，在其周围区域内计算所有其他样本点x_j（j≠i）的均值 $\frac{1}{N}\sum_{j≠i}x_j$ 作为新的中心位置x_i'。通过不断迭代更新位置直至达到稳定状态（即收敛条件满足）。每一次迭代都会使各中心位置逐渐向数据密度更高的区域靠拢。

伪代码可以写成：

复制代码

    重复移动直至收敛｛
    对每一个数据点，固定一个窗口（数据范围）：
    计算窗口内数据的中心；
    移动窗口至新的中心
    ｝

###完成中心的平移过程？### 可以通过计算概率密度的梯度来实现其方向即为概率密度增长最快的方向从而也就指向了数据分布最密集的方向 ####预备知识#### - 核 Kernels : 核是满足如下条件的函数：

常见的核函数包括 :

1. Rectangular

hi=egin{cases} 1 & aeq xeq b 0 & elsend{cases}

2. Gaussian

3. Epanechnikov

hi=egin{cases} rac{3}{4} & if|x|eq1 0 & elsend{cases}

- 核密度估计 Kernels Density Estimation :

核密度估计算法是一种基于非参数统计方法用于估算概率密度分布的技术，
亦称Parzen窗技术。
给定一个核函数Kernel以及带宽 h（简称为bandwidth），对于d维数据样本点
x₁, x₂, ..., xₙ，
核密度估计算法的具体表达式描述如下：

{isplaystyle at{f}=rac{1}{nh{d}}\sum_{i=1}{n}Keft}

- Mean shift的梯度下降计算

对概率密度求梯度 ,

igtriangledown{isplaystyle at{f}=rac{1}{nh{d}}\sum_{i=1}{n}K'eft}

令梯度为0,

{isplaystyle um_{i=1}{n}K'\left(\frac{x-x_{i}}{h}\right)\overrightarrow{x}=\sum_{i=1}{n}K'eftverrightarrow{x_{i}}}

最后可得到中心的变化

{isplaystyle verrightarrow{x}=rac{um_{i=1}{n}K'\left(\frac{x-x_{i}}{h}\right)\overrightarrow{x_{i}}}{\sum_{i=1}{n}K'eft}}

总结

将每个样本点视为窗口的核心位置，并继而确定最终核心位置；属于同一核心位置的所有样本即被视为同一类别。

记

, 有

{isplaystyle m=rac{um_{i=1}{n}g\left(\frac{x-x_{i}}{h}\right)x_{i}}{\sum_{i=1}{n}geft}-x}

就是 mean shift. 所以mean shift过程可被总结为 : 对每一个样本点

1. 计算mean shift 向量

2. 移动概率估计窗

3. 重复上述过程直至收敛

以高斯核为例,

{isplaystyle y_{i}{t+1}=\frac{\sum_{i=1}{n}x_{j}e{\frac{-|y_{i}{t}-x_{j}|{2}}{h{2}}}}{um_{i=1}{n}e{rac{-|y_{i}{t}-x_{j}|{2}}{h^{2}}}}}

Mean shift VS. K-Means

K-Means 作为一种广为人知的聚类技术，并且具有良好的适用性。接下来可以从参数数量的角度比较这两种聚类方法。

对于K-means算法而言，它不仅要求提供指定数量的聚类中心，并且其生成的聚类结果通常呈现出较为规则的几何形态；相比之下，在不必要提供预先设定的数量化指导的同时也不需考虑特定的几何形态的情况下，则是Mean shift方法作为一种基于非参数估计的技术。

在使用K-means算法时需预先设定聚类中心位置，并且不同的初始设置会导致最终形成的聚类结果有所差异；相比之下, Mean shift算法由于其独特的机制——即从每个数据点或者在特征空间中均匀采样来选择初始中心——表现出很强的鲁棒性；值得注意的是,K-means算法较为容易受到异常数据的影响,而Mean Shift则表现出较好的抗噪声能力

K-means 速度比较快，时间复杂度为

其中 $k$ 表示聚类中心的数量, $n$ 表示样本点的数量, $T$ 表示迭代次数. 一般而言, mean shift算法在计算时间上的消耗较大,其时间复杂度为 $O(n^2kT)$

带宽参数的选择对Mean shift影响很大,带宽

选的小时收敛速度慢；

选的大时虽然会加速收敛但是聚类效果不会很好. 对于

在scikit-learn中包含有多种实现方式和带宽选择技巧。

全部评论 (0)

还没有任何评论哟~

Mean shift 算法

常见的聚类算法除了Kmeans，还有Meanshift及AP。这里先总结一下Meanshift相关知识。 Meanshift基本思想 Meanshift将特征空间视为先验概率密度函数，那么输入就被视为...

Mean Shift 算法总结

一、简介二、具体含义三、细节四、缺点 \ 一、简介 Meanshift的这种思想可以应用于目标跟踪、图像平滑、边缘检测、聚类等，是一种适应性很好的算法，缺点是速度非常慢。

Mean Shift 聚类算法

MeanShift聚类算法一、meanshift算法理论 Meanshift算法是基于核密度估计的爬山算法，可用于聚类、图像分割、跟踪等，因为最近搞一个项目，涉及到这个算法的图像聚类实现，因此这里做...

Tracking算法学习之mean-shift——Robust Scale-Adaptive Mean-Shift for Tracking

原文地址：【<http://www.sciencedirect.com/science/article/pii/S0167865514001056】一、传统的MeanShift 原文地址：【http...

图解Mean-Shift聚类算法

前期回顾 KMeans聚类算法—算法原理、质心计算、距离度量、聚类效果评价及优缺点与KMeans算法不一样的是，MeanShift算法可以自动决定类别的数目。与KMeans算法一样的是，两者都用集合...

mean shift聚类算法分析

最近看一个车道线识别的算法LaneNet，其中用到了meanshift进行聚类，然后研究了一下这个聚类算法，主要是从代码中了解的，简单记录一下自己的理解，防止以后忘记。meanshiftcode 使用...

Mean Shift 目标跟踪算法（一）

可能很多同道跟我一样，以前也鼓捣过单片机，焊过板子。由于以后学习方向的改变，让我不得不找一个较感兴趣的课题，快速地入门图像处理、机器视觉中来。我的第一个课题是目标跟踪，使用的经典算法MeanShift...

Mean-shift算法的直观理解

Meanshift算法的直观理解0前言暑假的时候参加移动计算竞赛打了下酱油，接触到了Meanshift算法，用于做目标跟踪。在那段时间也在网上查阅了不少关于这个算法的资料，可是总感觉它们都比较强调这...

KMeans，KNN，Mean-shift算法的学习

1.KMeans算法是什么？在没有标准标签的情况下，以空间的k个节点为中心进行聚类，对最靠近他们的对象进行归类。 2.KMeans公式： 2\.1.关键分为三个部分： 1.一开始会定义n个中心点，然...

mean shift tracking

meanshift均值漂移算法目标跟踪中的经典之经典，在opencv中已经帮我们实现了这个算法，即如下函数 //!updatestheobjecttrackingwindowusingmeanshif...

是否确定退出登录?

Mean shift 算法

Mean shift基本思想

总结

Mean shift VS. K-Means

全部评论 (0)

相关文章推荐

Mean shift 算法

Mean Shift 算法总结

Mean Shift 聚类算法

Tracking算法学习之mean-shift——Robust Scale-Adaptive Mean-Shift for Tracking

图解Mean-Shift聚类算法

mean shift聚类算法分析

Mean Shift 目标跟踪算法（一）

Mean-shift算法的直观理解

KMeans，KNN，Mean-shift算法的学习

mean shift tracking