Mahalanobis距离(马氏距离)的“哲学”解释
讲解教授:赵辉 (FROM : UESTC)
课程:《模式识别》
整理:PO主
基础知识:
假设空间中两点x,y,定义:
欧几里得距离,

Mahalanobis距离,

容易注意到的是,在马氏距离中排除掉协方差矩阵后会等同于欧氏距离。因此我们需要深入探讨这个新增的因素到底蕴含了哪些信息。
第一个例子
位于坡道上的一个长度为50米的路段,在下方设置标志点A,在上方设置标志点B。假设存在两种路径从A到B:第一种路径是从A沿坡道直接通向B点;第二种路径是从A经过C点后再抵达B点。
a)坐手扶电梯上去。
b)从手扶电梯旁边的楼梯爬上去。
两种情况下我们分别会产生两种不同的主观感受:坐电梯时会觉得愉悦轻松且很快捷地抵达了目的地;而步行时则会耗费体力且略显疲惫,并耗时较长才抵达终点站B——" A与B真近~ ";另一方面,则会感受到两者之间的距离感明显减小;而另一方面则会感受到两者之间的距离感非常明显。
第二个例子
当观赏落日时,在因大气层折射作用下,太阳呈现椭圆形,并且其视觉上所处的位置高于实际位置。

解释
看起来与模式识别领域似乎没有直接关联的实际案例却都涉及到了相对论这一概念。回到问题本身,在所有类别出现概率相等的情况下欧式距离可被视为一个基准值它表征的是不同类别之间的平均区分度。此时分类器的决策边界位于两个类别均值之间的中点位置如图1所示而当各类别先验概率不均衡时显然仅以中垂线作为分类边界是不够合理的将会导致误判情况(如将绿色类样本误判为红色类)假设图1中的绿色类别先验概率增大则新的分类边界会向左侧移动至图2所示的黄线位置具体平移程度需通过马氏距离这一指标来确定在马氏距离计算过程中引入了协方差参数这一参数表征了数据分布的空间密度情况从而能够更好地适应不同数据集的空间特性


图1图2
从哲学角度看,在运用马氏距离进行数据处理时
(完)
