特征选择，熵，条件熵，信息增益

阅读量：

特征选择，熵，条件熵，信息增益

特征选择
例子
熵
条件熵
信息增益
- 例子

特征选择

特征选择过程旨在筛选出能显著提升分类器学习效率的特征指标。在实践中发现，在理论上无分类能力的特征变量，在经验应用中舍弃这类变量通常不会对最终分类结果产生显著影响。通常情况下而言，在理论研究与实践经验结合下所采用的标准通常是信息增益或信息增益比这两种指标作为主要依据

例子

上表包含15个实例构成的贷款申请训练数据集，在数据中包括贷款申请人4个方面的特征（年龄、有工作的状况、拥有住房的情况以及信贷记录），最后一列标记为类别。在特征选择中涉及决定使用哪一个特征来划分特征空间，并确定哪一个特征作为根节点的可能性。

从直观上看，在选择一个特征时，默认情况下认为该特征具有更强的分类能力，并且通过将训练数据集分割成多个子集后，在这些子集中该特征的表现是最优的。这种情况下，则认为应优先选择该特征；信息增益能够有效地反映出这一准则。

熵

信息论中，熵度量了信息的不确定性程度。定义X为一个取有限个可能值的离散型随机变量，则其概率质量函数定义为 $P(X = x_i) = p_i$ （其中 $i=1, 2, \dots, n$ ）。由此可得熵 $H(X)$ 的计算公式： $H(X) = -\sum_{i=1}^n p_i \log p_i$ 其中当 $p_i=0$ 时定义其对数为0。根据这一规定可知 $H(X)$ 的有效取值范围为 $[0, \log n]$

条件熵

考虑随机变量对(X,Y)，它们的联合概率分布函数为：
$P(X=x_i,Y=y_j)=P_{ij}$ ，
其中 $i,j$ 分别取值于 $(1,2,\dots,n)$ 和 $(1,2,\dots,m)$ 。
具体而言，在给定随机变量 $X$ 的前提下计算出的 $Y$ 的信息量，
即条件熵 $H(Y|X)$ ，
可表示为各状态 $x_i$ 下的条件熵加权平均值：

H(Y|X) = \sum_{i=1}^n p_i H(Y|X=x_i)

特别地，在统计学习中使用经验数据估计这些概率时，默认定义当某事件的概率估计值为零时的情况处理方式：
即令

0 \cdot \log 0 = 0

信息增益

信息增益表征了特征X相对于类Y的信息不确定性减少的程度。
对于训练数据集D和特征A来说，在决策树学习中，
其信息增益 $g(D,A)$ 被定义为集合D的经验熵 $H(D)$
与其在给定条件下经验条件熵 $H(D|A)$ 之间的差异：

g(D,A) = H(D) - H(D|A)

其中，
经验熵与条件熵之差即为互信息。
基于此，
决策树学习中的特征选择依据正是最大化该差异，
也就是最大化类与特征之间的互信息。
具体而言，
根据给定准则选择特征的方法是：
基于训练数据（或其子集）D，
计算每个可能特征相对于该数据集的信息增益，
并比较这些值的大小，
最终选取具有最大信息增益的那个特征作为分割标准。

例子

全部评论 (0)

还没有任何评论哟~

特征选择，熵，条件熵，信息增益

特征选择，熵，条件熵，信息增益特征选择例子熵条件熵信息增益例子特征选择特征选择是在于选取能够提高分类器学习效率的特征。对于没有分类能力的特征，经验上扔掉这样的特征对最终的分类结果并没有...

信息熵、条件熵、信息增益

信息熵信息熵是度量离散随机变量的不确定性的指标。不确定性越大，信息熵的值越大。公式如下：HX=\sumi=1^npxi\log2pxi其中：𝑝𝑥𝑖代表随机事件𝑥𝑖的概率。单看公式太抽象，...

信息量、信息熵、条件熵、信息增益

信息量有时候，当你知道某件事情的时候，你可能会说“这有什么奇怪的啊”，比如，有同事告诉你“明天太阳从东边升起”，这就是说这件事情的信息量比较少。又比如，当你知道明天彩票号码时，你就可能会说“这个事...

【概率论】——熵、条件熵、信息增益

熵的含义：在信息论中，熵（英语：entropy）是接收的每条消息中包含的信息的平均量，又被称为信息熵、信源熵、平均自信息量。这里，“消息”代表来自分布或数据流中的事件、样本或特征。（熵最好理解为不确...

信息增益，信息增益率，信息熵，互信息，交叉熵，条件熵，gini系数

（一）信息熵（二）信息增益（ID3算法） Gain（A）=IAHA 信息增益的理解：对于待划分的数据集D，其entroy前是一定的，但是划分之后的熵entroy后是不定的，entroy后越小说明使用...

特征工程：信息熵、信息增益、信息增益率

信息增益和特征工程特征工程（featureengineering）中很关键的一个组成部分是特征选择（featureselection）。特征选择是一个重要的“数据预处理”（datapreproces...

树模型中分裂特征选择标准--信息熵，信息增益，信息增益率的计算

熵：集和的熵值sumpilogpi,2 2.信息增益：集和的熵按照特征a划分后子集的熵加权和（偏向类别数目多的属性） 3.信息增益率：信息增益/属性的熵（偏向类别数目少的属性） 4.基尼值：1集和各类...

熵，条件熵，信息增益，信息增益比, gini系数以及交叉熵，相对熵计算公式

熵，信息增益和gini系数熵越大，不确定性越大熵：HX=E[logpk]=\sumkpk\logpk 信息增益，就是给定条件前的熵减去给定条件后的熵，看熵减少多少条件熵：HXY=\sumypYy...

信息熵（entropy）、交叉熵（cross entropy）、条件熵、信息量增益、相对熵（relative entropy）

目录信息量熵交叉熵条件熵信息量增益相对熵信息量InformationQuantity 已知事件E已发生，这一消息含有或提供了信息量。依次掷两颗骰子。定义事件：两个骰子的点数之和是2；事...

条件熵和信息增益的关系,怎么理解条件熵？

在学习决策树的过程中,在ID3算法和C4.5算法中用到了熵,信息增益。那么条件熵和信息增益有什么关系呢? 目录一.信息熵二.条件熵三.信息增益四.条件熵和信息增益的关系五.怎么理解条件熵 1...

是否确定退出登录?

特征选择，熵，条件熵，信息增益

特征选择，熵，条件熵，信息增益

特征选择

例子

熵

条件熵

信息增益

例子

全部评论 (0)

相关文章推荐

特征选择，熵，条件熵，信息增益

信息熵、条件熵、信息增益

信息量、信息熵、条件熵、信息增益

【概率论】——熵、条件熵、信息增益

信息增益，信息增益率，信息熵，互信息，交叉熵，条件熵，gini系数

特征工程：信息熵、信息增益、信息增益率

树模型中分裂特征选择标准--信息熵，信息增益，信息增益率的计算

熵，条件熵，信息增益，信息增益比, gini系数 以及 交叉熵，相对熵 计算公式

信息熵（entropy）、交叉熵（cross entropy）、条件熵、信息量增益、相对熵（relative entropy）

条件熵和信息增益的关系,怎么理解条件熵？

熵，条件熵，信息增益，信息增益比, gini系数以及交叉熵，相对熵计算公式