Advertisement

机器学习入门之非监督学习和半监督学习

阅读量:

文章目录

    • 非监督学习
    • 半监督学习
    • 机器学习的核心价值

非监督学习

而非监督学习中,其训练数据集是不带标签的数据,其核心任务就是专注于聚类操作

基于给定的数据,在进行聚类分析时所提取的关键特征几乎完全由这些数据的固有属性决定。其核心功能就是对这些数据进行自动化的分类或分组。

在机器学习领域中广受欢迎的非监督学习算法包括K均值聚类(K-Means Clustering)、层次聚类(Hierarchical Clustering)、主成分分析法(Principal Component Analysis, PCA)、DBSCAN以及深度信念网络模型(Deep Belief Network)等方法。

半监督学习

半监督学习主要采用的是应用最广泛的方式之一。与我们的人生学习过程有诸多相似之处,并非所有的知识都能通过他人传授的方式获得,总需要我们自主进行理解和总结的过程。

他的形式化的定义如下

给定一个遵循某种位置分布的带标签实例集合\{(x_1,y_1),(x_2,y_2),\dots,(x_k,y_k)\}其中每个x_i代表一个观察样本而每个y_i对应其相应的类别标签;接着还有一个未被标注的数据集U=\{x_{k+1},x_{k+2},\dots,x_{k+u}\}其中变量u表示该无监督数据集中的样本总数

我们致力于让模型经过训练后能够学习并完成某个特定的任务,并且该模型能够准确地对未标记的数据进行标签预测。

虽然这种说法虽然抽象但它却与我们日常的学习经历有着相似之处 比如说举个例子来说 在解决某一类数学问题时 一开始的时候可能会感到困惑或不知道如何入手 但只要通过仔细查阅相关资料 最终能够深入理解题目背后的动机以及解决的基本思路 这样就能解决类似的问题了

那其实半监督学习就是将已知的信息扩大到未知领域的过程

包括生成式方法、基于图的结构、SVM模型以及聚类技术等多种技术

机器学习的核心价值

机器学习算法的主要目的是承担从历史数据中发现模式的任务,并根据总结出的模式推断出未知的数据特征。

全部评论 (0)

还没有任何评论哟~