Advertisement

监督学习与无监督学习(机器学习笔记一)

阅读量:

文章目录

    • 前言
    • 一、应用领域
    • 二、定义
    • 三、分类

前言

最近,在网易云课堂平台系统中研习了吴恩达老师的《机器学习》课程。

一、应用领域

机器学习是人工智能的一个重要分支,目前主要的应用方向包括以下四类:
1、数据挖掘
互联网和自动化发展过程中产生了大量数据,例如网络浏览数据、医疗数据等,机器学习提供了一个很好的分析和使用这些数据的途径。
2、输入变量太多而无法手动编写代码的应用
在自动驾驶、手写字体识别、自然语言识别、计算机视觉等领域,涉及到的变量千变万化,人们很难编写出一个确切的算法程序来应对各种情况的输入。而机器学习算法可以自动分析大量的输入数据并找出最优的结果。
3、私人订制化的程序代码
我们在淘宝或亚马逊上购物时,网站会根据每个人的喜好来推荐相应的产品,网站不可能专门为每个人写一个产品推荐的代码,而通过机器学习可以达到这个目的。
4、理解、模拟人类的学习方法,实现真正的AI。

二、定义

关于机器学习目前尚未形成统一且广泛认可的定义, 即使在经过长时间的研究和发展后, 依然存在诸多不同的理解与解释. 这种状况源于1959年Arthur Samuel提出的观点: 机器学习是赋予计算机无需显式编程而自主学习的能力. 即使如此, 该学科领域的核心目标仍然是探索如何在无需具体编程的情况下赋予计算机自主学习的能力.

1988年Tom Mitchell提出了一个更为具体的定义:计算机被称为能够在任务T上通过性能指标P来学习,并从经验E中获得改进。即,在执行任务T时,当性能指标P随着经验E的增长而提升时,则认为该系统是从经验E中学习。

三、分类

现在广泛采用的主要有两种算法分别是有标签学习(supervised learning)和无指导学习(unsupervised learning)。

监督学习
所谓监督学习就是在有成功经验可循的情况下的学习。我们有大量的输入数据(或者称之为特征,x),并且知道每一组输入特征x对应输出的“正确答案”y。我们的算法负责找出y与x之间最优的函数映射关系y=f(x),这样,当我们有一组数据库中没有的新的输入特征x’时,我们就可以利用算法找到的函数f来估计对应的输出了:y’=f(x’)。
这里,如果y是价格、气压、温度等可连续变化的值,我们称其为回归(regression)问题,监督学习过程实际上就是我们在做实验时经常用到的拟合的过程。而如果y只能取一系列离散的值,我们称其为分类(classification)问题,监督学习的过程就是要判断每一组特征对应的是哪一种结果,例如判断一封邮件是否垃圾邮件、判断一个手写的数字是几、判断一张动物照片是什么动物等。

无监督学习
即为无监督学习就是在缺乏成功案例的情况下进行的学习。我们仅有一组输入特征x,并未提供明确的答案y。在这种情况下,学习算法一般会识别这些特征x之间的关联。例如,在聚类算法中(如K-means),其主要功能是依据各组x的独特属性进行分类,并将它们划分为若干个有共同特性的群体。

吴老师的课程核心内容仍然是围绕监督学习算法展开的。在下一章中,则会系统地从最基础的监督学习算法——线性回归开始逐步深入。

全部评论 (0)

还没有任何评论哟~