【斯坦福公开课-机器学习】1.机器学习的动机和应用(吴恩达 Andrew Ng)
文章目录
-
0三个目标
-
0先修课程要求
-
- 基本工具
-
- 1-网址
- 2-邮箱
- 3-本系列课程链接
-
1机器学习的定义
-
- 1-1非正式定义
- 1-2正式的定义
-
2有监督学习(Supervised Learning)
-
- 2-1回归分析——连续拟合线(预测房价)
- 2-2分类分析——离散数据集(区分恶性肿瘤与良性的肿瘤)
-
4强化学习(Reinforcement Learning)
-
0三个目标
- 认识到机器学习绝对是一个激动人心的领域。
- 可以将最新的机器学习算法应用于各个领域的问题上。
- 修完这门课程后仍然对深入探索机器学习的研究充满兴趣。
0先修课程要求
- 计算机科学的核心内容 ,包括算法效率评估标准(如大O),以及数据存储与操作的常见方式(如队列、栈、二叉树等数据结构)。
- 数学分析的基础 ,涵盖积分方法及其应用。
- 线性代数的核心概念 ,包括矩阵运算、向量空间及其逆矩阵的应用。
- 概率论与数理统计的基础理论 ,涉及随机变量分析及期望值与方差计算。
基本工具
MATLAB、Octave。
##基本资源
1-网址
2-邮箱
3-本系列课程链接
http://open.163.com/special/opencourse/machinelearning.html
1机器学习的定义
1-1非正式定义
在直接面对问题进行编程的情况下,发展计算机学习能力的一个研究领域

1-2正式的定义
当给一个计算机程序赋予任务T以及用于评估性能的方法P时,在基于经验E的影响下,若其评估结果得到了提升,则称该程序从经验E中学习。

2监督学习(Supervised Learning)
监督学习:基于训练数据集建立一个函数或模型,并通过该模型对新输入的数据集进行推断结果或评估其性能特征。监督学习要求训练数据中包含输入变量与输出变量(即特征与目标属性),其中目标属性由人工标注完成。监督学习的主要算法包括回归分析(如线性回归、逻辑回归)、随机森林以及统计分类方法等。
2-1回归问题——连续拟合线(预测房子价格)
基于一批房子面积\textbf{面积}与对应价格\textbf{价格}的数据集进行学习训练后,能够生成一条直线或曲线\textbf{模型}.利用该模型对后续每一个新的输入进行预测.

2-2分类问题——离散数据(恶性和良性肿瘤)
基于输入数据的各种特征参数,在线训练出一套能够识别'有肿瘤与无肿瘤'两类情况的二分类模型(即该系统的核心技术),之后可以通过该模型来进行诊断。
- 一维输入变量特征 ——肿瘤大小

- 二维输入变量特征 ——肿瘤大小和年龄

- 多维输入变量特征 (实际问题)——支持向量机算法
支持向量机算法 :把无限维空间的数据映射存储到计算机中。
#3 无监督学习(Unsupervised Learning)
无监督学习:与监督学习相比,在这种情况下训练数据集未被人工标注结果信息所影响,并且仅提供输入数据而没有任何对应的目标变量信息。
常见的无监督学习算法包括K-Means和DBSCAN等聚类算法。
总体而言,在无监督学习中,系统或算法通常会提供一组数据样本,并不会预先设定明确的答案或目标。随后的问题可能是这样的:"你能从这些数据中发现什么有趣的东西吗?"这正是无监督学习的核心思想——通过分析和识别潜在的模式或结构来发现隐藏的知识。因此,在这种情况下,并不需要设定标准答案来衡量结果的好坏。
聚类问题 ——无监督学习的第一步。
比如将人群划分为两类——男性和女性,并未得到预期的目标结果需要注意的是这与监督学习的分类问题不同

独立组件分析:在充满噪声的环境中识别特定说话者的声音特征,并确保各个麦克风捕获的声音强度有所差异。

基于无监督学习的技术用于将声音信号分解为独立的来源ICA算法(Independent Component Analysis) ,其中该算法通过奇异值分解实现这一目标:[W,s,v] = svd( (repmat(sum(x.*x,1), size(x,1), 1). *x) *x’)

无监督学习的应用领域:解析基因数据信息、图像像素级别的分类任务、生成三维模型结构、市场分析人员进行分类研究以及天体观测数据的分类分析等。

4强化学习(Reinforcement Learning)
强化学习 是一种基于行为观察的学习方法。个体通过掌握具体动作的技术细节来进行行为练习,在每一个动作执行后都会对周围的环境产生影响,并且个体会根据对周围环境变化的反馈来进行决策调整。
基于一系列科学合理的决策方案的应用,在实际操作中可以让飞行器持续保持稳定的飞行状态。随着经验的不断积累和能力的不断提升,在理论上逐渐掌握并实现对自身行为的有效调控,并通过持续积累提升其所得的正向反馈机制(回报函数)。

强化学习类似于这样的场景 :你正在训练一只宠物狗狗,在它表现出让你满意的动作时给予 Positive reinforcement(积极强化),而在其犯错时则实施 Negative reinforcement(负强化)。经过长期的训练后,你的宠物逐渐学会了识别正确的动作并获得更多的积极反馈。

强化学习的核心:确定一种方法来明确你的目标是什么?区分什么是优秀行为与不良行为的标准是什么?必须设计一个能够不断学习并优化策略的算法系统,在提升奖励的同时尽量减少负面的影响。
原
斯坦福公开课-机器学习
Wu_Bing 博客声明
假如你阅读完这篇博文,并觉得对你很有帮助的话,并且愿意支持赞助费的支出,则我会更加有动力继续创作。
