Advertisement

浅谈人工智能之机器学习,机器学习之监督学习

阅读量:

浅谈机器学习与深度学习的区别

在当今社会发展的这一阶段

那么,在探讨弱人工智能如何实施时会遇到一个难题;而机器学习作为一种实现AI的关键途径;简单地说:机器学习通过算法解析数据、加以学习、对预测部分进行预测;下文将详细阐述监督学习与无监督学习这两种方法是如何帮助系统完成具体任务的。

实际上,在人工智能领域中主要分为两个领域:一个是基于规则的方法(rule-based),也就是上文提到的机器学习方法;另一个是基于神经网络的方法(neural network)。人们不再满足于将人类的逻辑规则直接传授给计算机系统;而是直接模仿人脑的结构,在机器中构建类似生物神经元网络的架构。具体而言,在深度学习中的人工神经网络(Artificial Neural Networks)模拟了人类神经元之间的连接方式,并构建出独特的人工神经网络架构。这个体系通常由独立层组成(layers),层与层之间具有特定的连接方式(connection patterns),信息传递方向明确(direction of information flow)。以抽取一张猫图片为例:首先将图片分割成许多小块;然后将这些数据输入到第一层人工神经元;每一层独立的神经元会依次接收并传递数据;经过层层传递处理后,在最后一层生成最终结果。(此处用****表示技术术语标记)

机器学习之监督学习

1000, 1000000

在监督学习中使用的数据集包含了特征向量与对应的标签信息。例如,在基于公交车到站状态的预测系统中,其分类标签分为‘到站’(标记为1)和‘未到站’(标记为0)。分类与回归算法作为监督学习的核心技术具有重要意义——其中分类任务的目标变量通常是离散型数据;而回归任务的目标变量则属于连续型数值。例如,在判断公交车是否准时到达的例子中属于分类问题;如果通过一个人的职业背景、教育程度以及工作单位等信息来预测其收入水平,则因为收入通常表现为一个连续型数值范围(如y∈[1, 1,0]),因此目标变量y则取值于区间[1, 1,0]之间。监督学习主要可分为训练阶段与预测阶段两大模块:其中训练阶段包括数据获取、特征提取与模型训练;而预测阶段则涉及模型构建与应用两大部分。具体而言,在训练过程中需完成以下步骤:首先获取高质量的数据集;其次从数据集中提取有用特征;然后基于这些特征进行模型训练;最后对模型性能进行评估验证;而在预测环节则需建立合适的模型,并利用该模型对新样本进行状态推断或结果预测。

在监督学习框架下进行研究时会发现与分类问题不同的是特别强调了回归问题的重要性。具体来说模型通过利用训练数据建立了一个从观测样本到连续值标签的映射关系这一过程不仅简化了复杂的数据分析任务还为后续的研究提供了更为系统的分析方法。这些标签通常表现为一系列连续数值而这些数值往往来源于实际应用场景中的各种测量结果或计算结果例如收入预测任务根据股票的历史价格预测未来股票的价格以及房屋价格预测等实际应用场景中发挥着重要作用。

机器学习之无监督学习

在无监督学习中使用的数据集仅包含特征信息而没有标签。其流程相对简单明了地分为数据获取、特征提取以及无监督学习三个阶段。假设存在M组训练数据,则首先对m个样本进行处理以提取关键信息。随后再通过无监督学习算法对这些样本进行分析与建模。在聚类分析中特别强调的是无需预先定义类别类型,在这种情况下只需要根据样本之间的相似性或异质性来进行分类即可。例如,在生物分类学领域可以通过是否有羽毛或者是否能够在水中呼吸这两种特征来区分鱼类与鸟类这一两类生物体这就是聚类分析的基本思想。聚类分析的关键在于无需预先定义类别类型而在这种情况下只需要根据样本之间的相似性或异质性来进行分类即可。例如在生物分类学领域可以通过是否有羽毛或者是否能够在水中呼吸这两种特征来区分鱼类与鸟类这一两类生物体这就是聚类分析的基本思想

全部评论 (0)

还没有任何评论哟~