人工智能、机器学习和深度学习三者的关系
在当前研究领域中深入探讨其发展历程,并对其相关技术如人工智能、机器学习以及深度学习进行详细分析。
那些推动人工智能发展的先驱者 gather 在达特茅斯会议期间时就曾有一个远大的理想:通过当时的新型计算机系统来构建一个与人类智能相当复杂的机器。这正是“通用人工智能”的概念(General AI),它不仅拥有超越人类五感(甚至增添更多感官)、具备超凡推理能力和模仿人类思维方式的独特设计。这些机器人已经在电影和其他艺术作品中频繁出现——从友好型机器人 C-3PO 到反人类机械人终结者都是其代表作。而像终结者这样的反人类机械人也经常被提及。然而目前这项技术仍只存在于影视作品与科幻小说中:因为尚无人能够实现这一目标——至少目前为止还没有人成功做到
我们能够实现的部分即属于"弱人工智能"领域(Narrow AI):其核心是完成特定任务的能力达到或超过人类水平,并且有时甚至超越了人类的能力范围。在现实中有许多实际应用案例涉及这一领域。其中具备一定程度的人工智能特性。然而就其机制而言仍存在诸多疑问:其智能来源何在?这引出了一个关键问题:如何使机器获得智能?
作为一种核心技术手段,在人工智能领域发挥着关键作用的机器学习,在其发展过程中已形成多个具有代表性的核心算法体系。其概念可追溯至人工智能领域的开拓性研究者,在这一过程中已发展出包括决策树学习、归纳逻辑编程、强化学习以及贝叶斯网络等多种核心算法。简而言之,在数据驱动型的学习框架下,“让计算机从数据中自动生成模型并作出推断或预测”的目标成为可能。与传统方式不同的是,“让计算机从数据中自动生成模型并作出推断或预测”的目标不仅推动了相关技术的发展与创新。
许多年来,
计算机视觉技术一直是机器学习中一个重要的领域,
虽然需要大量人工编码才能完成任务。
研究人员会手动编写一些分类器(如边缘检测筛选器),
帮助程序识别物体边界;
另外还有图形检测分类器,
能够判断物体是否有八个面;
以及专门识别"S-T-O-P"模式的分类系统。
在此基础上开发图像理解算法,
并学习如何判断是否存在停止标志。
但是由于计算机视觉和图像检测技术的滞后,经常容易出错。
深度学习是机器学习的主要应用之一。最初期的研究者开发了一种称为人工神经网络的技术,在经过几十年的发展后却长期未被重视。受其灵感的是生物体内的生物电活动模式:其中每个细胞都与其所处环境及周围细胞之间建立特定联系形成复杂的网络系统
比如你可以说取一张图片将其切割成若干小块这些小块会被作为输入传递给一个深度学习模型每一层次都会经过一系列的数据变换以完成特定的任务这一过程持续到最后一个层级模型才会输出最终的结果
每个神经元都会对输入赋予一个权重值:其与执行特定任务相关的准确性指标。这些权重共同决定了网络最终的输出结果。进而我们再详细探讨之前提到的停止标志示例:一张停止标志图像会被系统逐一分析其属性特征——形状、颜色、字符、标志大小以及是否处于运动状态等关键要素都被神经元进行识别判断。基于这些特征信息网络会生成一个概率分布向量(probability distribution vector):其中系统会给出该图像被判定为停止标志的概率值以及与其他可能类别(如限速标志)的概率分布情况。最后系统会根据计算出的概率结果向人工判断者反馈判断结果并完成整个分类过程
尽管如此即使最基础的神经网络也需要消耗巨大的计算资源因此当时并不被认为是可行的方法然而以多伦多大学 Geoffrey Hinton 教授为首的少数坚定研究者坚持使用这种方法最终使得超级计算机能够同时运行这一算法从而验证其有效性如果我们回到那个停止标志的例子很可能由于受训练的影响神经网络会频繁给出错误的答案这表明必须持续不断地进行训练它需要成千上万张图片甚至数百万张图片来进行训练经过一段时间后神经元输入层的权重得以调整至非常精确的状态这样几乎每次都能提供正确的答案值得庆幸的是Facebook成功地通过使用神经网络记住你的面部特征而实现了这一目标而在2012年吴恩达在谷歌公司实现了可以识别猫类动物图像的独特的人工智能系统
如今,在某些情况下,经过深度学习训练的机器在图像识别方面已超越人类;这包括找猫、识别血液中的癌症迹象等。AlphaGo学会了围棋,并为比赛进行了大量训练:它不断与自己对弈。
如今,在某些情况下,经过深度学习培训的人工智能系统在图像识别任务中已超越人类水平,具体包括能够快速定位宠物并准确找到它们的眼睛位置等技术细节.该系统还能够在复杂场景中进行目标检测,例如发现交通标志并自动调整以避免碰撞.此外,这些系统还能处理医学影像,帮助医生发现早期疾病.当Google的AlphaGo学会下棋后,它立即投入大量时间进行练习:反复与自身对弈以提高技巧
