深度学习|引介:未来已来
文章目录
-
- 机器学习领域中的高级技术
-
-
机器学习算法基础
-
基于深度的学习机制
-
数据驱动的分析与决策过程
-
工作流程概述
-
必要知识储备
-
神经网络趣人趣事
-
- 发展历程
- 趣人趣事
- 前沿趋势
-
应用领域
-
- 图像识别演示
- 其他应用引介
-
结语
-
-
人工神经网络(ANN)作为深度学习的重要组成部分,在现代人工智能领域占据核心地位,并被视为主要的研究方向之一;其对人工智能的发展起到了关键的引导作用;我们将系统地探讨ANN的基本理论框架、发展历程以及前沿动态,并深入分析其在各领域的实际应用前景与技术挑战
人工神经网络(ANN)作为深度学习的重要组成部分,在现代人工智能领域占据核心地位,并被视为主要的研究方向之一;其对人工智能的发展起到了关键的引导作用;我们将系统地探讨ANN的基本理论框架、发展历程以及前沿动态,并深入分析其在各领域的实际应用前景与技术挑战

机器学习与深度学习
机器学习
位于路边的水果摊上,西瓜根茎粗壮且青翠;轻轻一碰听觉模糊。实则是果肉饱满且富有弹性的佳品。
这里经我们吃过与看过足够多的西瓜(E),对于这个瓜是否好(T),根据色泽青绿、根蒂蜷缩以及敲声浊响这几个特征,能够准确地判断这是一个正熟的好瓜。
将人类与生俱来的认知能力借助计算方法让计算机具备,这就是机器学习。
什么是机器学习?
卡内基-迈隆大学机器学习领域的开创者 Tom M. Mitchell(1926年12月14日-2018年7月14日)是一位计算机科学家,并且他阐述了工程化的概念
一个计算机程序基于经验E对任务T进行训练,并以性能指标P作为评估标准;当针对任务T的性能指标P随着积累的经验量E的增长而提升时,则定义此行为为机器学习。
神经网络(深度学习)
深度学习作为一种机器学习方法,在当今快速发展的人工智能领域中,机器学习的方法大致可分为两类:一类是深度 learning 技术
神经网络模型模仿了生物系统对物体做出交互反应,并将其行为描述为一种简化版的大脑工作模式。
人类大脑的神经系统包含了大量的神经元数量(大约数十亿个),每个神经元都与许多其他神经元相连接。当一个神经元处于兴奋状态时(即电位达到阈值以上),它会释放化学物质(称为神经递质),从而影响其他相关联的 neural 电位的变化情况。
将生物神经元简化为基本单元就是被广泛采用的 M-P 神经元(由 McCulloch 和 Pitts 提出,并以其名字首字母命名)。

神经元 :基本单位,接受输入信号并进行处理。
M-P 神经元接收自 n 个其他神经元的接收到的输入信号 x,在经过以不同权重 w 进行求和运算后,并加入一个偏置 b(类似于生物神经元的电位阈值),计算出总输入值 a;随后该系统会将此总输入值 a 经过激活函数 h() 处理从而得到输出结果 y。
激活函数 :由其自身特性决定神经元是否被激活的函数,在深度学习中具有重要作用;常见的实现方式包括sigmoid函数、双曲正切函数以及Rectified Linear Unit(ReLU)等算法。
其中权重 w 与偏置 b 统称为神经网络的权重参数。
用数学式表示 M-P 神经元的计算:
y = h(\sum_{i=1}^{n}w_ix_i + b) \tag{1}
基于神经元的概念,在此基础上通过并行互联多个相同结构的神经元构建具备适应能力的网络系统,则形成了神经网络

人工神经网络系统模拟人类神经系统的信息处理系统,由大量的人工神经元通过连接形成复杂的网络结构.这些人工神经元分为输入层级数量及输出层级三种类型.上图所示的就是一个包含两层层的(即隐藏层级数量加输出层级)人工神經網絡示意圖.
层次结构 :包含至少一个输入层、一个或多个隐藏层和一个输出层。
输入层神经元仅有外界输入识别,并不包含功能神经元;中间层(隐层)与输出层的功能神经元将信号进行处理;输出_layer_神经元传递最终处理结果。
学习与推理
设想存在一个任务需要用图示1设计的神经网络架构来解决。该任务的具体输入参数为(x₁, x₂, x₃)向量形式而输出结果参数为(y₁, y₂)向量形式。为了构建处理该任务所需的计算流程,我们需要利用训练数据集进行学习以完成相应的映射关系建立工作过程之后才能顺利运用学得的模型来进行推理操作
神经网络的学习过程即通过特定的学习算法,在由两层构成的神经网络架构中进行操作。基于一组预先确定的输入输出样本数据集(即训练数据),系统地更新其权重参数以优化性能。持续这一过程直至确定一组能够最有效地处理该任务的权重配置。
在明确所有权重参数的前提下,在给定新的输入数据(x_1,x_2,x_3)下
过程概要
ANN 的工作原理包括两个主要过程:前向传播和反向传播。
正向传播过程中,在输入层接收数据后的信息被传递到输入层,并在该层被接收并进一步通过隐藏层的权重和激活函数的作用进行处理,最终得到输出结果。
a^{(l)} = f(W^{(l)} a^{(l-1)} + b^{(l)})
其中,a^{(l)}是第 l 层的输出,W^{(l)}是权重矩阵,b^{(l)}是偏置,f 是激活函数。
反向传播算法 :通过梯度下降法对模型进行优化,在每一步中首先计算各个参数对应的梯度值;然后根据这些梯度值更新模型中的权重参数。其中关键的数学表达式如下所示:
W^{(l)} = W^{(l)} - \eta \frac{\partial L}{\partial W^{(l)}}
其中,\eta 是学习率,L 是损失函数。
此一简明扼要的概述即为当前阶段所呈现的核心内容。我们将深入探究神经网络模型的学习与推理过程。
前向传播演示
借助Python及其相关库(包括NumPy和Matplotlib),我们可以开发一个基础的ANN计算流程。为了演示如何对输入对象进行推理(前向传播过程),我们手动编写了一个简单的多层感知器(MLP)。
import numpy as np
# 激活函数
def sigmoid(x):
return 1 / (1 + np.exp(-x))
# 前向传播
def forward(X, W1, b1, W2, b2):
hidden_layer = sigmoid(np.dot(X, W1) + b1)
output_layer = sigmoid(np.dot(hidden_layer, W2) + b2)
return output_layer
# 初始化权重和偏置
np.random.seed(42)
W1 = np.random.rand(2, 2)
b1 = np.random.rand(2)
W2 = np.random.rand(2, 1)
b2 = np.random.rand(1)
# 输入数据
X_data = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
# 运行前向传播
output = forward(X_data, W1, b1, W2, b2)
print(output)
# [[0.7501134 ]
# [0.7740691 ]
# [0.78391515]
# [0.79889097]]
前置技能
掌握了如下技能,后文的深度学习相关理论与实践都将轻而易举:
- Python 核心:基于核心语法的编程语言,并提供名为Numpy和Matplotlib的库。
- 数学理论基础:涵盖线性代数计算与数值分析方法。
神经网络趣人趣事
发展历程
可以说 Machine Learning (ML) 是 Artificial Intelligence (AI) 发展到一定阶段的必然产物。然而,在 Machine Learning (ML) 圈子中要说一个路径坎坷、历经重重考验方显成熟的角色,则非 Deep Learning (DL) 不可。不过加双引号的原因已然显而易见——因为它早已在机器学习领域小有建树。
人工神经网络的起源可追溯至1940年代提出的M-P神经元模型。然而,在此之后近20年里,真正引起广泛关注的却是1958年Frank Rosenblatt提出的感知器模型。尽管感知器推动了早期的人工智能研究热潮,但其局限性很快显露出来:1969年 Marvin Minsky在其关于计算机科学研究的重要著作中指出,“神经网络模型在处理非线性问题方面存在显著缺陷”。这一关键发现不仅削弱了感知器的技术优势,在一定程度上也阻碍了整个神经网络领域的研究进展,并使神经网络研究陷入停滞不前的状态。
1974 年 伴随着反向传播算法(BP算法)的出现,神经网络的概念引起了研究者的广泛关注。在此期间,David Rumelhart 和 Geoffrey Hinton 等人凸显了多层神经网络的重要性。
在AI领域种类繁多的生态中,在机器智能发展的浪潮中,在人工智能技术不断演进的过程中
自 2012 年以来,在ImageNet竞赛中取得大规模胜利的一群研究人员——其中包括Ilya Sutskever及其团队——才真正成为人工智能领域的重要驱动力。
到二十世纪初叶末期(即二〇二〇年),大型语言模型领域的里程碑式人物GPT-3应运而生。它凭借拥有1750亿参数规模(这一规模是否也暗示着某种自然规律?)的独特能力,在人工智能发展史上留下了浓墨重彩的一笔;随后于二〇二二年十二月正式发布并投入运营,在短短五天时间内就突破一百万用户数量,在两个月内累计达到 monthly active users(MAUs)超过一亿,并且这一数据超越了TikTok平台所用时间跨度九个月所达到的水平。值得注意的是,在这一快速发展背景下,“深度学习技术已展现出强大的统一性和广泛的应用潜力”,其发展态势令人不禁感叹人工智能领域的集体智慧与进步
趣人趣事
图灵奖得主Edsger W. Dijkstra 曾言:计算机科学超越了对计算机本身的研究;也如同天文学超越了仅仅对望远镜的研究。
学习一种工具时,并非仅限于掌握该工具本身;而是应该着重关注其带来的价值,并探讨如何使其最大化。
那么该如何让计算机的价值更大化?有一个很不错的答案:机器代替人工!
凭借 Amdahl 定律取代摩尔定律成为推动计算机性能发展的新动力源,
人类借助于计算技术的进步实现了对信息量的无限放大。
在过去几十年里,
借助于计算技术的进步,
我们不仅实现了对数据的高效收集与存储,
而且成功提升了数据传输与处理的速度,
面对着这些海量的数据处理工作带来了,
迫切需要一种智能化的数据分析引擎,
也就是人工智能技术的发展为我们提供了解决方案。
AI 若按阶段来划分,大致可分为推理期、知识期、学习期。
推理期(二十世纪五十年至七十年代)主要依靠编写通用问题求解程序来赋予机器进行逻辑推理的能力,并最终实际上不具备真正的智能
在‘知识期’(即始于二十世纪七十年代中期的那个时期),学者们开始构建大量专家系统,并由人类将所掌握的知识进行总结与传递给机器。
然而,在知识工程的领域中存在明显的障碍性问题,在解决这一难题的过程中,人工智能在20世纪80年代开启了自主学习阶段,并逐步掌握了知识。随后的机器学习(ML)成为人工智能的主要技术手段。
这是一个通过 ML 来认识和改造世界的时代!
前沿趋势
当下人工智能领域备受关注的焦点无异于LLM(大型语言模型),其基本架构仍受限于人工神经网络的技术框架。自GPT-3问世以来,人们对AI的可能性充满期待。随后推出了GPT-3.5以及随后发布的GPT-4版本。每一代更新都在重塑着该领域的面貌。如今随着技术的发展与普及,曾经被认为遥不可及的人工智能技术已逐渐走进寻常百姓家。
应用领域
人工神经网络在多个领域中得到了广泛应用,我们随意列举几个:
- 图像识别 :通过卷积神经网络实现图像分类功能。
- 自然语言处理 :基于 recurrent 神经网络处理序列数据。
- 金融预测 :运用人工神经网络进行股票市场预测以及信用评估工作。
- 医疗诊断 :基于人工神经网络开发医疗诊断辅助系统。
图像识别演示
卷积神经网络(CNN)展现出色性能,在图像识别方面表现卓越。如在ImageNet竞赛中,AlexNet模型取得了显着的进步,在图像分类领域展现了卓越的能力。
下面我们使用 Keras 展示简单的 CNN 模型构造:
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D, Flatten, Dense
# 构建模型
# 创建一个顺序模型实例。
model = Sequential()
# 添加卷积层
# `Conv2D(32, (3, 3), ...)`:添加一个卷积层,使用 32 个过滤器,每个过滤器的大小为 3x3。
# `activation='relu'`:使用 ReLU 激活函数,使非线性特性增强。
# `input_shape=(64, 64, 3)`:输入图像的形状为 64x64 像素,3 个通道(RGB 图像)。
model.add(Conv2D(32, (3, 3), activation='relu', input_shape=(64, 64, 3)))
# 添加池化层
# `MaxPooling2D(pool_size=(2, 2))`:添加一个 2x2 的池化层,用于减小特征图的尺寸,从而减少计算量和降低过拟合风险。
model.add(MaxPooling2D(pool_size=(2, 2)))
# 展平层
# `Flatten()`:将卷积和池化层的输出展平成一维数组,为全连接层做好准
model.add(Flatten())
# 添加全连接层
# `Dense(units=128, activation='relu')`:添加一个全连接层,包含 128 个神经元,使用 ReLU 激活函数。
model.add(Dense(units=128, activation='relu'))
# 添加输出层
# `Dense(units=10, activation='softmax')`:添加一个输出层,包含 10 个神经元(适用于处理 10 个类别),使用 Softmax 激活函数将输出转换为概率分布。
model.add(Dense(units=10, activation='softmax'))
# 编译模型
# `optimizer='adam'`:使用 Adam 优化器,自动调整学习率,适合大多数情况。
# `loss='categorical_crossentropy'`:使用分类交叉熵损失函数,适用于多类别分类任务。
# `metrics=['accuracy']`:设置评估指标为准确率,以便在训练和测试时监测模型表现。
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
Sequential:用于按顺序构建模型的 Keras 类。Conv2D:卷积层,用于提取图像特征。MaxPooling2D:池化层,用于降低特征图的尺寸,减少计算量。Flatten:将多维输入展平为一维数组,便于连接到全连接层。Dense:全连接层,用于完成分类等任务。
其他应用引介
自然语言处理
递归神经网络(RNN)用于分析文本数据展现出卓越的能力。LSTM(长短期记忆)网络是一种一维递推结构,并能有效捕捉长距离依赖关系。
recurrent neural network 模型旨在进行情感分析,在训练数据集中包含被标记为正面或负面的评论。借助于 LSTM 网络能够准确地进行情感分类。
金融预测
ANN 在多个领域中得到广泛应用,在时间序列分析中尤其突出。该方法基于历史数据研究股票趋势。例如,在金融领域中采用 RNN 模型对未来的股票价格进行预测。
关注多维度数据特征及其对模型性能的作用,并通过引入外部因素优化模型预测能力
医疗诊断
应用 ANN 技术实现医学影像分析,在心电图与 MRI 图像的异常识别中表现突出
支持人工智能网络在临床场景中协助医生做出决策,在推进过程中也应重视伦理考量以保障系统的可靠性和患者的隐私权益
结语
人工神经网络是一种极具革命性的技术,在各个行业中都展现出巨大的应用潜力以及深远的意义。实际上,在机器学习领域中主要依赖于两种核心技术:一种是人工神经网络(特别是深度学习),另一种则是其他核心技术领域。值得注意的是,在当前全球火爆的大模型领域中——包括LLM、TTS模型、图像与视频生成大模型(如Sona、RunWay等)以及各种嵌入模型——它们无一例外都深深植根于人工智能的基础之上。因此,在深入掌握其基本原理后,并结合具体应用场景进行针对性研究与优化设计,则能够更好地发挥这一技术的优势,并将其成功运用到各个行业的发展中去
PS:感谢每一位志同道合者的阅读,欢迎关注、点赞、评论!
- 前一篇:[「ML 实践篇」机器学习实践]
- 下一部分:[深度学习|感知机:人工智能入门——从感知机到神经网络的概念与基础]
- 专题栏目:[「数智通识」]
