Advertisement

BP神经网络算法基本原理,bp神经网络的算法步骤

阅读量:

(1) BP算法的学习过程涉及哪些环节?这个问题值得深入探讨。(2) 详细推导出BP神经网络的数学模型及其训练机制,并分析其性能特点。

基于反向传播算法的bp网络于1986年由rumelhart及其领导的研究团队首次提出。该模型采用基于误差反向传播算法构建而成的多层前馈神经网络架构,在当前领域中被广泛应用于解决各种复杂问题。

BP神经网络具备大量数量级的输入-输出模式映射能力,并无需预先明确描述这种映射关系所需的数学方程。其训练采用最速下降法,并利用反向传播算法持续更新神经元之间的权值及激活阈值以优化连接权重参数配置方案,在此过程中始终使整个系统总的误差平方和达到最小状态。

BP神经网络模型的拓扑结构由输入层(input)、隐藏层(hide layer)和输出层(output layer)构成。人工神经网络即为模拟人思维的一种替代方法。

它是一个非线性动力学系统,在信息处理上体现出独特的特征:即通过分布式存储与并行协同来实现复杂的运算功能。尽管单个神经元仅具基本结构与有限功能特性,在此基础之上所构建而成的网络体系却能够执行各类复杂多样的行为模式

人工神经网络必须基于特定的学习准则来进行学习,并在此基础上才能投入运行。为此,请参考以下实例:当输入为手写字母‘a’时应输出‘1’;而当输入为手写字母‘b’时则应输出‘0’。

所以网络学习的规则应当是:当网络做出误判时,则通过网络的学习过程应当使该系统减少再次犯同样错误的概率。

在本研究中,在各连接权值上初始化为(0,1)区间内的随机数,并将待识别对象的图像信息呈递给神经网络系统。该神经网络系统会对输入图像进行加权求和处理,并与预设门限值进行对比判断,在此基础上执行非线性运算操作,从而得到网络输出结果。

在这种情况下,在线分类器将结果分为两类的概率相等(各占50%),这表明整个过程具有随机性。此时若分类器输出结果正确(即结果标记被判定为'1'),则会增加相关分类器参数的权重;从而使得当输入模式a再次出现时

当输出标记为0时,则需要将网络连接权值朝着减少综合输入加权值的方向进行调节。这种调节机制旨在通过这种调整方式,在未来再次遇到'a'模式输入时降低产生相同错误的风险。

对操作进行相应的调整。当向网络输入多个手写字符a和b时,在采用上述学习方法的基础上进行多次训练后, 网络的准确率将显著提升。

该系统表明这两个数据模式的学习已经取得了预期效果。这些数据模式被有效地存储在神经网络的各种连接权值上。当神经网络再次遇到任何一个这样的数据模式时,能够迅速而准确地区分并识别。

研究表明,在神经网络中随着神经元数量的增长其能够记忆与识别的数据模式也会随之增多。如图所示拓扑结构中的单隐层前馈网络通常被称为三层前馈网络或三层感知器即包括输入 layer中间 layer(亦称潜伏 layer)以及 output layer

它特点在于:各层神经元仅通过相邻层实现全连接;同一层内部没有连接;不同层次间不存在反馈机制;形成了一个层次分明的前馈式网络体系。

单层前馈型神经网络仅适用于解决线性可分的问题;仅当一个神经网络具备隐层时才能处理非线性问题。研究领域极为丰富体现了跨学科交叉融合的技术特征。

主要的研究工作集中在以下几个方面:(1)生物原型研究。在生理学、心理学等学科领域进行系统性探讨,在解剖学、脑科学等学科分支中深入分析神经细胞结构特征及其相互作用规律,在病理学等学科分支中探究神经系统病变机制及其临床应用价值。(2)构建理论框架。通过系统地研究神经细胞结构、神经网络运行规律以及神经系统整体功能机理的基础上构建完整的理论模型

基于生物原型的研究成果,在构建神经元与神经网络的理论体系时(3),其中涉及的概念体系包括概念框架、知识结构以及物理化学机制和数学表达等多个维度。

基于理论模型构建具体的神经网络体系结构,在此基础上展开相应的训练优化策略探讨,并用于实现计算机模拟运算或硬件原型开发。这一领域的研究方向也可被称作技术体系建模研究(4)。人工神经网络应用系统作为相关领域的重要实践平台。

基于网络模型及算法的研究成果,在此基础上通过人工神经网络构建实际应用系统。例如, 实现特定信号处理或模式识别功能, 开发专家系统, 制造机器人系统等。

回顾当今快速发展的新兴科学技术史,在征服宇宙空间、探索基本粒子以及生命起源等领域的过程中, 人类经历了充满挑战的道路. 随着对人脑功能与神经网络研究的深入, 我们将不断克服重重困难, 并见证这一领域研究的进步不断向前推进.

神经网络可用于分类任务、聚类分析以及预测模型等用途。为了使神经网络有效运行,它必须依赖于充足的历史数据样本,并基于这些历史数据进行训练以获取潜在的知识结构。

在你的问题中,首先要识别其关键特征并获得对应的质量评估数据,并利用这些数据进行神经网络的训练. 尽管bp网络得到了广泛的应用,但其自身也存在一些局限性和不足之处,主要体现在以下几个方面的问题.

网络在这样的条件下其收敛速度较慢,并且需要较长的时间周期用于训练。

在处理某些复杂的问题时,bp算法所需的时间可能会很长;其主要原因是因为较低的学习速率导致效率低下;可以通过动态调整学习率的方法包括逐步调整学习率或自适应优化方法来改善这种情况。

此外,bp算法能使权值趋向于某个特定值。然而,这并不意味着其一定是误差平面的全局最低点。原因在于梯度下降法可能会陷入局部极小点。针对这一问题,可以通过引入动量项来克服这一挑战。

再次强调,在目前情况下关于神经网络隐含层层数与单元数量的选择尚缺乏理论指导依据;通常需要结合实践经验进行选择。这也意味着在一定程度上会导致计算资源的浪费;此外,在某种程度上也会对学习效率产生不利影响;最后值得指出的是这一特性可能导致神经网络学习功能出现不稳定特征。

也就是说,在引入更多学习样本的情况下,在经过训练的网络必须重新进行训练,并且对于那些在预测、分类或聚类任务中表现较好的权重参数来说,并没有被之前的模型所保留。

谷歌人工智能写作项目:神经网络伪原创

BP人工神经网络方法

(一)方法原理人工神经网络由成千上万类类似的简单处理单元通过广泛的连接关系相互作用而形成的一种复杂的网络系统**好文案** 。理论研究表明在数据处理效率方面神经网络方法相较于传统模式识别技术展现出显著的优势。

人工神经元作为神经网络的核心信息处理单元,在实际应用中通常会接收一系列数据输入x_1,x_2,…,x_n。其中\omega_{ij}代表从第i个神经元传递至第j个神经元的权值系数。

神经元的输入经由信息X=(x₁,x₂,…,xₙ)与权重W={ω_ij}进行点乘运算,并将所得结果与预先设定的阈值进行比较;随后经过特定神经元激活函数f的作用后即可得到该神经元的输出Oi

常见的激活函数为Sigmoid型。

人工神经元的输入与输出关系在地球物理勘探概论中:其中xi表示第i个输入元素即n维输入矢量X中的第i个分量;而ωi则代表第i个输入与其处理单元之间的连接权重;θ则是该处理单元内部所设定的关键阈值;最终y即为此处理单元产生的输出结果。

常见的人工神经网络是被称作BP网络的体系。其结构包含三个部分:输入层、隐含层以及输出层。该算法作为有监督学习模型,在模式识别任务中表现出良好的效果。具体涉及学习与识别两个核心环节,在其中的学习阶段分为正向传播与反向传播两个关键步骤。

在正向传播启动时, 我们会为所有的连接权值赋以随机数值作为初始值, 然后从给定的模式集合中任选一个模式作为输入样本, 接着进入隐含层进行处理, 最终在输出层单元中计算出该模式对应的输出值. 每个神经元的状态仅作用于其下一层的神经元状态

当前阶段中输出值往往与预期目标之间存在明显的偏差。为了减少这种偏差的影响,在深度学习模型训练过程中通常采用误差反向传播机制来逐步优化各层神经元权重的变化幅度。这一优化流程会持续进行下去,在每个训练周期内系统会不断调整模型参数直至对整个模式集合的所有样本都完成一次完整的前向和后向传播循环,并记录下每一轮训练迭代中各参数权重都会发生相应调整以获得更好的拟合效果。

经过对网络中各神经元权重的调整后

(二)BP神经网络计算步骤(1)设定网络中各层之间的连接权系数以及激活函数的阈值参数为一个较小的随机初始值, 记作W(0)=任取初始数值, θ(0)=任取初始数值。(2)向网络输入待处理的数据样本X

(3)前向传播的具体步骤是:首先进行前向传播;然后计算实际输出值;具体而言,就是基于输入样本数据、神经网络中的权重参数以及激活函数阈值参数来确定每个节点的激活状态;接着,在每一层神经网络中依次计算节点的总输入并应用激活函数;最后得到整个网络的输出结果。

其中使用阈值逻辑函数f进行计算,在该方法中f(x)=σ(w·x+b),其中σ表示Sigmoid函数的具体形式为σ(z)=1/(1+exp(-z));其中常数项b(即θ0)用于调节Sigmoid曲线的陡峭程度;而权重系数w(即θj,j=1,2,...,n)则用于决定各输入特征对输出样本的影响程度;该模型通过逐层传递信息实现了对输入样本数据的分类功能

较小的θ₀会使得Sigmoid函数接近阈值逻辑单元的特性特征值较大的θ₀会导致Sigmoid函数趋于平缓状态通常建议取θ₀等于1

(4)在地球物理勘探学中进行研究时会涉及到对实际测量结果与理论预测结果之间差异的计算。该研究式中:tpk代表理想输出序列;而Opk表示实际观测到的输出序列。其中p表示第p个样本编号,k代表第k个神经网络节点编号。

(5)在误差反向传播过程中用于修改权值的数学模型中包含:该课程的全部内容。
(6)第6步判断收敛:如果误差小于设定阈值,则终止;否则转至第2步。
具体步骤如下:

  1. 计算当前层输出相对于上一层输出的梯度;
  2. 根据链式法则计算当前层参数梯度;
  3. 将参数梯度乘以学习率并更新参数;
  4. 重复上述过程直到满足收敛条件;
  5. 若未满足则返回第2步继续循环。

基于该地区的S4井已有数据建立BP神经网络模型,并提取包括氧化还原电位在内的一系列地质参数作为特征进行分析

构造面显示地层结构的变化特征,
其中可能出现油气物质迁移并聚集的理想部位,
它可作为一个重要的判据用于判断含油气性。

在该地区采用了包括但不限于高精度重磁技术、土壤微磁分析以及频谱激电等多方面的测量手段,在这些方法中有一些关键的测试指标并未被选为主控特征因素的原因在于这些指标之间存在一定的相关性。

在应用神经网络方法进行判别之前, 采用Karhunen-Loève (KL) 变换用于分析并提取特征. S4井位于测区分布区域西南部5条线中的第25个钻孔位置, 是该区域中唯一已知的钻孔位置.

该钻井工程在侏罗系地层段落中钻探至深度达5390.6米时发现了约达41米厚度的油气储集层,在震旦系地质段落中深入至5482米处并发现约58米厚度的油气储集层

选取位于S4井周边的9个采样点(其中位于4至6线、23至25号点之间的区域)被选定作为油气分布的训练样本区域;鉴于该区域内目前尚未见到有产油的钻井记录(经研究认为),我们决定将位于14至16线、55至57号点之间的区域设定为非油气分布区域作为对照集

该神经网络经过17,174次迭代训练后达到稳定状态。通过该模型进行数据处理计算得到总的误差值为0.0001。整体训练效果令人满意。基于训练完成后的神经网络模型展开识别任务,并将测试数据输入系统获取预测结果如图6-2-4所示

如图6-2-4所示,在塔北雅克拉地区运用BP神经网络进行聚类分析的结果表明:当预测值超过0.9时,则可识别出五个稳定的封闭区域作为潜在的远景区域。从图中可以看出这些远景分布在不同的构造带上:其中,在测区南部位置的第①个远景区域与已知的S4油田相吻合;而第②和第③个油气远景则分布于地震勘探确认的托库1和托库2构造上。它们位于沙雅隆起带东段区域,在该区域内曾于1984年钻探到高产油气流Sch2井的位置附近。另外两个远景则位于大涝坝构造上,并属于yh油田的部分

MATLAB中BP神经网络的训练算法具体是怎么样的

BP算法的主要思想在于其实现机制包含前向传递和反向传递两个核心环节。在前向传递过程中,在输入层接收信息后,在各隐藏层依次处理之后, 信息传递至输出层.

实际与****教师信号不符时,则进入误差反向传播的过程

误差反传其过程是将输出端产生的误差信息通过隐含层逐步传递至输入端并层层扩散,在每一层中都将该误差点分配给所有单元。这样一来就能获取到各个单元对应的误差点信息作为调整权重的基础依据。

这一信号通过正向传导与反向传导各层权重更新的过程是周而复始运行着的。权重不断更新的过程即为网络的学习训练流程。这一流程将持续直至网络输出误差降至可接受水平或直至预先设定的学习次数完成。

正向传播:输入样本经过输入层经各隐层(执行处理后)传递至输出层注1:若输出层实际输出与期望输出不符,则转至2)(误差反向传播过程)。2)误差反向传播:以某种形式表示的输出误差依次传递至逐一层次直至最终传递至输入层其核心目标在于通过反向传递误差的方式将误差分配给各个层次的所有单元从而指导修正每个单元的权值(这一过程旨在逐步优化神经网络模型的各项参数)

注2:参数更新机制是神经网络学习训练流程中的重要环节,在这一现象的本质原因在于权重参数不断优化以适应数据特征的变化。为了更好地理解这一过程的具体实现方式,请参阅相关教材中的详细推导内容;然而,在本篇讨论中难以直接阐述其数学表达式及其求解方法。

MATLAB中BP神经网络的训练算法具体是怎么样的

先用newff函数建立网络,再用train函数训练即可。

前向传播:输入样本经过输入层经各隐层(进行特征提取)至输出层注1:若输出层实际输出与期望输出(教师信号)存在差异,则转入2)(误差反向传播过程)。2)误差反向传播:输出层的输出误差->隐层逐层->输入层其主要目的是通过将输出误差反传给各层单元以分摊误差并获得各层单元的误差信息进而对各单元的权值进行调整这一过程实际上是一种权值优化的过程。

软件中的BP算法实施流程如下:
第一步是初始化网络参数;
第二步是输入训练样本数据对并计算各层输出值;
第三步是评估网络输出与期望值之间的误差程度;
第四步是根据误差信息计算各层误差信号;
第五步是更新神经元间的连接权重参数;
第六步是检查总误差是否达到预期精度:
当总误差达到预期精度时停止训练;
否则返回第二步继续循环。
改进措施包括引入动量项以及自适应调整学习速率的方法,
此外还提出了采用陡度因子以提高算法收敛速度

BP神经网络(误差反传网络)

虽然每个单独的人工神经元结构较为简单,但通过将多个人工神经元按照特定模式相互连接,便能够构建起能够有效处理复杂信息的人工智能系统.基于BP算法设计而成的多层前馈网络因其在实际应用中的卓越性能而广受欢迎,并常被简称为BP型人工神经网络.

它的最大功能就是能映射复杂的非线性函数关系。

在已知的模型与数据的空间中,在这些空间中我们能识别出一组相互对应的模型与数据。然而,在这种情况下无法明确表达它们之间的数学关系。不过,在存在大量一一对应的样本集合时,则可应用BP神经网络技术来建立这些配对样本间的映射关系。

该三层BP神经网络结构如图8-11所示,在其架构中包含三个关键组成部分:输入层(负责接收原始数据信号)、中间隐层(通过非线性激活函数对信息进行处理)以及输出层(完成数据的最终分类或回归任务)。这种最常见的模型类型就是三点结构的BP神经网络,在机器学习领域具有重要的应用价值。研究结果表明,在处理连续性函数时,三点结构已经展现出强大的表达能力。值得注意的是,在处理非连续性函数的情形下(例如锯齿波形),通常需要增加中间隐层的数量以提高模型的拟合精度[8]。

图8.11中
输入向量X=(x₁,…,xᵢ,…,xₙ)ᵀ
增加一个偏置单元x₀=-1
可以引入隐层神经元的阀值
其中隐层输出向量定义为Y=(y₁,…,yᵢ,…,yₘ)ᵀ
类似地
增加一个偏置单元y₀=-1
可以引入输出层神经元的阀值
输出层输出向量定义为O=(o₁,…,oᵢ,…,o_l)ᵀ;
输入层到隐层之间的权值矩阵用V表示
其中每个列向量V_j代表隐层第j个神经元对应的权值集合;
隐层到输出层之间的权值矩阵用W表示
其中每个列向量W_k代表输出层第k个神经元对应的权值集合

图表8.11展示了三层BP网络的工作原理[8]。BP算法的学习过程包含正向传播与反向传播两个阶段的过程

在正向传播过程中,输入样本信息依次传递至各隐层单元,并完成数据特征的逐步提取和计算处理。随后将最终结果传递到输出层进行判断。当输出层的实际响应与预设目标存在差异时,则系统将启动误差反向传播机制进行调整。

反向传递至每一层次,并将其分配给该层次的所有神经单元从而得到每一层次相应的误差信息这些信息可用于更新该层次中各个神经元权重反复利用输入-输出样本集来进行权重更新最终可使每个输入样本经过网络处理后的输出结果均达到满意的效果(参考韩立群著作[8]中的相关内容)

此过程被称作网络的学习训练过程。当网络完成训练时,它对应于输入输出样本间的函数关系。

在地球物理勘探领域中, 前向过程可由以下数学表达式表示: d = f(m) (8.31). 其相应的逆运算关系可表示为m = f⁻¹(d), 其中(8.32)式即为此逆运算关系的数学表达. 如果能建立这一逆运算关系, 则可实现地球物理属性的反演

通常情况下,很难直接表达这个逆函数。然而,在实际应用中我们可以通过BP神经网络算法来建立一个模型来实现数值m与d之间的转换关系。

在地球物理反演问题中, 当我们将观测数据视为输入量, 将模型参数对应于输出变量时, 我们可以通过生成大量随机样本并进行正演计算来获取相应的观测数据样本集. 这些样本集被用来训练一个BP神经网络, 训练完成后, 这个神经网络就能够实现对地球物理数据方程的求解功能.

该方法可以用来实现反演;当给定输入观测数据时(即提供一个观察结果),该网络将输出与之对应的模型。为了使该算法得以实施(即能执行反演),必须先完成学习和训练任务;而这一过程中的每一步都需要投入大量计算资源;此外,在整个学习和训练过程中也需要投入大量时间

然而,在反演过程中完成训练后,BP神经网络的运算速度极快。为了使BP神经网络较好地建立函数映射关系,必须具备具有广泛代表性的样本数据.然而由于模型空间具有无限的可能性,在实际应用中获取具有广泛代表性的完整样本集极为困难.

基于这样的样本集训练而成的BP神经网络模型,在有限区域内的函数关系表现较为明显,并且仅能体现其在有限区域内的函数关系。而当观测数据超出了这些有限区域时,则无法正确地进行反演。

在当前研究领域中,BP神经网络在一维反演中得到了广泛应用,在二维和三维反演中的应用相对较少。主要原因在于难以生成具有广泛代表性的样本空间。

什么是BP神经网络?

BP算法的主要原理在于通过信息前馈与误差逆向传播相结合的方式实现学习过程;在信息前馈阶段, 输入样本依次传递至输入层, 经过各隐含层的逐步处理后向前传递至输出层;当输出层的计算结果与预期目标存在偏差时, 则以该偏差为依据进行逆向调整, 对各神经元间的连接权进行更新优化以减小误差。

经过长时间的学习实践,最终使误差降至可接受范围内.具体步骤如下:第一步,从训练集中选取一个样本,将信息输入到网络中;第二步,通过各节点间的连接情况进行正向逐层传递后,得到神经网络的实际输出.

3、通过反向传播算法衡量实际输出与期望输出之间的差异。
4、通过反向传播算法将各层产生的误差信号传递至前一层,并按照预设的规则更新各连接权重以减少预测与目标之间的偏差的方向。

针对训练集中每一个输入-输出样本对,执行上述操作直至训练样本集的误差降低至预期水平。

极端气温、降雨-洪水模型(BP神经网络)的建立

极端气温、降雨与洪水之间有一定的联系。

基于1958-2007年间广西西江流域极端气温与降水量以及梧州水文站洪水资料的数据,在第5章相关分析的基础上通过分析得出显著影响梧州水文站年最大流量值的关键气候因素(如表4.22所示)作为输入数据的基础上,构建人工神经网络预测模型。

4.5.1.1 BP神经网络概述(1)以BP算法为基础构建起来的多层前馈网络模型被采用为至今为止应用最广泛的神经网络。在多数情况下的应用中(特别是在多数情况下的应用中),如图4.20所示的情况中出现最多的三层前馈结构。该结构由输入层、隐藏层和输出层层组成。

标准的三层BP神经网络架构在前向传播过程中, 输入信号依次从前一层经过中间层传递到下一层, 最终传递至输出层。

当输出层得不到预期的输出结果时, 转而进行反向传播, 并沿着原有的连接回路返回误差信号; 通过调整各层神经元的权值以使误差达到最小.BP算法流程如图4.21所示.

通过查看图4.21的BP算法流程图可以看出,在BP学习算法中,各层权值的调整主要受三个因素的影响:学习率、本层输出产生的误差信号以及本层输入信号y(或x)。

其中,在神经网络中考虑了输入样本到分类器之间的判别信息时,在线学习算法能够有效地进行参数更新以适应变化的信息环境。

1988年,Cybenko指出两个隐含层就可表示输入图形的任意输出函数。

当一个BP网络仅包含两层隐含层时(其中输入层、第一隐含层、第二隐含层和输出层数量分别设为n, p, q, m),则该网络可简记为BP(n,p,q,m)

(2)用以概括研究区受极端气温与降雨共同影响而产生的年最大流量变化规律的过程其过程极其复杂多样从经历强降雨到形成年最大流量的过程中中间会经历蒸散发分流下渗等多个环节这些环节都受到地形地貌下垫面土壤地质以及人类活动等多种因素的影响

可以把一个极端气候与年最大流量之间复杂的关系简化成一个小规模的水量系统。这个水量系统的最关键影响因素可以通过那些对年最大流量有显著影响的气象站上的极端气温和降雨情况来体现。而对于那些对年最大流量影响不显著的气象站,则可以忽略它们的影响。这样一来,整个问题就能得到较为简化的处理。

This system is a nonlinear one. It can approximate a nonlinear mapping relationship. It can also approximate a highly complex mathematical function. This is a very complicated mapping relationship between extreme climate and annual maximum flow water systems. It can be generalized as a system.

BP神经网络与选定区域极端气候-年最大流量水系统的构成具有相似性,并通过BP神经网络模型对其进行模拟逼近过程。

(3) 确定隐含层单元数的方法 隐含层单元数q与具体研究的问题密切相关 尚未形成统一的标准或方法 一般通过反复试验和调整来确定

在训练过程中采用误差平方和作为网络收敛的标准,并适应变化环境条件下的水资源保护与可持续利用研究方面存在一定的探索。尽管目前BP神经网络仍属于黑箱模型其参数缺乏水文物理意义在此研究阶段将通过极端气候空间分析结果来优化隐藏层神经元数量以提高模型预测精度

BP神经网络模型算法在传递函数选择过程中存在以下主要缺点:其一是需要较长的时间来进行训练;其二是难以进行有效的参数估计;其三是容易陷入局部最优解的情况。针对这些问题可以通过引入动量因子或者采用自适应的学习率策略来改进算法性能

本节基于MATLAB工具箱中设计了带自适应学习率并完成反向传播训练过程的traingdm( )函数用于实现

模型数据的标准化处理因BP神经网络输入层物理量及其数值差异悬殊而被采用。这是因为标准化处理有助于加快网络收敛速度,并使训练过程中的参数更新更加稳定和高效。

本节介绍了一种归一化方法:将年极端最高温度的观测数据按比例缩放为原始值的百分之一;极端最低温度观测数据缩放为十分之一;同时对最大日降雨量(包括1天、3天和7天)的数据进行千分之一的比例调整;而梧州水文站的最大流量观测值则按万分之一的比例进行缩放;对于其他输入变量,则采用类似的操作流程来进行归一化处理

第(6)条对年最大流量进行优化调整后得到的梧州水文站以上流域集水面积数据为32.70×10⁴ km²,在该区域内的流域集水面积计算得出其值为20.24×10⁴ km²。其中约有61.91%的数据来源于该区域内的流域集水面积

综上所述,在分析梧州地区与红水河天峨站之间的关系时

在变环境条件下开展水资源保护与可持续利用研究如表4所示

4.5.1.2 年 BP 神经网络模型基于 1958~1997 年的数据集构建。该模型利用了该区域的年度极端最高气温、年度极端最低气温以及年度最大 1d 降雨量作为输入变量,并以梧州站的最大流量作为输出变量。

利用梧州气象站年度极端高温值与其他气象站点年度极端低温值作为输入数据集;结合多个雨量站点年度最大日降雨量作为影响因子;对应的梧州水文站年最大流量作为输出变量;并采用两层隐含层结构构建BP神经网络模型;其中各隐含层节点数分别取16与3;两隐层均采用tansig激活函数;输出层则采用线性激活函数;选择traingdm训练函数;并设定学习率为0.1以及动量因子为0.9;目标误差阈值设定为0.0001,并规定最大训练次数为2×10^5次

BP网络模型参数见表4.26,结构如图4.22所示。

图4.25展示了梧州市水文站年度最大流量与极端温度及降水量之间的关系。从系统结构分析可知,在 annual maximum flow generation过程中, 各关键气象要素(如最高温度、最低温度)及其对应的支流流量均存在阈值设定;这些极端气象事件作为系统的输入变量, 而系统的输出变量则为年度最大流量数据;这种系统行为与人工神经网络中的阈值激活机制具有相似性

在分析年最大单日降雨情况时, 选定的雨量站点均匀分布于该区域内的十四条主要支流中(见表4-27)。当出现极端强降雨时, 它们迅速汇集至梧州市区周围的主要河流干道上。其中, 极端温度的变化对极大降水量产生的蒸发散失产生了显著的影响;这些站点主要部署在四个大气候分区中的II、III、IV三个区域中。

此研究过程可与BP人工神经网络模型进行类比(表4.28),其中 14条支流对应于第一隐含层中的14个神经单元;这两个关键气象要素即为第一隐含层中的两个主要变量;第三气象分区则对应于第二隐含层的三个神经单元;而各支流流量贡献值等参数则代表了各人工神经单元的作用阈值;总体而言 BP人工 neural network model已达到一定程度的简化

表4.27 选取所在支流雨量站概况统计表;表4.28 BP神经网络组成单元物理意义对照表;(2)训练效果分析中选取了40组样本数据,在模型训练过程中经历了113,617次迭代计算,并最终达到了预期的精度水平

在终端界面中输入并执行运行命令,在图形界面环境中启动网络的学习与训练流程。该网络系统的详细过程可在图4.23中查看。其中的具体数据与分析结果可参考表4.29以及图4.24的相关内容。

表 4−29 所示的最大流量训练结果

根据训练样本检验结果(见表4.5)可知,在各年的最大流量模拟值与实测值之间存在显著差异。具体而言,在该时间段内每年的最大流量模拟值与实测值之间的相对误差分别低于或等于1 个单位以下的标准要求下有 3 个数据点达到了标准要求(即相对误差小于或等于 6 个单位),而其余的数据点则全部满足标准要求(即相对误差小于或等于 6 个单位)。

详细说明了"年度极端温度、年度单日最大降雨量- 梧州年最大流量预测模型"的实际输出与实测值之间的误差较小,并指出了该模型具有良好的泛化性能,其模拟结果较为可靠。

该系统进行预测检验,并将上述数据作为该神经网络模型的一个输入参数。具体而言:

  • 梧州气象站从1998至2007年的极值最高温度
  • 分别位于桂林和钦州的气象站收集的日均最低气温
  • 分别位于榜圩等多处站点测量的日均最大降水量
    期间所收集的数据将被用于训练"年度极值温度与日均最大降水量对梧州市 annual maximum flow BP 神经网络模型"

程序运行后,网络输出的预测值与已知的实际值进行了对比;其预测检验结果在图4.25中得以呈现,并在表4.30中具体体现。

本研究通过建立年最大流量神经网络模型对水文时间序列进行预测,并通过表4.30进行验证。对比实测值后发现,在1998至2007年的10年间年最大流量模拟值与实测值的误差不超过20%的情况出现了9次,占总次数的90%,整体表现良好。

4.5.1.3 年极端气温等数据与梧州流量的 BP 神经网络模型(1)构建过程如下:该 BP 神经网络主要由基于 BP 算法 的 极值温度 数据集(包括最高温与最低温)、七天连续降水量以及梧洲站的最大流量 数据 组成;通过训练 1958~1997 年间的 数据 集来实现 分析研究 上述变量间的关系及其变化趋势。

基于梧州气象站年度极端高温数据与包括桂林和钦州在内的气象站年度极端低温数据等信息作为输入变量;凤山、都安、马陇等如大湟江口、大安、大化以及阳朔等地区共计提供年最大7日降雨量作为输入变量;研究区域采用(12,p,q,1)结构设计BP神经网络模型;其中神经元数目p设为10个而q设为4个;第一隐层与第二隐层均采用双曲正切激活函数;输出层采用线性激活函数并采用traingdm算法进行训练;设定学习率为0.1并选取动量因子值为0.9;同时设定终止训练条件的目标误差阈值为ε= 5×1e-4并限定最大迭代次数为设定最大迭代次数N= 2× 1e5次

BP网络模型参数见表4.31,结构如图4.26所示。

表4.31 BP网络模型参数一览表
图4.26 年极端气温与年最大7d降雨-梧州年最大流量BP模型结构图
本节采用七日极大降水量作为输入变量时所设置的雨量站分布在8条支流上(表4.32)。当发生极端降雨后,七日极大降水量所对应的8条支流汇集到梧州,在此过程中温度的变化影响了降水量蒸发散失。这些雨量站分布于四个自然分区中的I、II、III和IV四个区域。

该过程与BP神经网络架构具有相似性(表4.33)。具体而言,在第一隐含层中包含8个神经单元分别代表了8条支流;另外两个神经单元则分别代表了年最高气温与最低气温;而第二隐含层中的每个神经单元则分别对应了不同区域内的最大7日降雨量分布情况;总体而言,在这种类比下BP网络模型已经实现了较为程度化的简化处理

表 选 用 雨 量 站 所 属 的 支 流 汇 总 表 为 表 选 用 雨 量 站 所 属 的 支 流 汇 总 表 , 表 BP 神 经 网 络 构 造 及 其 物 理 意 义 汇 总 表 ( 二 ) 训 练 效 果 分 析 部 分 , 训 练 样 型 共 包 含 了 以 下 几 方 面 的 内 容 : 训 练 样 型 数 目 达 到 四 十 样 , 在 经 过 十 六 萝 千 百 八 十 六 次 的 训 练 后 , 网 络 已 达 到 满 足 精 度 要 求 的 标 准 。 在 命 令 窗 口 输 入 运 行 命 令 后 , 神 经 网 络 开 始 学 习 和 训 练 。 对 其 训 练 过 程 进 行 观 察 , 如 图 所 示 。 对 应 的 测试 结 果 可 在 表 中 查 看 。 图 展 示 的 是 相 关 的 训 练 结 果 。

图4.27展示了神经网络的训练流程, 图4.34显示了年份最大的流量变化曲线, 图4.28则呈现了基于该方法的年最大流量神经网络模型的训练结果。从图4.28可以看出, BP网络具有较好的目标函数近似能力。

基于训练样本的数据检验结果(见表4.34)表明,在1958至1997年间连续40年间期的最大流量模拟值与实测值之间的相对误差均低于20%,其中在相对误差小于10%的情况下达到了全部38年的时间段。

阐述该模型'年度极端气温与七日降雨量对梧州年最大流量的影响'的泛化能力较好,并且其模拟结果较为合理

模型预测检验工作将1998-2007年间各梧州气象站年度极端高温值以及桂林及钦州各气象站年度极端低温值作为输入至"年度极高温与七日最大降水量对梧州洪峰流量BP网络预测模型"中,并整合计算得到各站点的最大降水量数据

在程序运行后,网络输出的预测值与已知的实际值进行了对比分析。具体而言,在程序运行后,在图4.29中展示了网络输出的具体数值,在表4.35中列出了各参数的详细信息

本研究中的最大流量神经网络模型预测检验结果如图4.29所示对比分析了神经网络模型的预测效果表4.35对比分析了神经网络模型的预测效果与实际结果之间的差异通过分析检验结果显示:在1998至2007年间连续10年的最大流量模拟值与实测值相比相对误差低于20%的情况出现了7次其中合格率达到了70%整体表现良好

4.5.1.4

以年度最大流量作为输入变量,并将年度最高水位作为输出变量;构建基于(1-q-1)结构的BP神经网络模型;经过实验验证确定q值定为7;其中隐含层与输出层均选用线性传递函数;选定的训练函数是traingdm算法;设定学习率为小数点后一位数值即十分之一;同时设置动量因子为小数点后一位即十分之九;并且设定目标误差阈值为小数值点后五位的精度;最后决定将该模型的最大迭代次数设置在两百万次

BP网络模型参数见表4.36,结构如图4.30所示。

表4.37 BP神经网络模型参数汇总表

水系对应于隐含层中的节点(见表4.37),总体而言,BP神经网络的结构已经达到了灰箱化的状态。

训练样本数量为57个,在完成3327次训练后发现误差降至最低水平,并最终计算得到的误差值为3.00605×1e-5,并未满足预期精度要求

在命令窗口中执行运行命令,在启动网络时完成学习与训练的过程(如图4.31所示),其训练结果展示于图4.32及表4.38中。

涉及年度最高水位数据的表4.38年的训练结果可以通过图4.32和表4.19来观察分析,并发现在经过训练后采用的BP网络模型能够很好地拟合给定的目标函数

对于训练样本经检验分析可知:1941~1997年间年最高水位模拟值与实测值的相对误差分别低于10%及20%,其中分别为56a和57a的指标达到合格率的100%。

具体说明"年最大流量-年最高水位BP神经网络模型"的实际输出数值与测试数据之间的误差较小,并指出该模型在不同数据集上的表现良好。此外,在各种测试条件下进行模拟计算后得出的结果具有较高的可信度。

如图4.31所示为神经网络系统的运行流程图,如图4.32所示为年度最高水位神经网络系统的训练成果,(注:此处采用编号形式标记为#(3),即第(3)项,用于后续引用说明).通过建立基于BP算法的神经网络预测模型,对1998至2007年间梧州各水文站的最大流量数据进行建模,并将其输入至"最大流量与最高水位BP型神经元预测系统"中进行验证计算.

运行之后的网络输出预测值与已知的实际值进行了对比分析,在图4.33中可以看到该预测结果,在表4.39中详细列出了相关数据信息

表4.39 神经网络系统预测结果与实际对比显示:通过验证过程可以看出:在1998~2007年间连续十年中每年的最高水位模拟值与实测值相比其相对误差均未超过20% 达标率达到了10 且整体表现非常出色

图4.33年最高水位量神经网络模型预测检验结果。

BP神经网络算法求讲解

BP神经网络中隐藏层节点个数怎么确定最佳

采用三种确定隐含层层数的方法进行计算后获得了三个不同的隐含层层数结果,并确定出最小和最大可能的隐含层层数范围。随后从最小的可能隐含层层数开始逐步测试模型预测误差的变化情况,并一直到达到最大的可能隐含层层数为止。

最终选择误差最低的那一层隐藏层数,并将其作为本研究的核心关注点。这种方法特别适用于拥有两层隐藏层数值量级较大的神经网络结构。对于单隐藏层数量的情况,在处理非线性映射问题时表现相对较弱;针对相同类型的问题,在追求特定的映射关系时,则需要适当增加隐藏节点的数量来提升模型的可调参数数量;因此,在这种情况下更适宜采用"删除法"这一策略来优化神经网络性能。

1.3 黄金分割法算法的基本思想:第一步是在区间 [a, b] 内确定理想数量的隐含层神经元数量参数,并通过这种参数设置确保了网络对函数的近似能力和良好的泛化性能。

为了满足高精度逼近的要求,继而采用黄金分割原理拓展搜索区间。从而获得该区间 [b, c](其中 b = 0.619 × (c - a) + a),在该区间内进行优化定位,在该区域内寻找最优解,则能够获得逼近效果更加显著的隐含层节点数量,在实际应用中依据需求选择其中一个就可满足要求。

在BP算法中,权重和阈值是每次训练后进行一次调整。逐步测试隐层节点数量即首先设定一个起始数值,在此基础上逐步递增。通过对比不同网络模型的预测性能表现选择具有最佳预测能力所对应的节点数量作为隐含层神经元的数量

全部评论 (0)

还没有任何评论哟~