Advertisement

2021年中国研究生数学建模竞赛B题参考思路

阅读量:

问题一就是单纯的计算问题,在附录中相关的计算规则都已经告知了,因此直接带入数据进行计算即可,但需要注意各种逻辑关系,先捋顺在去计算。注意如果计算结果过长就只选择部分代表性数据放在正文中即可,其它的部分放在附录里;注意计算的顺序和逻辑以及单位。

对于第二问:根据附件一可知,仅告诉我们检测点A的各类实测污染物数据,但并未告知气象情况,因此我们首先根据问题一计算得到的AQI数据以及相关的污染物数据进行无监督聚类,无监督聚类模型有很多,如层次聚类、高斯混合聚类等,在这里比较推荐SOM自组织神经网络聚类算法,将原始数据输入网络后能够自动根据各类数据的特点在不同的步数下生成不同的结果,如将31个省市的GDP数据输入网络则会自动对发达程度进行聚类;

% 二维自组织特征映射网络设计

% 输入数据为各类实测污染物数据

clc

clear

close all

%---------------------------------------------------

%随机生成100个二维向量,作为样本,并绘制出其分布

P=[此处填写污染物数据]

%建立网络,得到初始权值

net=newsom([0 1;0 1],[5 6]);

w1_init=net.iw{1,1};

%---------------------------------------------------

%绘制出初始权值分布图

figure(2);

plotsom(w1_init,net.layers{1}.distances)

%---------------------------------------------------

%分别对不同的步长,训练网络,绘制出相应的权值分布图

for i=10:30:100

net.trainParam.epochs=i;

net=train(net,P);

figure(3);

plotsom(net.iw{1,1},net.layers{1}.distances)

end

同时,对于部分实测的异常数据,如缺失或明显结果异常的,要理性分析不可以直接就给补全,比如温度数据,众所周知相邻两天的温度数据也是有可能存在很大差距的,因此这时候务必分析数据的走势,看是否呈现一定的规律(如平稳微波动,单调递增或递减等)只有这种的才可以补全,若数据没有任何规律,高低起伏变化不定,此时补全是不符合逻辑的,建议直接删除即可;对于补全的方法并不是解题重点,可选择Lagrange插值法、分段线性插值法等均可,不用在这里浪费时间选择很复杂的算法(比如深度学习之类的)插值方法见群文件即可

对于第三问:首先分析题目已知数据包括了各监测点逐小时污染物浓度和气象一次预报数据以及实测的污染物浓度和气象数据等;这里就是利用实测数据对预报数据进行误差修正,既然是预测,那实测数据在未来肯定是无法得到的,所以思路就是通过前期的预测数据和实测数据的差,找到相关的误差修正规律即可;因此在这里推荐的模型是神经网络模型,具体是设置一个三层的网络机构,输入层数据是一次预报的气象条件,而标准输出数据为真实污染物浓度与预测污染物浓度的差值,这样就建立了预测气象条件与实际污染物浓度误差之间的关系;在这里推荐使用基于遗传算法优化的神经网络模型,相对于传统的BP神经网络而言,其精度将会更高。得到上述网络关系后,若新得到一组一次预报气象数据结合相关的误差变量进行二次修正即可。

具体代码和原理可以看:2021年中国研究生数学建模竞赛D题参考思路

另外,对于气象条件的无监督分类问题,有同学问分几类气象条件比较合适,有的分了十几种,有的只有两三种,有些无监督分类方法是需要提前指定聚类数量的,而有些则不需要,所以为何推荐SOM聚类算法,主要是因为它能在不同的训练步数下产生不同的聚类数量,因此满足宏观和微观需要;在气象分类时不要和气象描述相分离,若你聚类十几种,那该怎么去描述每一种气象类别呢?根据我们常识而言,我们习惯分为好、较好、一般、较差、很差,这样描述起来也很显而易见,所以我建议5~7类就可以了,再多了不好描述,在少了感觉不够细致;

对于第四问:区域协同预报主要是为了防止某个点的预测数据存在误差的情况下,可通过其它点的预测数据进行修正(修正的前提是利用其它点得到的相关数据与真实数据存在较大的误差,则此时会进行修正)因此可首先基于真实数据建立A、A1、A2、A3四个站点间与位置、污染物浓度数据有关的拟合模型,然后在将该拟合模型之间的关系带入到一次预报数据中,若一次预报数据与拟合得到的结果差距较大则将其替代(可设置一定的误差界限)若一致则保留,此时在利用问题三构建的模型进行计算,看与真实值的误差是否减小,若减小则表示区域协同预报可以提高准确度,若并未减小则表示效果不好。

同样第四问也可以这样思考:对于最后一问,意思是给定其它监测点数据看能否预报的更详细,最后一问有个需要注意的是坐标问题,这个也是很多同学忽略的,根据地理学第一原理,越相近的目标关系越大,因此有同学提出一种新思路,就是当A点数据异常时,如果其他点位能够通过插值的思想进行补充是不是就可以提高预报精度,这种思路我觉得还是可行的,但一定注意插值方法的选择问题,因为地理学中的插值并非单纯的数学插值思维,常用的地理学插值算法包括:反距离权重插值、克里金插值算法等,这样更加专业。

全部评论 (0)

还没有任何评论哟~