Advertisement

2024mathorcup数学建模D题思路模型代码

阅读量:

目录

自2024mathorcup数学建模D题思路模型代码开赛以来即刻发布相关内容,请关注文末二维码或更多信息

如下为2023MathorCup 高校数学建模挑战赛D题思路解析:

2024mathorcupD题思路模型获取见此


2024mathorcup数学建模D题核心思路框架:发布后立即优化并更新至最新版本,请关注文末名片参考

如下为2023MathorCup 高校数学建模挑战赛D题思路解析:

D题:航空安全风险分析与飞行技术评估问题

在飞行品质监控的具体研究与实践领域中

在飞机着陆安全性评估中

基于以上背景,请你们团队解决以下问题:
问题 1:有些 QAR 数据存在错误,需要对数据进行预处理,去伪存真, 以减少错误数据对研究分析带来的影响。请你们的队伍对附件 1 的数据质量开展可靠性研究,提取与飞行安全相关的部分关键数据项,并对其重要程度进行分析。
问题一分析:问题一可以分为两小问,首先需要进行数据预处理,其中特别的要针对错误数据进行分析,剔除,这个过程也就是提到的可靠性研究。
常见的剔除数据的方法就是使用箱型图剔除异常值,如下是一个简单的箱形图:

将一组数据按降序排序后依次求得:
上四分位数为75%分位点的数值;
中位数为50%分位点的数值;
下四分位数为25%分位点的数值;
上边缘或须的位置由Q3加上1.5倍的Q3与Q1之差确定;
下边缘或须的位置由Q1减去1.5倍的Q3与Q1之差确定;
这些数据的有效范围是:

与采用3σ准则剔除异常值的方法不同的是,在不满足正态分布的情况下使用箱形图可以更加真实地反映数据分布特征;基于四分位数及其四分位距来识别异常值时箱线图表现更为稳健,在高达25%的数据极度偏离的情况下也不会显著影响到四分位数值的位置从而使得识别出的异常值结果更加客观可靠;通过此方法剔除了附件1中的异常数据样本随后题目要求对数据质量进行可靠性研究这里就需要分析哪些指标的数据存在较多的异常值进而考察这些指标之间的分散程度即可实现对问题的关注点定位;对于离散型数据尤其是二值型等非连续变量如果想要检测其是否存在潜在的极端情况则需要将其他指标作为预测变量当前目标变量即飞行安全性能指标来进行建模预测查看预测结果与实际观测之间的偏差以此来辅助判断这种做法并不科学也不建议采用;针对第一个问题中的第二小问即如何提取并筛选出与飞行安全相关的关键数据要素并评估其重要性这一环节可以运用相关性分析来量化各个因素的重要性为了便于直观展示可以选择构建相关性热力图这种图形化的呈现方式例如以下所示根据目标指标的相关系数排序即可确定各因素的重要性排序并据此建立相应的模型框架;同样的这一过程还可以通过应用灰色综合评价法模糊综合评价法等其他多元评价模型来进行更为全面的数据特征提取及系统分析;

建议,在回答第一个问题之前进行基本的探索性数据分析(EDA),并结合数据可视化技术进行分析。

数据规模(容量)、属性维度以及数据类型构成了数据分析的基础要素。
数据分析的基本特征包括标准差、分位数以及最大最小值等指标。
在重复行为的处理上存在两种主要策略:一种是保留以分析用户的偏好趋势与行为规律...另一种则是删除以避免干扰。
针对异常检测的任务而言,在进行异常检测时...通常的做法是根据具体情况决定是否保留或删除这些点。
在缺失值的处理方法中包含两种基本方式:直接删除缺失项或采用插补技术进行填充。
对于单变量分析常用直方图和箱线图来展示数据的分布特征。
两个变量之间的关系可以通过绘制线图、散点图或热力图来进行深入分析...例如:

问题 2:飞机在全生命周期内经历了起飞至着陆的关键阶段,在这一过程中采用了多种飞行操作手段来确保安全性。现有技术中采用超限监测机制来观察飞行员的操作行为,在实际应用中发现这种方法虽然能够快速识别飞机的状态偏差(即确定是否发生了异常),但只能告知安全管理人员发生了什么情况(即具体出现了哪些问题)。因此需要深入探讨造成这种偏差的具体原因。根据附件 1 的要求,请你们对飞行员的操作行为进行合理量化描述。图中展示了三次着陆过程中的操纵杆位置变化曲线图,在这些曲线中红色线条表示一次过轻着陆(着陆 G 值超过给定限制值)的情况。此次过轻着陆的主要原因是机组人员在低空有一次不当松开操纵杆的操作行为所导致,在红线上可以看到前5秒出现明显的下凹趋势(即飞行员在此期间过度放松了操纵杆),这就是需要进行量化描述的关键操作行为模式

问题二(小部分)分析:量化描述可以通过变化率、阈值等表征,在判断时同样依据这些指标来进行区分,在这里建议将置信度作为置信区间进行设定。若有机会可用时间,则可采用时间序列分析(例如ARIMA)。此外,在实际应用中还可以通过划分训练集与测试集来直接计算精确率等指标。进一步地,在评估过程中还可以绘制ROC曲线进行可视化分析。

1.精确率(precision)在定义上存在多种表述方式:有的将其称为"精确度"或"正确性";甚至还有人误用"准确性"这一术语;对此我们暂且将其统称为precision指标;建议查阅英文文献以获得标准定义

precision是指在所有被预测为正样本中真实正确识别的数量占比;从图1-1可见其计算公式可表述为:P = TP / (TP + FP)
召回率(recall)则衡量了真实存在的所有正样本中有多少被成功识别出来;根据图1-1可知其计算公式形式如:P = TP / (TP + FN)
准确率(accuracy)反映了模型在整体测试集上的分类正确性;根据图1-1可得其计算公式即:A = (TP + TN) / (TP + FN + FP + TN)
总结而言,在precision和recall中分子均为TP即指真实存在并被正确识别出来的所有正样本数量;可以看出它们分别代表了对真阳性的识别效率;而accuracy则侧重于整个分类系统的总体准确性

以上仅限于前两问中涉及的部分解题思路(后续将进行优化和完善);其余内容包括其他问题的解题思路、所需数据集以及相关的配套代码实现等细节,请关注文章末尾提供的联系方式获取完整信息

问题 3:由于不同原因导致的超限情况各有特点。例如某些机场往往会在特定情况下出现相应的限制;而某些天气状况可能导致相应的限制问题;同样地,在某些情况下飞行员的表现也会成为影响因素。请参考附件2的数据进行深入分析,并重点关注各类极限情况的基本特征及其发生条件等。
问题 4:飞机数据分析通常可分为两大类:其中一类数据来源于航线安全检查结果中的飞行员表现分析;另一类则是基于学者们的建议开展的技术评估工作。

number 3, please develop a mathematical model, conduct a study on how to assess pilots' technical proficiency using flight parameters, and analyze the pilots' skills based on the data table where 'different qualifications' signify varying levels of technical expertise.

问题 5:随着技术的进步,未来在民航客机上安装实时传输的 QAR 数

随着记录系统的发展已经具备了可行性

2024mathorcupD题思路模型获取见此

全部评论 (0)

还没有任何评论哟~