2023mothercup妈妈杯数学建模挑战赛思路
目前正致力于数学建模领域的发展自2019年起本人已经参与了数十场数学建模比赛积累了一定的经验
本年度Mathorcup数学建模竞赛A类题目
(比赛开始后第一时间更新)
本年度Mathorcup数学建模竞赛B类题目
(比赛开始后第一时间更新)
本年度Mathorcup数学建模竞赛C类问题
(比赛开始后第一时间更新)
本年度Mathorcup数学建模竞赛D类问题
(比赛开始后第一时间更新)
针对本次美赛加赛Y题的免费思路展开分析:针对Y题的核心问题展开分析,并探讨影响帆船价格的主要因素
先来看第一问。首先我们需要明确,在数据分析领域的问题中通常涉及分类、回归、聚类以及异常检测等几种主要类型。在这个问题中显然属于回归分析范畴。接下来我们需要确定回归模型的输入变量即自变量与输出结果即因变量之间的关系模式。
让我们仔细查看一下这份文件。注意到这份文件分为两个子表分别代表了两类不同的帆船也就是说最少需要构建两个不同的预测模型这是因为你可以根据不同的地理区域各自建立一个独立的预测模型值得注意的是所有这些预测模型的基本原理是相同的例如品牌型号等属性就属于输入变量而输出则是预测的价格如果你觉得现有的数据不够丰富题干中也提到了可以自行补充其他相关属性
让我们来探讨一下建模的具体步骤。我们可以明确地将这个问题定性为一个回归问题,在构建回归模型的过程中主要包括三个关键步骤:特征编码、特征降维以及回归分析。这些步骤通常是相互关联且不可分割的。其中归一化处理与数据清洗都是属于预处理阶段的重要组成部分。也许有些同学会好奇为什么没有单独提及数据清洗环节?这是因为我们在特征编码阶段已经涵盖了必要的预处理内容。
具体来说,在编码方法上也很简单,在处理品牌型号这类离散型属性时我们可以采用one-hot编码的方式,在归一化处理长度与年份等连续型数据时只需要进行简单的标准化转换即可。例如地区这一类的属性既可以作为离散属性进行one-hot编码处理也可以将其转换为经纬度坐标等价于将其视为连续型数据进行后续分析的方式为了确保后续问题(第三问)能够顺利解答我们需要尽可能多地提取并利用每个属性的有效信息
下一步就是降维,这里没啥好说的,直接主成分分析。
回归分析最终的目标是什么?它旨在通过建立数学关系来预测或解释变量之间的相互作用。主流的回归分析方法主要涉及线性回归和基于树的模型,在实际应用中各有优劣。其中线性回归方法更为推荐,在于其相对简单明了的同时也能提供较为直观的结果解读能力。然而由于树状结构使得其内部机制难以解析化,在具体应用中往往难以直接解释各特征对目标变量的影响程度。问题一要求我们建立一个能够解释 listings'价格决定因素的预测模型
下面探讨第二问题目。该问题包含两个方面:其一是考察地区因素是否会对价格产生影响这一问题本身可以直接利用第一部分获得的结果来进行解答。具体来说我们可以通过分析地区这一特征的重要性程度来判断其对价格的影响范围及具体影响方式
接下来探讨不同型号帆船地区作用的差异性问题。具体而言,在针对各型号帆船分别构建回归模型的基础上,考察这些模型中地区变量的重要性及其权重分布情况。
然而,在目前的情况中(在数量过于庞大这一问题面前),我们无法为所有类型的帆船建立模型(无需对所有类型的帆船进行建模),在这种情况下(在这种背景下),重点在于建立针对常见类型帆船的模型(只要对样本多的几种帆船建模就行)。
再来说说第三个问题。第三个问题首先需要收集数据, 因为题目中没有提供香港地区的价格数据, 我们需要自行获取这些信息. 收集到相关价格后, 可以应用第一部分中建立的回归模型, 将地区特征代入香港地区进行分析, 检验回归模型预测的价格与实际价格的一致性如何?
第三问后半段的问题在于探究香港地区性效应在双体船与单体船价格中的表现一致性问题;从本质上讲,在探究地区性效应在双体船与单体船价格中的表现一致性问题;我们可以通过考察针对双体船与单体船回归模型中地区的特征权重差异来判断其一致性程度
四五两问是开放性问题,我们针对一些特征的权重做些说明就可以了。
附要找的特征:
船宽:指一艘船在其最宽处的宽度。
排水量:一艘船所排开水体所具有的重量。
吃水深度:指一艘船浮在水面上而不触底所需的最小水深。
发动机小时数:新船以来其发动机运行了多少小时。
净空高度:乘客在机舱内站立的空间高度。
船体:指船舶或其他船只主体部分的主要结构(包括底部、侧面及甲板部分)。
二、地区特征:
经纬度、GDP、人口量、人均收入等
三、香港不同型号帆船的价格
