计量经济学(一)关于回归的那些事
1. 什么是回归
'回归'这一概念是由英国维多利亚时期的博学科学家法兰西斯·高尔顿(Francis Galton)首次提出的
瓦尔德·弗朗索瓦·查尔斯·皮 goodall(法国民谣诗人)运用统计方法进行研究后发现,在人类遗传学领域中存在一种有趣的规律:当父母身高较高时,则子女身高的平均值也会较高;反之亦然。然而,在给定父母的具体身高时,并非所有子女都会达到这个特定的高度;相反地,在这种情况下,子女身高的平均值会趋向于全体人类身高的平均水平——即所谓的"回归到均值"现象。
2. 回归分析
回归方法(regression analysis)是用来描述多种因素之间相互依存关系的一种统计工具或技术。
①按照涉及的变量的多少,分为一元回归和多元回归分析;
②按照因变量的多少,可分为简单回归分析和多重回归分析;
③根据自变量与因变量之间的关系类型划分,则可将线性回归分析与非线性回归分析主要分为两类。
在大数据分析中,在数据驱动的环境中建立模型时有一种称为回归分析的技术。这种技术旨在探究因变量(目标指标)与其他多个自变量(预测因子)之间的量化关系。它不仅适用于预测分析,在时间序列建模方面也有重要应用,并有助于揭示不同变量间的因果关联性。例如,在研究司机行为如鲁莽驾驶与其引发的道路交通事故数量之间的联系时就可运用回归方法进行深入探究
3. 回归分析的步骤
确定变量
设定具体的预测目标决定了因变量。例如将预测对象设定为下一年度的销售量Y。通过收集市场数据并进行深入研究,识别与该指标相关的潜在影响因素(即自变量),即可得到自变量,并从中筛选出最主要的解释变量。
建立预测模型
基于自变量与因变量的历史统计数据进行运算,在此基础之上构建回归分析方程,并将其视为构成回归分析预测体系的核心模型
进行相关分析
回归分析是一种对具有因果关系的影响因素即自变量以及预测目标即因变量实施的一种数学统计处理方法。仅在自变量子存在与因变量子之间存在显著关联的情况下 才能建立有意义的回归方程 为此 我们需要解决的问题包括确定影响因素与预测目标之间是否存在关联 其关联程度有多大 以及我们对这种关联性的信心有多大等关键问题 这些都是开展回归分析所必须面对的核心问题 通常的做法是通过计算两两之间的相关系数 来衡量各因素间的相互关联程度
计算预测误差
判断其能否应用于实际预测,则需考察该模型是否经过相关检验以及相应误差指标的表现情况;仅当经过一系列检验,并且其误差值较为微小时,则可将其用作一个有效的预测模型来执行推测工作
确定预测值
通过回归预测模型生成预测结果,并对这些结果进行综合评估以最终确定最终结果。
