Advertisement

【中级计量经济学】Lecture 8 虚拟变量回归

阅读量:

文章目录

  • 第8讲 虚拟变量回归分析

  • 8.1 虚拟解释变量及其应用

    • 虚拟变量定义与分类标准
  • 虚拟解释变量的回归分析

    • 加法模型与乘法模型
    • 线性与非线性影响分析
    • 虚拟解释变量的实际应用与综合分析
  • 8.2 二元选择模型(DCM)

    • 线性概率模型(LPM)
  • Logit 和 Probit 模型

    • 基本框架
    • Logit 模型
    • Probit 模型
    • 估计过程
    • 假设检验过程
    • 联合显著性假设检验
    • 单一参数的显著性检验
    • 分组显著性假设检验
    • 拟合优度指标(LRI=Pseudo-R²)

Lecture 8 虚拟变量回归

8.1 虚拟解释变量

虚拟变量定义

虚拟变量陷阱:实质是完全多重共线性

虚拟解释变量的回归
加法类型
乘法类型
虚拟解释变量综合应用

结构变化分析

交互效应分析

交互项:

C=\alpha+\beta Y+u

\beta=\beta_1+\beta_2Z

\Rightarrow C=\alpha+(\beta_1+\beta_2Z)Y+u=\alpha+\beta_1Y+\beta_2YZ+u

分析变量之间相互影响的方式,在所分析的变量属于分类型变量时, 是通过乘积形式引入虚拟变量的。

分段回归分析

在时间序列分析中常用以区分不同时间段影响差异的方式是引入虚拟变量技术。其两段时期的回归线在1979年的观测点处相交。已知一组转折点自变量和应变量的观测值(X_{1979},Y_{1979})=(X^*,Y^*),我们可构造一个虚拟变数:

D_t= \begin{cases} 0 & t < 1979 \\ 1 & t \geq 1979 \end{cases}

然后将模型设定为:

Y_t = \beta_0 + \beta_1 X_t + \beta_2 (X_t - X^*) D_t + u_t

当参数\beta_2显著非零时,则表明自变量X对因变量Y的影响在1979年前后存在显著差异。

盲点(异常值)分析

有时一组观测点对应于特定的政治或经济事件,并且它们与其余观测存在显著差异。我们可以通过引入虚拟变量来描述这一异常现象。当仅有一个异常点时,在该异常点的观测值上设置虚拟变量的值为1,在其他所有观测上设其为0.

8.2 虚拟被解释变量模型(二项选择模型/离散选择模型DCM)

线性概率模型(LPM)

缺点:

  1. 取值界限问题:无法确保0成立,在这种情况下拟合出来的概率估计可能会突破0和1的范围。
  2. 异方差问题:只有当因变量与所有解释变量之间不存在显著相关性时,模型才可能避免异方差;一旦存在任何解释变量与因变量的相关性,则模型必然会出现异方差问题。
  3. 线性效应假设:模型无法保证每个解释变量对因变量的影响呈现线性关系。
  4. 边际效应保持恒定:对于以原始数值形式引入的任何一个解释变量,在其他条件不变的情况下其对因变量的影响大小是固定的。
Logit和Probit模型
基本结构

E(Y|X)=p=P(Y+1|X)=G(X\beta)

对Logit Model:G(X\beta)=\Phi(X\beta)

对Probit Model:G(X\beta)=\Lambda(X\beta)=\frac{\exp(X\beta)}{1+\exp(X\beta)}

Logit Model

\ln(\frac{p}{1-p})=X\beta作自变量,\ln(\frac{p}{1-p})被称作机会对数比率,也称作logit。

因变量对于自变量的变化敏感度(Marginal Effects):
\frac{\partial p}{\partial X}=\frac{\exp(X\beta)}{(1+\exp(X\beta))^2}\beta

Probit Model

该模型中因变量对各自变量的敏感度分析(Partial Effects Analysis)可表示为\frac{\partial p}{\partial X}=\frac{1}{\sqrt{2\pi}}\exp(-\frac{(X\beta)^2}{2})\beta

模型估计

极大似然估计

对数似然函数为:

\ln L = \sum_{i=1}^{n} \left( Y_i \cdot \ln G(X \beta) + (1 - Y_i) \cdot \ln [1 - G(X β)] ) 右 )

模型检验
联合显著性检验

似然比检验(LR检验):LR=-2(\ln L_R-\ln L_{UR})\sim\chi^2(k)k个约束性条件

其中受限型模型仅包含常数项,在这种情况下,\ln L_R表示其对应的对数似然比函数值。

Unrestricted model被称为目标模型,并且\ln L_{UR}代表了该模型的对数似然比函数值。

Wald检验:W统计量

单参数检验

等价于对回归模型中的自变量进行筛选或剔除,在受约束方程下的检验等价于对回归模型中的自变量进行筛选或剔除。

  • Wald约束检验法:假设条件分别为\text{H}_0:\hat{\beta}_k=0时,则统计量W遵循自由度为1的卡方分布;或者当\text{H}_0:\hat{\beta}_{k+1}=\dots=\hat{\beta}_{k+q}=0时,则统计量W遵循自由度为q的卡方分布。
  • 似然比率检验法:计算得到统计量L\text{R}=-2(\ln L_R-\ln L_{UR})遵循自由度为1(或q)的卡方分布。
分组检验

把全样本分成G组

拟合优度检验(LRI=Pseudo-R^2)

LRI=Pseudo-R^2=1-\frac{\ln L_{UR}}{\ln L_R}\\

当模型被完美拟合时,
即当因变量取值为 Y_i = 1 时,
自变量的线性预测结果 G(Xβ) = 1
而当因变量取值为 Y_i = 0 时,
自变量的线性预测结果 G(Xβ) = 0
推导得出似然比(LRI)的计算式:

⇒ LRI = 1 - \frac{ 0 }{ L_R }

全部评论 (0)

还没有任何评论哟~