时间 地点
实验题目 多重共线性的诊断与修正
一、实验目的与要求:
要求目的:1、对多元线性回归模型的多重共线性的诊断;
2、对多元线性回归模型的多重共线性的修正。
二、实验内容
根据书上第四章引子“农业的发展反而会减少财政收入”,1978-20##年的财政收入,农业增加值,工业增加值,建筑业增加值等数据,运用EV软件,做回归分析,判断是否存在多重共线性,以及修正。
三、实验过程:(实践过程、实践所有参数与指标、理论依据说明等)
(一)模型设定及其估计
经分析,影响财政收入的主要因素,除了农业增加值,工业增加值,建筑业增加值以外,还可能与总人口等因素有关。研究“农业的发展反而会减少财政收入”这个问题。
设定如下形式的计量经济模型:=+++++++
其中,为财政收入CS/亿元;为农业增加值NZ/亿元;为工业增加值GZ/亿元;为建筑业增加值JZZ/亿元;为总人口TPOP/万人;为最终消费CUM/亿元;为受灾面积SZM/千公顷。
图1: 1978~20##年财政收入及其影响因素数据
利用EV软件,生成、、、、、、等数据,采用这些数据对模型进行OLS回归。
(二)诊断多重共线性
1、双击“Eviews”,进入主页。输入数据:点击主菜单中的File/Open /EV Workfile—Excel—多重共线性的数据.xls ;
2、在EV主页界面的窗口,输入“ls y c x2 x3 x4 x5 x6 x7”,按“Enter”.出现OLS回归结果,图2:
图2: OLS 回归结果
由此可见,该模型的可决系数为0.995,修正的可决系数为0.993,模型拟和很好,F统计量为701.47,模型拟和很好,回归方程整体上显著。
但是当=0.05时,==2.069,不仅X4、X5、X6、X7的系数t检验不显著,而且X2、X4、X6系数的符号与预期相反,这表明很可能存在严重的多重共线性。(即除了农业增加值、工业增加值外,其他因素对财政收入的影响都不显著,且农业增加值、建筑业增加值、最终消费的回归系数还是负数,这说明很可能存在严重的多重共线性。)
3、计算各解释变量的相关系数:
在Workfile窗口,选择X2、X3、X4、X5、X6、X7数据,点击“Quick”—Group Statistics—Correlations—OK,出现相关系数矩阵,如图3:
图3: 相关系数矩阵
由相关系数矩阵可以看出,各解释变量相互之间的相关系数较高,特别是农业增加值、工业增加值、建筑业增加值、最终消费之间,相关系数都在0.8以上。
这表明模型存在着多重共线性。
(三)修正多重共线性
1、采用逐步回归法,去检验和解决多重共线性问题。分别作Y对X2、X3、X4、X5、X6、X7的一元回归,结果如下图4:在EV主页界面的窗口,输入“ls y c x2”,“回车键”。
依次如上推出X3、X4、X5、X6、X7的一元回归。综上所述,结果如下图4:
图4.一元回归估计结果
2、其中,加入的最大,以为基础,顺次加入其他变量逐步回归。结果如下图5:
依照上面,在顺次加入X4、X5、X6、X7,进行逐步回归。综合结果如下图5:
图5.加入新变量的回归结果(一)
经比较,新加入的方程= 0.993152 ,改进最大, 但是得系数为负,这显然不符题意。
在的基础上分别加入其他变量后发现,,,,,的系数都为负,与预期估计违背。因此这些变量都会引起严重的多重共线性,全部剔除,只保留。修正的回归结果为:
= -1075.289 + 0.426817
(-1.884708) (28.90168)
= 0.967567 =0.966408 F=835.3074
这说明在其他因素不变的情况下,工业增加值每增加1亿元,财政收入平均增加0.426817亿元。
四、实践结果报告:
为研究“农业的发展反而会减少财政收入”的问题,根据1978-20##年的财政收入,农业增加值,工业增加值,建筑业增加值等数据,运用EV软件,做回归分析,判断是否存在多重共线性,以及修正。
最后修正的回归结果为:
= -1075.289 + 0.426817
(-1.884708) (28.90168)
= 0.967567 =0.966408 F=835.3074
这说明在其他因素不变的情况下,工业增加值每增加1亿元,财政收入平均增加0.426817亿元。
可决系数为0.967567,较高,说明模型拟合优度高;F值为835.3074,说明整个方程显著;斜率系数的t值28.90168,大于t统计量,t检验显著,符合题意。
逐步回归后的结果虽然实现了减轻多重共线性的目的,但反映农业增加值,建筑业增加值的X2,X3等也一并从模型中剔除出去了,可能会带来设定偏误,这是在使用逐步回归时需要注意的问题。
附加:
1、 分别作Y对X2、X3、X4、X5、X6、X7的一元回归,结果如下:
ls y c x2
ls y c x3
ls y c x4
ls y c x5
ls y c x6
ls y c x7
2、 以为基础,顺次加入其他变量逐步回归。
X3、X2:
X3、X4:
X3、X5:
X3、X6:
X3、X7:
教师评阅意见: