三大产业对人均生产总值的影响的实证分析
一、 问题的提出
建国以来,经济快速增长,1952年为166元,195
年就翻了一番,尤其是改革开放以后,经济更是有了突飞猛进的发展,20xx年人均生产水平是改革开放前的30倍。然而即使的经济快速增长,跟全国大部地区相比,还相对落后,增加人均生产总值,提高人民生活水平,变得越来越刻不容缓,三大产业是构成生产总值的全部,因此研究三大产业对人均生产总值的影响有着重要的意义,然而它们是如何影响生产总值的呢?本文用eviews6.0对收集数据进行分析。如果研究它们对生产总值的影响机制,那么就可根据结果对的三大产业的改革提出意见。这便是本项研究的主要目的。
二、 模型的设定
研究三大产业与人均生产总值的关系,需要考虑以下几个方方面:
(1) 数据性质的选择
由于研究的是一个地区的人均生产总值,人均生产总值的差异是根据每个年度三大产业的量不同而不同,因此需采用时间序列数据。
(2) 模型形式的设计
由于本文是研究三大产业对人均生产总值的影响,那么可以将第一产业、第二产业、第三产业设为解释变量,将人均生产总值设为被解释变量。本文假设三大产业对人均生产总值的影响为多元一次线性模型,为
Y=a1*X1+a2*X2+a3*X3+u
其中,Y是人均生产总值(单位:元),X1、X2、X3分别是第一产业、第二产业、第三产业量(单位:亿元),而a1、a2、a3分别是伴随于第一产业、第二产业、第三产业的参数,u是随机误差项。
三、 数据的收集
1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 19 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 20xx 20xx 20xx 20xx 20xx 20xx 20xx 20xx 20xx 20xx
23.08 26.14 24.38 24.67 25.05 28.12 31.78 35.67 39.07 45.63 53.24 59.41 65.24 78.55 .75 112.24 129.04 148.51 192.72 217.42 274 335.92 402.31 505.63 673.68 825.11 912.15 1050.14 1116.67 1168.55 13.36 1485.49 1598.28 1877.61 2200.15 2604.14 3045.26 3523.16 4183.21 4277.05
10.35 11.42 10.79 10.73 10.25 11.21 12.35 13.1 13.97 16.32 21.52 25.18 28.11 32.84 36.67 42. 46 56.18 72.27 78.01 94.61 111.86 114.5 126.85 187.69 240.71 249.31 279.73 291.05 268.51 288.18 288.12 305 412.9 444.7 510 527.8 628.72 691.07 759.74
8.67 9.96 8.96 9.27 10.15 12.2 14.01 16.52 18.35 21.43 21.44 22.39 23.35 29.1 31.66 40.5 45.63 50.3 66.02 73.83 83.5 107.99 147.65 217.49 265.38 302.56 336. 413.29 430.73 460.71 586.83 630.37 668.04 796.84 1010.07 11.8 1459.3 17.55 2070.76 1929.59
4.06 4.76 4.63 4.67 4.65 4.71 5.42 6.05 6.75 7.88 10.28 11.84 13.78 16.61 21.42 28.85 37.41 42.03 54.43 65.58 95. 116.07 140.16 161.29 220.61 281.84 325.95 357.12 394. 439.33 4.35 567 625.24 667.87 745.38 929.34 1058.16 1246. 1421.38 1587.72
236 258 232 226 222 240 266 293 313 359 410 450 488 583 661 820 924 1053 1347 1493 1799 2101 2477 3019 3953 47 5167 5904 6229 70 7377 7913 8382 9700 11199 13108 15000 16999 19797 19942
资料来源:《统计年鉴20xx》
四、模型的估计与调整
(一)对被解释变量(Y)与解释变量(X1、X2、X3)进行回归分析,其结果如下:
Dependent Variable: Y Method: Least Squares Date: 07/05/11 Time: 02:25 Sample: 1952 20xx Included observations: 58
Variable C X1 X2 X3
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
Coefficient 117.7871 12.01597 3.402479 3.029794
Std. Error 29.49611 0.765193 0.432374 0.782690
t-Statistic 3.993309 15.70320 7.869294 3.871001
Prob. 0.0002 0.0000 0.0000 0.0003 3223.397 5118.078 13.02731 13.16941 13.08266 0.952196
0.999099 Mean dependent var 0.999049 S.D. dependent var 157.8239 Akaike info criterion 1345052. Schwarz criterion -373.7919 Hannan-Quinn criter. 19963.23 Durbin-Watson stat 0.000000
(二)自相关的检验与处理
分析如下:有分析结果可知DW值为0.952196 ,而查表可知,DL=1.533大于1,所以可知该DW小于DL,可判定回归模型存在正自相关。
因此我们用C-O迭代法处理自相关问题,最终根据个回归结果确定应该采用何种自相关模型。首先,对其进行一阶自相关处理: 用eviews6.0软件对数据进行处理,命令方式执行Ls y c x1 x2 x3 ar(1),其结果如下:
Dependent Variable: Y Method: Least Squares Date: 07/05/11 Time: 09:53 Sample (adjusted): 1953 20xx
Included observations: 57 after adjustments Convergence achieved after 28 iterations
Variable C X1 X2 X3 AR(1)
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic) Inverted AR Roots
Coefficient -750.3109 5.542412 4.6186 3.122199 1.021111
Std. Error 1362.124 0.467497 0.126932 0.401055 0.026591
t-Statistic -0.550839 11.85551 36.942 7.784970 38.40032
Prob. 0.5841 0.0000 0.0000 0.0000 0.0000 3277.035 5147.100 11.06279 11.24200 11.13244 0.934621
0.999880 Mean dependent var 0.999870 S.D. dependent var 58.59442 Akaike info criterion 178531.9 Schwarz criterion -310.24 Hannan-Quinn criter. 108016.1 Durbin-Watson stat 0.000000 1.02
Estimated AR process is nonstationary
根据DW值可知,DW=0.934621,查表可知此时临界值DL约为1.533,说明该模型依旧存在正自相关。因此继续对该数据进行二阶自相关处理: 结果如下:
Dependent Variable: Y Method: Least Squares Date: 07/05/11 Time: 10:00 Sample (adjusted): 1954 20xx
Included observations: 56 after adjustments Convergence achieved after 26 iterations
Variable C
Coefficient 12078.55
Std. Error 762779.0
t-Statistic 0.015835
Prob. 0.9874
X1 X2 X3 AR(1) AR(2)
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic) Inverted AR Roots
5.422625 4.680446 5.143760 2.080953 -1.080442
0.219152 0.067634 0.283044 0.069965 0.087380
24.74369 69.20xx4 18.17299 29.74270 -12.382
0.0000 0.0000 0.0000 0.0000 0.0000 3332.357 5176.553 10.33718 10.55418 10.42131 1.9616
0.999945 Mean dependent var 0.999939 S.D. dependent var 40.41381 Akaike info criterion 81663.81 Schwarz criterion -283.4410 Hannan-Quinn criter. 180463.9 Durbin-Watson stat 0.000000 1.09
.99
Estimated AR process is nonstationary
有结果可分析,DW=1.9616大于DL的临界值,不存在自相关,T检验值很显著,而且拟合程度很好,因此可选用二阶自相关模型。
(三)多重共线性检验 1、相关系数检验法
用命令方式执行cor x1 x2 x3可知结果:
X1 X2 X3
X1 1
0.97746035587
37368 14855
1 39678
0.988404954300.99453787680
1
X2 37368
X3 14855 0.99453787680
39678
0.977460355870.98840495430
有相关系数矩阵可以看出,各解释变量相互之间的相关系数较高证实确实存在 严重的多重共线性,但是由于x1、x2、x3均是影响人均生产总值不可缺少的因素,因此为了避免剔除变量
data a;
set sasuser.aa; proc reg corr;
model y=x1 x2 x3/vif collin collinoint;
run;
proc reg data=a outest=result graphics outvif;
model y=x1 x2 x3/ridge=0.0 to 0.1 by 0.01 0.2 0.3 0.4 0.5; plot/ridgeplot; run;
proc print data=result; run;
(四)异方差检验
我们采用white检验,结果如下:
Heteroskedasticity Test: White
F-statistic Obs*R-squared Scaled explained SS
Test Equation:
Dependent Variable: RESID^2 Method: Least Squares Date: 07/05/11 Time: 11:14 Sample: 1952 20xx Included observations: 58
Variable C X1 X1^2 X1*X2 X1*X3 X2 X2^2 X2*X3 X3 X3^2
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Coefficient -1482.615 -475.0772 8.355637 -2.656024 -9.077744 1493.516 3.007249 -8.517790 -1168.419 9.799488
Std. Error 4668.175 311.9366 3.2199 2.569825 5.20xx88 314.7669 0.797368 2.308811 439.6650 1.959912
124.6217 Prob. F(9,48)
0.0000 0.0000 0.0000 Prob. 0.7522 0.1343 0.0124 0.3065 0.0874 0.0000 0.0004 0.0006 0.0107 0.0000 23190.55 72565.58 22.35659 22.71184 22.49497
55.61969 Prob. Chi-Square(9) 231.9616 Prob. Chi-Square(9)
t-Statistic -0.317601 -1.522993 2.597742 -1.033543 -1.744852 4.744832 3.771471 -3.6253 -2.657520 4.999962
0.9560 Mean dependent var 0.951265 S.D. dependent var 16019.55 Akaike info criterion 1.23E+10 Schwarz criterion -638.3412 Hannan-Quinn criter.
F-statistic Prob(F-statistic)
124.6217 Durbin-Watson stat 0.000000
2.1166
因为nr^2的伴随概率小于0.05应拒绝原假设即存在异方差。