统计学上机实验报告(一)
1 研究目的和意义
本次实验,我是基于我本科学年论文的研究课题数据进行的。改革开放以来,我国职工平均工资的地区差异总体上不断扩大,这可能导致社会不稳定并阻碍国民经济发展以及构建和谐社会目标的实现。因此,探究造成地区平均工资水平差异的主要因素并给予政策性建议有着重要的实际研究意义。我在参考了国内外众多学者有关工资收入差异研究的著作的基础上,综合选取了多个与平均工资收入水平变动较为密切的且较有代表性的指标变量,并利用SPSS统计软件建立了多元线性回归模型,探究造成地区平均工资水平的主要因素。
2 数据来源和指标含义
2.1 数据来源
本次实验我所使用的数据(即我在本科学年论文中的数据)来源于中国经济统计数据库、国泰安研究服务中心、中国进出口统计数据库20##年的数据、以及20##年中国统计年鉴。本文选用的是全国31个省市(不包括港澳台地区)各指标20##年的数据,其中第二、三产业的产值及生产总值数据、非国有单位职工人数数据摘录于中国统计年鉴,进出口额数据摘录于中国进出口统计数据库,人均GDP数据、GDP数据、CPI指数、城镇居民家庭平均每人可支配收入数据、城镇家庭平均每人全年消费性支出数据、在岗职工人数数据、在岗职工平均工资数据、普通本专科在校生人数数据、地方政府财政支出数据、城镇登记失业率数据均来自中国经济统计数据库20##年数据。(详细原始数据见附录1)
2.2 指标选取及其含义
为了消除模型的内生性,我采用引入尽量多的控制变量的方法,使作为被解释变量的职工平均工资尽可能不与残差项相关。
为了实现这一点,我在其他学者研究的基础上选取了影响我国各地区职工工资差异的政策因素变量和经济因素变量:人均GDP(代表经济规模变量)、产业结构变量(以第二、三产业产值之和占地区生产总值GDP的比重来表示)、非国有化变量(以非国有单位职工人数在全部在岗职工人数中的比率表示)、外向型经济变量(以地区贸易出口额与进口额的比率来表示)、财政支出变量(以地区财政支出占地区生产总值的比重来表示)、社会劳动生产率(用地区生产总值与在岗职工人数的比率来表示)、人力资本变量(以各地区的普通本专科在校生人数占在岗职工总人数的比重即每万人所拥有大学生人数来表示)、CPI 、城镇居民人均可支配收入、城镇居民人均消费性支出(、、均用来衡量物质生活水平),总共10个指标变量。
3 回归模型建立
为了考察地区职工平均工资与其主要影响因素的数量变动关系,本文以职工平均工资作为因变量,以人均GDP ()、产业结构变量()、非国有化变量()、外向型经济变量()、财政支出变量()、社会劳动生产率()、人力资本变量()、CPI()、城镇居民人均可支配收入()、城镇居民人均消费性支出()等10个指标为自变量,建立多元线性回归模型。
4 SPSS运行结果分析
为了消除各自变量纲量不同的差异,实验采用的数据经过SPSS中Analyze/Descriptive statistics/Descriptives并选定Save standardized values as variables实现了标准化。
4.1 强行进入法(Enter)
在多元线性回归分析中,有不同筛选自变量的方法:Enter(强行进入法)、Stepwise(逐步法)、Remove(强制剔除法)、Backward(向后法)、Forward(向前法)五种。这本次实验中我首先选择了强行进入法(Enter)。
SPSS运行结果如下:
上表是模型综述表,可以看出相关系数为0.987,说明自变量与因变量之间有很强的相关性。决定系数R2为0.974,表示所有自变量一起可以解释因变量97.4%的变异性,这一结果十分理想。另外,校正的决定系数为0.962。
上表为方差分析表,由Sig.为0.000,即显著性概率小于5%,所以拒绝原假设,认为回归方程中各系数均不为零,回归方程有意义。
根据运行结果图中的系数分析表,我整理出下面的表1:
表1 回归分析结果(一)
模型的共线性统计量方差膨胀系数VIF显示,变量、、、、的方差膨胀系数都大于5,说明这些变量分别都与其他变量间存在较显著的共线性。于是采用逐步回归法,逐个引入变量来重新构造回归模型。
4.2 逐步回归法(Stepwise)
逐步回归结果显示,最终进入的自变量只有3个:人均GDP、财政支出变量、城镇居民人均可支配收入。建立的回归模型为:
表2 回归分析结果(二)
该模型中只有、、,这三个变量的参数估计P值都小于0.05,即都通过t检验,且符号的经济意义也合理,说明该回归模型成立。虽然方差膨胀系数都显示存在轻微的多重共线性,但由于该方程估计的参数标准差都较小,T统计值都较大,以至其参数估计量的方差也较小。因此,该模型的多重共线问题已经影响不严重。
根据下面的残差正态检验结果可以看出,此模型的残差正态性良好,大致服从正态分布。
标准化误差直方图
4.3 模型结果分析
回归模型表明,影响职工平均工资Y的主要因素是人均GDP、财政支出变量、城镇居民人均可支配收入三个自变量,同时自变量、、对因变量Y的促进作用程度分别为:财政支出变量>人均GDP>城镇居民人均可支配收入。另外,当人均GDP变化1%,职工平均工资Y将相应变化0.554%;当财政支出变量变化1%,职工平均工资Y将相应变化0.662%;当城镇居民人均可支配收入变化1%,职工平均工资Y将相应变化0.391%。因此,对于调整我国各地区的职工平均工资水平,政府可以从人均GDP、地区财政支出、城镇居民人均可支配收入这三方面入手,有所着重施予政策影响。
参考文献
1 中国统计年鉴(20##年). 中国统计局
2 张建红.中国地区工资水平差异的影响因素分析.经济研究,20##年第10期
3 何晓群. 多元统计分析(第二版). 中国人民大学出版社
4 汪建新,黄鹏. 结构调整、劳动力流动与地区工资差异. 国际商务研究,20##年第3期
5 钟笑寒.劳动力流动与工资差异[J].中国社会科学,2006,(1):34~46.
6 祝树金,邓丽东. 经济全球化、劳动力转移与我国沿海-内陆地区工资差距的实证分析. 财经理论与实践,20##年3月
7 刘修岩,殷醒民. 空间外部性与地区工资差异:基于动态面板数据的实证研究. 经济学(季刊),20##年10月
8 孙楚仁,文娟,朱钟棣. 外商直接投资与我国地区工资差异的实证研究. 世界经济研究,20##年第2期
9 狄煌. 职工平均工资水平相关影响分析. 研究探索, 20##年第8期
10 郑长德. 中国职工工资的地区差异—基于新经济地理学视角的实证研究. 甘肃社会科学, 20##年第1期
11 李子奈,潘文卿. 计量经济学(第二版). 高等教育出版社
12 胡放之. 工资水平及其影响因素分析. 武汉科技学院学报,第18卷第7期
13 韩兆洲,魏章进. 基于灰色系统模型的最低工资研究. 数学的实践与认识,第35卷第9期
14 万红燕, 李仕兵. 基于主成分回归分析的我国城镇居民收入差异的实证研究. 预测,20##年第1期
15 国家统计局综合司. 20##年全国城镇单位在岗职工平均工资为29229元[DB/OL]
16 国家统计局网,20##-04-09[20##-09-15] http://www.stats.gov.cn/was40/gjtjj_detail.jsp?channelid=75004&record=4
17 Krugman, P., 1991,“Increasing Returns and Economic Geography”, Journal of Political Economy 99 : 183 —199
18 Xu, L. and Zou, H. , 20## ,“Explaining the Changes of Income Distribution in China”, China Economic Review 11 (2) : 149 —170
附录
原始数据
第二篇:统计学上机实验报告1
《统计学原理》实验一
一、实验名称:数据的图表处理
二、实验日期:20##年12月13日
三、实验地点:软件工程学院实验室
四、实验目的和要求
目的:培养学生处理数据的基本能力。通过本实验,熟练掌握利用Excel,完成对数据进行输入、定义、数据的分类与整理。
要求:就本专业相关问题收集一定数量的数据(³30),利用EXCEL进行如下操作:
1. 进行数据排序
2. 进行数据分组
3. 制作频数分布图、直方图和帕累托图,并进行简要解释
4. 制作饼图和雷达图,并进行简要解释
五、实验仪器、设备和材料:个人电脑(人/台),EXCEL 软件
六、实验过程
(一)问题与数据
下面是一种金属零件重量的误差数据
单位:g
表1-1
(二)实验步骤
1、将上表数据复制到EXCEL中;
2、将上述数据调整成一列的形式;
3、选择“数据-排序“得到由小到大的一列数据。
4、选择“插入-函数(fx)-数学与三角函数-LOG10”
图1-1
计算lg50/lg2=5.64,从而确定组数为K=1+ lg100/lg2=6.64 这里为了方便取为10组;确定组距为:(max-min)/K=(87.8-19.1)/10=6.87 取为7;
5、确定接受界限为 24.0 31.0 38.0 45.0 52.0 59.0 66.0 73.0 80.0 87.0 分别键入EXCEL 表格中,形成一列接受区域 ;
6、选“工具——数据分析——直方图”得到如下频数分布和直方图
金属零件重量误差的频数分布
表1-2
金属零件重量误差的直方图
图1-2
7、将其他这行删除,将表格调整为:
表1-3
8、选择“插入——图表——柱图——子图标类型1”,在数据区域选入接收与频率两列,在图表标题中输入频率。做出的图形如下图所示:
图1-3
9、双击上述直方图的任一根柱子,将分类间距改为0,得到新的图.
图1-4
10、选择“插入——图表——饼图”,得到金属零件重量的误差饼图:
图1-5
11、选择“插入——图表——雷达图”,得到金属零件重量的误差雷达图
图1-6
(三)实验结果分析:从以上直方图可以发现,金属零件的重量误差大致呈对称分布,其中54.0—60.0出现的频次最多,从饼图和雷达图也能够比较清晰地看出这样的结果。